AI Agent开发与应用基于大模型的智能体构建 [转换版] (凌峰) (Z-Library)

(This page has no text content)

版权信息 COPYRIGHT 书名：AI Agent开发与应⽤：基于⼤模型的智能体构建 作者：凌峰 出版社：清华⼤学出版社 出版时间：2025年3⽉ ISBN：9787302685975 字数：143千字

内容简介 本书详尽地阐述智能体的基础理论、开发⼯具以及不同层次的开发⽅ 法，通过融合⾃然语⾔理解、多轮对话和任务⾃动化技术，为读者提 供从理论到实践的全⽅位指导，旨在帮助读者构建⾼效的智能体。本 书分为3个部分，共12章。第1部分（第1～5章）深⼊解析智能体的⼯ 作原理及开发所需的⼯具链，包括智能体的定义、类型及其与⼤语⾔ 模型（LLM）的关系，探讨智能体框架结构和核⼼模块的设计，并介 绍LangChain和LlamaIndex等技术如何助⼒任务⾃动化和数据管理， 使读者能够亲身体验智能体的基础开发过程。第2部分（第6、7章） 聚焦于智能体的浅度开发，通过订票系统和智能翻译智能体等实例， 展示如何将理论知识应⽤于实际项⽬。第3部分（第8～12章）深⼊探 索智能体的⾼级开发技巧。其中，第8～10章通过邮件处理、⾯试助 ⼿、个性化推送等案例，展现智能体在实际应⽤中的强⼤功能；第 11、12章则基于这些应⽤进⾏拓展，结合多种部署⽅案，进⼀步拓宽 读者的视野，使其能够全⾯掌握智能体的多样化应⽤场景。 本书不仅适合智能体开发⼈员、⼈⼯智能从业者和AI技术爱好者阅 读，还可作为培训机构和⾼校相关课程的教材或参考书。

作者简介 凌峰/博⼠ ⽬前就职于某985⾼校，⻓期从事机器学习、⼈⼯智能、计算机视觉 与⼤模型领域的硏发与教学，在模型优化、训练加速、数据驱动算法 开发等⽅⾯有深刻⻅解，参与并主导多项相关科硏项⽬。

前⾔ 随着⼈⼯智能技术的迅猛发展，⼤语⾔模型 （Large Language Models，LLM）正在成为智能体构建的核⼼驱动 ⼒，推动各⾏业实现⾃动化与智能化变⾰。这些基于LLM的智能体不 仅具备出⾊的⾃然语⾔处理能⼒，还能通过多轮对话、知识推理和任 务⾃动化来⾼效应对复杂任务。在⾦融、医疗、教育和客户服务等领 域，智能体展现出了强⼤的适应能⼒，正在重塑传统的业务流程与⼈ 机交互⽅式。 本书旨在全⾯解析⼤语⾔模型驱动的智能体系统，帮助开发者和企业 掌握智能体的技术原理和实践应⽤。 本书内容 本书分为3部分，共12章，从理论基础到实践案例，系统地讲解智能 体的开发流程与技术实现。 第1部分（第1～5章）讲解了智能体的基本⼯作原理及其开发所需的⼯ 具链，涵盖智能体的定义、类型及其与⼤语⾔模型的关系，分析了智 能体对未来技术⽣态的影响。 第1章对智能体的定义、构成和类型进⾏了深⼊分析，探讨了LLM如何 与智能体⽆缝结合，从⽽赋予其语⾔理解和⽣成的能⼒。本章还分析 了智能体在未来技术⽣态中的战略地位及其在推动数字化转型中的重 要作⽤。 第2章围绕智能体的技术框架展开，剖析了智能体系统的感知、决 策、执⾏三层结构，重点介绍了上下⽂管理和记忆模块在复杂任务处 理中的应⽤。本章还阐明了智能体与RESTful API、向量数据库的集 成⽅案，帮助系统实现数据实时获取与⾼效语义检索。此外，本章还

介绍了ReAct、Hugging Face和LangChain等技术栈在智能体开发中 的关键作⽤，为读者提供了系统的⼯具和平台选择指南。第3章与第4 章聚焦于具体开发框架的应⽤。 第3章深⼊探讨了如何使⽤LangChain实现多步骤推理与任务⾃动 化，并展示了智能体在复杂场景中的动态⼯具集成。 第4章介绍了LlamaIndex的架构与索引机制，讲解了如何将⾮结构化 数据转换为智能体的知识库，并通过实时数据查询和响应提升系统的 智能化⽔平。 第5章实践如何利⽤OpenAI的API快速搭建⼀个针对论⽂润⾊的智能体 助⼿，并掌握快速迭代开发的能⼒。 第2部分（第6、7章）主要介绍智能体的初步开发应⽤，本部分通过 两个实践案例展示了智能体的实际应⽤场景，包括出⾏订票智能体以 及智能翻译及语⾔辅助智能体等。每个案例都提供了从需求分析、技 术架构设计到具体实现过程的详细解读。这些案例展示了智能体如何 通过LLM进⾏语⾔处理、⽤户⾏为预测和⾃动化任务执⾏，并分析了 如何针对不同应⽤场景进⾏个性化优化。 第3部分（第8～12章）本部分致⼒于探索更复杂、更专业的智能体应 ⽤场景，通过不同领域的智能体开发示例，展示如何结合多种技术 栈，将智能体的潜⼒最⼤化应⽤于实际业务中。读者将在本部分中接 触到邮件处理、⼈才招聘、个性化推荐、写作助⼿和在线客服等多个 ⾼度实⽤的领域，并掌握从开发到部署的全流程技巧。本部分将带领 读者挑战更具难度的智能体系统，实现从简单逻辑到复杂应⽤的过 渡。 智能体技术的应⽤不仅推动了各⾏业的数字化升级，还为未来的技术 发展提供了全新的思路。本书通过系统的理论分析与丰富的实践案 例，致⼒于帮助智能体开发者、⼈⼯智能从业者和对智能体开发感兴

趣的⼈员，以及相关专业的⾼校师⽣，掌握LLM驱动的智能体开发技 术，并将其有效应⽤于实际场景。 资源下载 本书提供配套源码，读者⽤微信扫描下⾯的⼆维码即可获取。 如果读者在学习本书的过程中遇到问题，可以发送邮件⾄ booksaga@126.com，邮件主题为“AI Agent开发与应⽤：基于⼤模 型的智能体构建”。 著者 2025年1⽉

第1部分 初窥智能体 本部分带领读者全⾯认识智能体技术的⼴泛应⽤与深层实现，聚焦于 当前前沿的技术框架与⼯具。从智能体的基础概念到复杂应⽤场景的 构建，每⼀章循序渐进，帮助读者掌握从理论到实践的完整流程。 第1章引导读者从智能体的基本概念出发，了解它在现代科技领域中的 重要性，并分析智能体如何通过模拟⼈类智能来解决复杂问题。 第2章深⼊介绍基于⼤模型的智能体开发体系，展示如何利⽤AI⼤模型 作为智能体的核⼼引擎进⾏交互与推理。 第3章聚焦于LangChain技术的应⽤，通过代码与实例指导读者构建 逻辑严密的智能体，实现智能体在特定领域内的复杂决策和任务执 ⾏。 第4章介绍数据驱动的智能体开发，展示如何通过LlamaIndex将数据 转换为智能体可理解的信息。 第5章实践如何利⽤OpenAI的API快速搭建⼀个针对论⽂润⾊的智能体 助⼿，并掌握快速迭代开发的能⼒。 通过这些章节的学习，读者将获得从概念理解到具体实现的全⽅位知 识储备，为接下来的智能体项⽬开发奠定扎实的基础。

第1章 何为智能体 智能体（Agent）技术的兴起标志着⼈⼯智能的进⼀步发展与普及。智 能体作为⼀种具备⾃主性、感知能⼒和决策能⼒的系统，正在各个⾏ 业掀起变⾰。从对话型客服到⾃动化流程管理，再到复杂的协同⼯ 作，多样化的智能体已经成为推动产业智能化升级的核⼼动⼒。⼤语 ⾔模型的引⼊，使得智能体不仅具备语⾔理解与⽣成能⼒，还能通过 多轮对话和语义推理，实现动态响应与任务优化。 本章将从智能体的基本概念⼊⼿，由浅⼊深地介绍何为智能体、智能 体的核⼼组件与架构、智能体的开发流程以及智能体和⼤模型之间的 关系及其应⽤领域等内容。 1.1 智能体的定义与构成 本节将详细分析智能体的基本概念与特点、核⼼组件与架构、开发流 程与实施⽅法，并探讨其在不同应⽤场景中的运⾏模式。 1.1.1 智能体的基本概念与特点 智能体是⼀个具备⾃主性、感知能⼒和执⾏能⼒的系统，能够在复 杂、多变的环境中与外界交互，并完成预定任务。其特点在于具备⼀ 定的独⽴决策能⼒，能够在没有⼈⼯⼲预的情况下，基于收集到的信 息进⾏逻辑判断和⾏动。 智能体的⾃主性体现在它可以根据任务⽬标和环境数据选择适当的策 略进⾏响应。在⾦融市场中的交易智能体能够基于实时市场数据⾃主 决策，执⾏买卖操作，并根据市场变化调整策略。感知能⼒是智能体

的另⼀⼤特点，它使系统能够从环境中获取必要信息，如传感器、摄 像头、API等数据源。执⾏能⼒则保证了智能体将决策付诸实践，以完 成既定的任务⽬标。 适应性是智能体在复杂环境中的重要优势。这种能⼒使得智能体不仅 能够应对常规任务，还能通过不断学习优化⾃身表现。例如，客户服 务智能体可以逐步积累⽤户的反馈，调整回复⻛格，提⾼服务⽔平。 与传统系统相⽐，智能体还具备更强的任务灵活性，能够动态调整执 ⾏路径，应对环境中的不确定因素。 事实上，当前⼤多智能体都是基于已有的商⽤⼤模型进⾏⼆次开发 的，例如OpenAI公司的Chat Completions API（⻅图1-1）和 Assistants API（⻅图1-2）等。 ▲图1-1 OpenAI发布的Chat Completions API开发⼯具

图1-2 OpenAI发布的Assistants API开发⼯具 1.1.2 智能体的核⼼组件与架构 智能体的架构通常包括感知模块、决策模块、执⾏模块以及反馈机 制。每个模块在系统运⾏时承担不同的⻆⾊，并通过彼此之间的配合 实现智能体的完整功能。 感知模块是智能体的输⼊层，负责收集和处理外部环境中的信息。它 可以通过摄像头、传感器、API数据源等⽅式获取环境中的状态信息。 例如，物流智能体通过GPS传感器获取⻋辆位置，并根据实时路况调 整配送路线。感知模块的质量决定了系统对外界信息的敏感度和反应 速度。 决策模块是智能体的核⼼，负责根据输⼊的信息选择最优的⾏动策 略。该模块通常依赖于⼤语⾔模型（Large Language Models， LLM）、神经⽹络或专家系统来进⾏决策推理。以智能⾦融顾问为

例，其决策模块会根据客户的投资偏好和市场状况，为其制定个性化 的投资组合。 执⾏模块将决策转换为实际的操作。⽆论是物理机器⼈执⾏路径规 划，还是虚拟客服系统⽣成对话内容，执⾏模块都需要确保任务的顺 利完成。系统的稳定性和执⾏效率直接影响智能体的整体表现。 【例1-1】演示如何通过调⽤OpenAI的Chat Completions API⽣成散 ⽂。 等待⼀段时间便可在控制台得到输出（注：这⾥的“>>”符号是指这部 分内容是在命令⾏/交互式终端产⽣的，⽽⾮源⽂件）： >> Thank you!I'm here to assist you. How can I help you today?    >> Write a haiku about recursion in programming.    >> Recursion unfolds,    Function within function calls,    Endless loops contained. 注意，在发出⽂本⽣成请求时，要配置的第⼀个选项是⽣成响应的模 型，所选择的模型不同会对输出产⽣明显的影响，常⽤的模型可分为 以下⼏类。

（1）gpt-4o将提供⾮常⾼的智能⽔平和强⼤的性能，但同时每个代币 的成本也会更⾼。 （2）gpt-4o-mini提供的智能不完全处于⼤模型的⽔平，但每个令牌 更快且成本更低。 （3）o1-preview返回结果的速度较慢，并且使⽤更多的Token来“思 考”，但能够进⾏⾼级推理、编码和多步骤规划。 反馈机制使智能体能够基于执⾏结果进⾏⾃我调整。这⼀机制确保系 统在⻓期运⾏中不断优化。例如，客户服务智能体在与⽤户互动后， 通过分析反馈数据改进其对话逻辑和语⾔⽣成模型。 1.1.3 智能体的开发流程与实施⽅法 智能体的开发涉及多个环节，需要明确需求、设计架构、开发模块、 测试与优化。完整的开发流程通常包括以下⼏个步骤： 需求分析与任务定义。 开发智能体前需要明确系统的任务⽬标与使⽤场景。例如，开发⼀个 医疗助⼿时，需要分析医⽣与患者的需求，确定智能体的核⼼功能， 如预约管理、病历查询和诊断建议。 系统架构设计。 根据需求，设计智能体的整体架构，包括感知、决策和执⾏模块的功 能划分，以及模块之间的通信机制。系统的架构设计应考虑扩展性， 以应对未来的业务变化。 模块开发与集成。 各模块的开发通常采⽤并⾏⽅式进⾏。感知模块可能涉及数据接⼜开 发和传感器集成，决策模块则依赖⼤语⾔模型的微调与算法实现。开

发完成后，需要将各模块集成，并测试模块间的数据传递和逻辑关 系。 系统测试与优化。 测试是确保系统稳定性的重要环节。需要通过功能测试、压⼒测试和 ⽤户体验测试，发现并解决系统中的问题。在运⾏初期，系统需要不 断根据⽤户反馈进⾏优化。 持续监控与更新迭代。 智能体的开发并⾮⼀次性完成。在实际应⽤中，系统需要通过持续监 控收集数据，并定期更新与优化，确保其始终满⾜业务需求。 这⾥我们以⼀个简单的图像⽣成智能体来演示如何进⾏初步开发。⾸ 先需要访问OpenAI官⽹，完成账号的注册并登录，登录后进⼊ DASHBORAD选项⻚⾯，单击API keys，如图1-3所示。

图1-3 在Platform中获取智能体开发API密钥 随后将会看到如图1-4所示的验证⻚⾯，⽤户在该⻚⾯输⼊注册账号所 ⽤的⼿机号，并获取后续智能体开发所需的密钥，密钥属于账号隐私 信息，应当注意保管。获取的密钥格式如下： 密钥：sess-****cj22yRCSYpXNAE5GJ8ygytCN************

为防⽌个⼈隐私信息被泄露，这⾥演示的密钥中的部分位数已被隐 藏。 完成账号注册和密钥获取后，即可开始智能体开发。⾸先在计算机的 控制⾯板→系统→⾼级系统设置→环境变量中配置⽤户环境变量 OPEN_API_KEY为上⾯获得的密钥，即OPEN_API_KEY= sess- ****cj22yRCSYpXNAE5GJ8ygytCN************，如图1-5所示。 也可以在PowerShell中输⼊下列命令完成环境变量的配置： setx OPENAI_API_KEY "your_api_key_here" ▲图1-4 单击Start verification开始验证获取密钥 图1-5 配置环境变量

将OpenAI API密钥导出为环境变量后，就可以发出第⼀个API请求了。 可以直接将REST API与选择的HTTP客户端⼀起使⽤，也可以使⽤ OpenAI的任意官⽅SDK之⼀，如下所示： pip install openai 【例1-2】采⽤OpenAI SDK开发简易的⽂⽣图智能体。 安装OpenAI SDK后，创建⼀个名为example.py的⽂件，并将以下示 例之⼀复制到其中： 执⾏代码后，就可以得到图像⽣成结果，如图1-6和图1-7所示。

▲图1-6 ⽣成图像1

图1-7 ⽣成图像2 若开发过程中提示如下错误：      >> openai.error.APIConnectionError: Error communicating with OpenAI: HTTPSConnectionPool（host='api.openai.com', port=443）: Max retries exceeded with url: /v1/images/generations （Caused by ProxyError（'Cannot connect to proxy.', NewConnectionError（': Failed to establish a new connection: [WinError 10061] 由于⽬标计算机积极拒绝，⽆法连 接。'）））

Statistics

Uploader

AI Agent开发与应用基于大模型的智能体构建 [转换版] (凌峰) (Z-Library)

Tags

Text Preview (First 20 pages)

Registered users can read the full content for free

Comments 0

Statistics

Uploader

AI Agent开发与应用基于大模型的智能体构建 [转换版] (凌峰) (Z-Library)

Tags

Text Preview (First 20 pages)

Registered users can read the full content for free

Comments 0

Reply to Comment

Edit Comment