提示词原理
基于大语言模型工作机制,揭示提示词引导模型输出的底层逻辑
- 编写提示词的 6 种常用方法
- 示例法:借具体示例让模型掌握输出格式与风格
- 指令法:清晰下达任务指令,如 “总结要点”
- 角色设定法:赋予模型特定身份,如 “资深律师分析案件”
- 限制条件法:设定输出的字数、格式等,如 “100 字内回答”
- 分解任务法:拆分复杂任务为子任务,分步引导输出
- 引导词法:用 “首先”“其次” 等使输出更具条理性
- 结构化提示词方法论
- 解析 Prompt Engineering 核心概念及对模型输出的重要性
- 构建层次清晰的提示词结构,含系统提示与用户输入提示的组合策略
- 不同结构对输出的影响及按需调整的技巧
- 提示词分类
- 系统提示词:定义模型基本行为、角色和任务范围,如 “智能客服解答产品功能问题”
- 自定义提示词:结合业务场景定制,如电商场景 “推荐夏季女装”
- 用户输入提示词:用户临时指令或问题,模型实时响应,如 “查询产品价格”
AI Agent 基本概念
按应用场景(家庭服务、工业控制等)和智能程度(弱 / 强智能体)分类
明确智能体定义,区分于传统软件、普通机器人的核心差异
第二部分:AI 智能体设计方法与实践(全书 80%)
- 智能体工作原理与设计模式
- 拆解从感知环境、处理信息到决策执行的完整流程
- 对比反应式(快速响应)、慎思式(深度推理)、混合式(平衡效率与精度)设计模式及适用场景
- 智能体关键环节
- 输入处理
- 多元感知:传感器数据、文本、图像等信息采集方式
- 数据预处理:清洗、降噪、格式转换等关键步骤
- 理解与分析
- 自然语言处理、计算机视觉等技术在信息理解中的应用
- 知识图谱助力上下文关联与深度分析
- 决策制定
- 规则式决策:IF\-THEN 规则集的构建与实践
- 机器学习决策:决策树、神经网络等模型的训练与应用
- 强化学习决策:动态环境下的试错优化策略
- 行动执行
- 外部交互接口:API、物理执行器等实现路径
- 行动监控与异常反馈机制,保障执行效果
- 反馈与学习
- 用户评价、环境变化等反馈信息的收集渠道
- 在线学习、迁移学习等模型迭代方法
- 主流 Agent 设计平台
- OpenAI(GPT\-4 API):高定制深度,适合技术型开发者,多行业适配
- Google Vertex AI:强模型训练能力,中等开发门槛,适配医疗、金融领域
- Microsoft Azure AI:微软生态集成优势,低门槛,适合企业级办公场景
- LangChain(开源):社区支持丰富,灵活度高,适配科研与创业项目
- 设计 Agent 的关键组件
- 提示词:场景化优化技巧,引导精准输出
- 插件:功能扩展工具(如天气查询、翻译)的集成逻辑
- 知识库:结构化(数据库)、非结构化(文本)知识的构建与检索
- 记忆系统:短期交互记忆与长期经验记忆的管理策略
- 工作流:业务流程拆解与自动化执行设计
- 单 Agent 设计方法
- 架构要点:模型选型、工具集成、指令体系搭建
- 案例:个人助手(日程管理 \+ 信息检索)、文件处理(格式转换 \+ 内容提取)
- 优劣势:高效处理单一任务,但复杂场景能力有限
- 多 Agent 设计方法
- 架构:集中式(统一调度)、分布式(自主协同)的适用场景
- 通信机制:消息传递、共享内存等交互方式对比
- 协同策略:博弈论冲突解决、任务分工算法
- 案例:智能交通系统中多车辆 Agent 的协同避障与路线规划
- Agent 的局限性与应对策略
- 局限性:模型幻觉(知识偏差)、未知场景适应性弱、推理深度有限
- 应对策略:外部知识校验、集成学习增强推理、持续预训练优化适应性
- 实际案例
- 医疗领域:疾病诊断 Agent(基于 Vertex AI,融合病历与影像分析,采用混合式决策)
- 教育领域:智能辅导系统(Azure 平台,个性化学习路径生成,依赖记忆系统与反馈机制)
- 金融领域:风险评估 Agent(LangChain 开发,多源数据建模,应用规则 \+ 机器学习双决策层)