一、AI Agent的定义
OpenAI将AI Agent定义为“以大语言模型为大脑驱动的系统,具备自主理解、感知、规划、记忆和使用工具的能力,能够自动化执行完成复杂任务的系统。”
1. 感知系统:感知系统是AI Agent与外部世界交互的第一步。它通过多元化的输入方式,如文本分析、图像识别、声音处理等,来捕捉环境信息。
2.规划系统:
二、AI Agent和LLM(大型语言模型)是什么关系呢?
可以这么简单理解,大模型是AI Agent实现的前提和基础。大模型是AI Agent的中枢。
三、四个热门开源 AI Agent 框架
1)四个热门开源框架:
langchain->langgraph;run-llama->llama_deploy/llama_index;microsoft->autogen;crewAIInc->crewAI
2)autogen和crewAI:拟人协作
简单,容易上手,多agent协作
3)langgraph和llamaindex:流程控制
需要更多编程能力的开发者使用,更底层,更便于流程细粒度控制
四、AutoGen:开创性的多代理对话式AI应用框架
是最早专注于构建多代理对话式AI应用的开源架构。
AutoGen允许开发者定义具有不同角色和能力的多个AI代理,支持代理之间相互协作,自主交互,完成复杂任务。框架提供了灵活的对话管理,以及自定义的代理行为设计。
之前版本是0.2,现在新发了0.4,就是增加控制力
五、CrewAI:编排角色扮演、自主AI代理的框架。crew:组,混合
编排角色扮演roleplay(agent的橘色、目标、背景、可使用工具)
专注于角色扮演和团队协作,但是在处理高度动态或需要复杂状态管理的场景(细粒度)时不灵活。
在0.6/0.7的时候做了大改版:加了workflow。
也可以输出完整的流程图
六、LangGraph:基于图结构的底层代理开发框架。状态图/状态机
是一个用于构建基于图结构的代理应用。
允许开发者将复杂的AI任务分解为相互连接的节点、边、状态(状态机)。学习成本较高。
七、Llama_Index:异步优先的多服务代理系统部署框架。事件驱动/事件分发器
背景:一开始叫llama_agent,后改为llama_indexworkflow,后改为llama_deploy
使用服务、任务和消息队列的概念,通过控制平面和编排其管理系统状态和服务交互。
八、Agent
流式对话:Generative UI AI;streaming中间结果
参考:
【精华35分钟】这应该是全网AI Agent讲解得最透彻的教程了,从什么是Agent到创建自己的Agent智能体!一次搞懂!大模型/LLM_哔哩哔哩_bilibili