Agent概念概述
在MetaGPT看来,把Agent想象成环境中的数字人,其中
Agent = 大语言模型(LLM) + 观察 + 思考 + 行动 + 记忆
这个公式概括了智能体的功能本质。为了理解每个组成部分,让我们将其与人类进行类比:
- 大语言模型(LLM):LLM作为智能体的“大脑”部分,使其能够处理信息,从交互中学习,做出决策并执行行动。
- 观察:这是智能体的感知机制,使其能够感知其环境。智能体可能会接收来自另一个智能体的文本消息、来自监视摄像头的视觉数据或来自客户服务录音的音频等一系列信号。这些观察构成了所有后续行动的基础。
- 思考:思考过程涉及分析观察结果和记忆内容并考虑可能的行动。这是智能体内部的决策过程,其可能由LLM进行驱动。
- 行动:这些是智能体对其思考和观察的显式响应。行动可以是利用 LLM 生成代码,或是手动预定义的操作,如阅读本地文件。此外,智能体还可以执行使用工具的操作,包括在互联网上搜索天气,使用计算器进行数学计算等。
- 记忆:智能体的记忆存储过去的经验,可分为长期记忆和短期记忆。这对学习至关重要,因为它允许智能体参考先前的结果并据此调整未来的行动。
在MetaGPT中定义的一个agent运行示例如下:
在MetaGPT内Role 类是智能体的逻辑抽象。一个 Role 能执行特定的 Action,拥有记忆、思考并采用各种策略行动。让我们看看如何实现一个最简单的 Agent
实现一个单动作Agent
要自己实现一个最简单的Role,只需要重写Role基类的 init 与 _act 方法
在 init 方法中,我们需要声明 Agent 的name(名称)profile(类型)
我们使用 self._init_action 函数为其配备期望的动作 。
在_act方法中,我们需要编写智能体具体的行动逻辑,智能体将从最新的记忆中获取人类指令,运行配备的动作,MetaGPT将其作为待办事项 (self._rc.todo) 在幕后处理,最后返回一个完整的消息。
经过上面的学习,我想你已经对 MetaGPT 的框架有了基本了解,现在来编写这样一个 agent
- 这个 Agent 拥有三个动作 打印1 打印2 打印3(初始化时 init_action([print,print,print]))
- 重写有关方法(请不要使用act_by_order,我希望你能独立实现)使得 Agent 顺序执行上面三个动作
- 当上述三个动作执行完毕后,为 Agent 生成新的动作 打印4 打印5 打印6 并顺序执行,(之前我们初始化了三个 print 动作,执行完毕后,重新 init_action([...,...,...]),然后顺序执行这个新生成的动作列表)
通过这个练习来感受 MetaGPT 中 Agent 的行动逻辑, run->react->think->act 的这样一个过程,当然也可以在其中加入llm的交互,来尝试减少硬编码的工作
Agent的代码如下:
import asyncio
import fire
from metagpt.actions import Action
from metagpt.logs import logger
from metagpt.roles import Role
from metagpt.schema import Message
class SimplePrint(Action):
name: str = "SimplePrint"
async def run(self, msg: Message) -> str:
logger.info(f"{msg}")
return msg + "!"
class SimplePrinter(Role):
name: str = "XiaoGang"
profile: str = "SimplePrinter"
def __init__(self, **kwargs):
super().__init__(**kwargs)
self._init_actions([SimplePrint, SimplePrint, SimplePrint])
# self._set_react_mode(react_mode=RoleReactMode.BY_ORDER.value)
async def _act(self) -> Message:
todo = self.rc.todo
msg = self.get_memories(k=1)[0] # find the most recent messages
start_idx = self.rc.state if self.rc.state >= 0 else 0 # action to run from recovered state
for i in range(start_idx, len(self.states)):
logger.info(f"{self._setting}: to do {self.rc.todo}({self.rc.todo.name})")
self._set_state(i)
rsp = await todo.run(msg.content)
msg = Message(content=rsp, role=self.profile, cause_by=type(todo))
return msg # return output from the last action
def main():
role = SimplePrinter()
msg = 'Hello World!'
result = asyncio.run(role.run(msg))
logger.info(result)
if __name__ == "__main__":
fire.Fire(main)
如果使用act_by_order,则SimplePrinter的_act实现就比较简单了,这也是MetaGPT框架的强大之处,实现了react、act_by_order等思维链模式:
class SimplePrinter(Role):
name: str = "XiaoGang"
profile: str = "SimplePrinter"
def __init__(self, **kwargs):
super().__init__(**kwargs)
self._init_actions([SimplePrint, SimplePrint, SimplePrint])
self._set_react_mode(react_mode=RoleReactMode.BY_ORDER.value)
async def _act(self) -> Message:
logger.info(f"{self._setting}: to do {self.rc.todo}({self.rc.todo.name})")
todo = self.rc.todo
msg = self.get_memories(k=1)[0] # find the most recent messages
new_msg = await todo.run(msg.content)
msg = Message(content=new_msg, role=self.profile, cause_by=type(todo))
self.rc.memory.add(msg) # add the new message to memory
return msg
运行日志:
D:\workspace\sourcecode\MetaGPT\venv\Scripts\python.exe D:\workspace\sourcecode\MetaGPT\examples\helloworld_agent2.py
2024-01-14 20:48:22.876 | INFO | metagpt.const:get_metagpt_package_root:32 - Package root set to D:\workspace\sourcecode\MetaGPT
2024-01-14 20:48:22.984 | INFO | metagpt.config:get_default_llm_provider_enum:126 - API: LLMProviderEnum.ZHIPUAI
2024-01-14 20:48:25.370 | INFO | metagpt.config:get_default_llm_provider_enum:126 - API: LLMProviderEnum.ZHIPUAI
0
2024-01-14 20:48:25.940 | INFO | metagpt.utils.cost_manager:update_cost:48 - Total running cost: $0.000 | Max budget: $10.000 | Current cost: $0.000, prompt_tokens: 235, completion_tokens: 2
2024-01-14 20:48:25.941 | INFO | __main__:_act:35 - XiaoGang(SimplePrinter): to do SimplePrint(SimplePrint)
2024-01-14 20:48:25.942 | INFO | __main__:run:16 - Hello World!
2024-01-14 20:48:25.942 | INFO | __main__:_act:35 - XiaoGang(SimplePrinter): to do SimplePrint(SimplePrint)
2024-01-14 20:48:25.942 | INFO | __main__:run:16 - Hello World!!
2024-01-14 20:48:25.943 | INFO | __main__:_act:35 - XiaoGang(SimplePrinter): to do SimplePrint(SimplePrint)
2024-01-14 20:48:25.943 | INFO | __main__:run:16 - Hello World!!!
2024-01-14 20:48:25.945 | INFO | __main__:main:46 - SimplePrinter: Hello World!!!!