系列文章地址
【可能是全网最丝滑的LangChain教程】一、LangChain介绍 - 简书 (jianshu.com)
【可能是全网最丝滑的LangChain教程】二、LangChain安装 - 简书 (jianshu.com)
【可能是全网最丝滑的LangChain教程】三、快速入门LLMChain - 简书 (jianshu.com)
【可能是全网最丝滑的LangChain教程】四、快速入门Retrieval Chain - 简书 (jianshu.com)
【可能是全网最丝滑的LangChain教程】五、快速入门Conversation Retrieval Chain - 简书 (jianshu.com)
使用LangChain构建应用
LangChain支持构建应用程序,将外部数据源和计算源连接到LLM。我们将从一个简单的 LLM 链开始,它只依赖于提示模板中的信息来响应。 接下来,我们将构建一个检索链,该链从单独的数据库获取数据并将其传递到提示模板中。 然后,我们将添加聊天记录,以创建对话检索链。这允许您以聊天方式与此 LLM 进行交互,因此它会记住以前的问题。 最后,我们将构建一个代理,利用 LLM 来确定它是否需要获取数据来回答问题。
Agent
到目前为止,我们已经创建了链的例子 - 每一步都是提前知道的。我们将创建的最后一件事是一个代理 - LLM在其中决定要采取的步骤。
一句话:Agent(代理)就是目前比较火热的智能体的基础。
构建代理时要做的第一件事是确定它应该有权访问哪些工具。 在此示例中,我们将授予代理对两个工具的访问权限:
- 基于百度文库的《让子弹飞》电影信息。
- LangChain内置的Agent——“llm-math”。用于复杂的数学计算。
简单来说就是,我问《让子弹飞》的相关问题,LangChain使用第一个Agent回答问题,我问数学计算,LangChain使用第二个Agent回答问题!
准备工作
主要是网页数据的加载、嵌入模型的初始化、向量数据库的初始化等,具体代码如下。
from langchain_community.document_loaders import WebBaseLoader
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
import torch
from langchain_community.vectorstores import FAISS
from langchain_text_splitters import RecursiveCharacterTextSplitter
# 词嵌入模型
EMBEDDING_DEVICE = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"
embeddings = HuggingFaceEmbeddings(model_name='D:\models\m3e-base', model_kwargs={'device': EMBEDDING_DEVICE})
# 加载外部文档
loader = WebBaseLoader("https://baike.baidu.com/item/%E8%AE%A9%E5%AD%90%E5%BC%B9%E9%A3%9E/5358?fr=ge_ala")
docs = loader.load()
# 文档向量化到FAISS
text_splitter = RecursiveCharacterTextSplitter()
documents = text_splitter.split_documents(docs)
vector = FAISS.from_documents(documents, embeddings)
# 得到一个检索器
retriever = vector.as_retriever()
Agent创建
首先,让我们为刚刚创建的检索器设置一个工具:
from langchain.tools.retriever import create_retriever_tool
retriever_tool = create_retriever_tool(
retriever,
"rzdf_search",
"搜索有关电影《让子弹飞》的信息。对于任何关于《让子弹飞》的问题,你必须使用此工具!",
)
加载内置的llm-math:
from langchain.agents import load_tools
tools = load_tools(['llm-math'],llm=llm)
现在,我们可以创建要使用的工具列表:
tools.append(retriever_tool)
现在我们有了这些工具,我们可以创建一个代理来使用它们。
from langchain import hub
from langchain.agents import create_react_agent
from langchain.agents import AgentExecutor
# 这里获取一个内置prompt,为了方便
prompt = hub.pull("hwchase17/react")
agent = create_react_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
使用Agent
现在,我们可以调用代理,看看它是如何响应的!
agent_executor.invoke({"input": "让子弹飞的导演是谁"})
如果你的LangChain将verbose设置称True,会完整输出执行的中间过程。会有一个明显的COT过程:
{'input': '让子弹飞的导演是谁', 'output': '《让子弹飞》的导演是姜文。'}
我们再继续问一个数学计算问题
agent_executor.invoke({"input": "8 的立方根是多少?乘以 13.27,然后减去 5。"})
结果是:
{'input': '8 的立方根是多少?乘以 13.27,然后减去 5。',
'output': '8的立方根大约是2,然后乘以13.27得到26.54,减去5后得到21.54。'}
我们也可以跟Agent进行对话:
from langchain_core.messages import HumanMessage, AIMessage
chat_history = [HumanMessage(content="让子弹飞是谁导演的"), AIMessage(content="让子弹飞是姜文导演的。")]
agent_executor.invoke({
"chat_history": chat_history,
"input": "这部电影什么时候上映的?"
})
输出的结果如下(省略中间过程) :
{'chat_history': [HumanMessage(content='让子弹飞是谁导演的'), AIMessage(content='让子弹飞是姜文导演的。')],
'input': '这部电影什么时候上映的?',
'output': '电影《让子弹飞》上映于2010年12月16日。'}
我们现在已经成功设置了一个基本的Agent。我们只触及了Agent基础知识,高级用法后面系列文章会介绍,比如说自定义代理等等。
大家要是随便关注下公众号,那就太好了。
Peace Guys~