书生大模型全链路开源体系

哔哩哔哩:https://www.bilibili.com/video/BV1Rc411b7ns/

简介

大模型是发展通用人工智能的重要途径。从专用模型(AlphaGo、人脸识别、德州扑克等)到通用大模型,一个模型应对多个任务、多种模态。

书生-浦语大模型

书生-浦语大模型陆续推出:

  • InternLM-7B:70亿参数,8k语境,26种语言
  • InternLM-20B:200亿参数,4k语境训练,推理可达16k
  • InternLM-123B:千亿参数,

从模型到应用

从模型到应用是一个长链条:模型选型-续训/全参数微调(算力足够)-部分参数微调(算力不足,如LoRA)-构建智能体(与外部系统进行交互)-模型评测-模型部署。

全链条开源体系

书生-浦语全链条开源体系:

  • 数据:书生-万卷
  • 预训练框架:InterLM-Train
  • 微调:XTuner
  • 部署:LMDeploy
  • 应用:Lagent、AgentLego

书生-万卷

50亿文档,1TB数据量
OpenDataLab 开放数据平台:30+模态,80TB数据

InterLM-Train

可扩展
高性能
无缝对接HuggingFace
开箱即用:支持多规格语言模型

XTuner

微调
增量续训:让基座模型学习到一些新知识,如垂直领域知识
训练数据:文字、书籍或代码等。

有监督微调:让模型学会和理解各种指令,或者注入少量领域知识。
训练数据以高质量对话、问答数据为主

XTuner:支持多种微调算法,适配Huggingface、ModelScope的模型或数据集,自动优化加速,适配多种硬件(消费级显卡+数据中心显卡)

OpenCompass

大模型开源评测体系:6个维度进行评测。
主要面向基座模型和对话模型。

LMDeploy

大模型部署LMDeploy:

  • 模型并行
  • 低比特量化
  • Attention优化
  • 计算和访存优化
  • 持续批处理。

支持模型的轻量化(4bit权重、8bit k/v)、推理(turbomind & pytorch)和服务(open-ai server, gradio, triton inference server),对外提供python、grpc、restful接口。

Lagent

LLM局限:最新知识获取;回复可靠性;数学计算;工具使用和交互。
使用LLM驱动智能体。
轻量级Lagent框架:
ReAct:根据输入选择工具
ReWoo:根据输入划分计划
AutoGPT:人工干预

支持多种大语言模型,集成了一些工具。

AgentLego

多模态智能体工具箱,聚焦工具集合。
支持多种主流智能体系统,如langchain、transformers agent、Lagent
支持多模态工具调用接口
支持一键式部署。

Lagent案例

短期记忆
推理与计划
长期记忆
环境互动
多智能体写作

Agent不是一个app,它是应用LLM的框架。
计划、行动、反馈、学习
agent架构
LLM for agent(agent对LLM的要求):

  • 逻辑推理能力
  • 信息抓取能力
  • 指令遵循能力
  • 工具使用能力

提示工程思维模型

  • 把模型想象成没有任何背景信息的新人 stateless
  • 平行宇宙概念模型 model pre-training
  • 模型需要文本输出来思考 auto-regressive

工具:code copilot; EasyDict

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355

推荐阅读更多精彩内容