人工智能ChatGPT 到底是什么?BKEX给你答案

AI 绘画的热潮还没散去,AI 问答最近又迅速火了。

近期 OpenAI 发布了全新的聊天机器人模型 ChatGPT,没想到一经上线,就因其高质量的回答、高效获取信息的方式、以及上瘾式的交互体验而迅速出圈。

不少体验过的人都惊呼,ChatGPT 可能一举消灭记者、程序员和搜索引擎。

就连马斯克也忍不住发推表示,ChatGPT 厉害得吓人,我们距离危险而强大的 AI 不远了。最近这个周末因没有跟踪 ChatGPT 新闻的「纽约时报」,甚至直接遭到了的马斯克发推「奚落」。

图:TED 负责人 Chris 对纽约时报没有报道 ChatGPT 表示震惊,马斯克也在下面奚落纽约时报应该改名叫「社会正义时报」

用户数据上,上线还不到一周时间,12 月 5 日 OpenAI CEO 就在推特上宣布,ChatGPT 已经达到了百万用户。

什么是 ChatGPT?

ChatGPT 是 OpenAI 发布的聊天机器人模型,它的交互界面简洁,只有一个输入框,AI 将根据输入内容进行回复,并允许在一个语境下持续聊天。

自从发布以来,ChatGPT 可谓出尽风头,无论是让它写首押韵的诗、检查代码的 bug、回答科学问题、对推特未来的发展提出建议……通通不在话下,它回复的内容每次都是随机的,但总体保持着一定的专业性和信息量,具备很强的参考意义。

比如,知识讲解。

比如,写小说。

目前已经有网友尝试让 ChatGPT 参加美国高考;写小说;诱骗 ChatGPT 规划如何毁灭世界;甚至让 ChatGPT 扮演 OpenAI,在系统内构建 ChatGPT 套娃。

为什么这么强大?

据浙商和国盛证券研报,ChatGPT 相比以往的主要提升点在于记忆能力,ChatGPT 可以储存对话信息,延续上下文,从而实现连续对话,这在对话场景中至关重要,极大地提升了对话交互模式下的用户体验。

具体而言,此次新加入的训练方式被称为「从人类反馈中强化学习」(ReinforcementLearning from Human Feedback,RLHF)。这一训练方法增加了人类对模型输出结果的演示,并且对结果进行了排序。具体操作上,人工智能训练者扮演对话的双方,即用户和人工智能助手,提供对话样本。在人类扮演聊天机器人的时候,会让模型生成一些建议辅助训练师撰写回复,训练师会对回复选项打分排名,将更好的结果输回到模型中,通过以上奖励策略对模型进行微调并持续迭代。

ChatGPT 相比前辈模型还具有以下特征:

1)可承认错误,若用户指出其错误,模型会听取意见并优化答案。

2)可质疑不正确的前提,减少虚假描述,如被询问「哥伦布 2015 年来到美国的情景」的问题时,机器人会说明哥伦布不属于这一时代并调整输出结果。

3)因 ChatGPT 采用了注重道德水平的训练方式,ChatGPT 在减少有害和不真实的回复上改善显著,如拒绝回答寻求霸凌他人方案的问题,指出其不正义性。

此外,ChatGPT 的背后离不开大模型、大数据、大算力。

ChatGPT 成为 AIGC 里程碑的背后,是算力发展和数字时代形成的大数据所共同支持的大模型训练,才能实现目前的效果。由 OpenAI 研发的 ChatGPT 是微调后的 GPT-3.5 系列模型,有着多达 1750 亿个模型参数,并在今年年初训练完成。模型训练的背后离不开大数据的支持,OpenAI 主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面,GPT-3.5 在 Azure AI 超算基础设施(由 V100GPU 组成的高带宽集群)上进行训练,总算力消耗约 3640PF-days(即每秒一千万亿次计算,运行 3640 个整日)。

AIGC 里程碑级应用

之前文章里,我们给大家介绍了 AIGC——人工智能自动生成内容,它当前主要用在文字、绘画、图像、视频、音频、游戏以及虚拟人等。很明显,AI 问答 ChatGPT 都属于 AIGC 的一个分支。

国盛证券表示,AIGC 不仅改变创作,还将改变获取信息的主要方式。而在此之上,ChatGPT 所展示了作为生产力的存在,ChatGPT 在寻找答案、解决问题的效率上已经部分的超越了如今的搜索引擎,ChatGPT 或许在未来会改变我们获取信息、输出内容的方式,AIGC 有望成为数字经济时代驱动需求爆发的杀手级应用。

市场空间方面,Gartner 预计到 2025 年,生成式人工智能将占所有生成数据的 10%。根据《Generative AI:A Creative New World》的分析,AIGC 有潜力产生数万亿美元的经济价值。而国泰君安表示,未来五年或将有 10%-30% 的图片内容由 AI 参与生成,相应或将有 600 亿以上的市场规模。

相关行业

相比于此前的 AI 绘画,ChatGPT 更具有将 AI 能力与工作流程相结合的潜力。目前 OpenAI 等巨头已着手自建计算集群来满足 AIGC 的要求,这种集中式的训练对 GPU、存储、机房、供电等基础设施均有巨大需求。国内部分创业团队目前基于公有云训练,随着需求的增加,也有望转向自建集群。

国盛证券表示,今年以来,我国「东数西算」战略自上而下快速推进,作为数字经济的基础,「算力即权力」,其重要性不言而喻,此前我们更多的互联网应用聚焦于「存」而非「算」,随着 AIGC 技术在全球的兴起,「东数西算」的算力需求将越来越显著。

公司方面,浙商证券表示,从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、数据标注、自然语言处理(NLP) 等。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,783评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,360评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 142,942评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,507评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,324评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,299评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,685评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,358评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,652评论 1 293
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,704评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,465评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,318评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,711评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,991评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,265评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,661评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,864评论 2 335

推荐阅读更多精彩内容