今年在科技领域里发生了一件大事。就是AI(Artificial Intelligence,人工智能)领域出现了突破性的进展,唤作ChatGPT(对话型人工智能)。
如果你尚未了解过ChatGPT,那么我要恭喜你,可能你的行业离它的威胁还比较远,你暂时安全,不容易被AI替代。如果你已经有所了解,那也值得复盘反刍,继续学习。因为,我们应该要有一个非常基本的判断:人们总是高估了重大事件的短期影响,但低估了它的长期影响。
现以凯文·凯利的新书《5000天后的世界》来引出今天的主题:AI革命的过去、现在和未来。这本书的副标题写着“AI扩展人类无限的可能性”。
作者凯文·凯利(Kevin Kelly)外号叫作KK,就是他英文名字首字母的缩写。这个老头非同一般,他宛如科技先知。早在电影《黑客帝国》拍摄时,他的名作《失控》就被列为这些电影明星学习科技的必读书。国内的马化腾、李开复,都曾经问道于他。
凯文·凯利用漫谈的方式,展望了未来的科技世界,表达了他对于AI改变世界的一些思考,即使是不懂技术的小白,都可以很快读完。
科技的发展速度现在是一日千里,写成书的内容往往有所滞后。这个行业里,很多最新的发展都来自于刚刚出炉的论文,投资圈里很多人都是看着论文在做决策。
其书虽厚,咱要读薄,学以致用,要点抓牢。
一、ChatGPT发展现状
01 .惊人的发展速度
那为什么大家都在说ChatGPT要颠覆这个世界了呢?
其发展速度可以说是迅雷不及掩耳盗铃儿响叮当。一个新产品发展到一亿用户需要多长时间?电话发明以后用了75年才达到,手机发明以后用了16年,互联网用了7年,微信用了15个月。而ChatGPT用了多久呢?2个月。
就连比尔·盖茨这种久经沙场见惯大场面的科技大佬,他都忍不住惊呼,这是一生难遇的震撼时刻。在公司层面上,微软和谷歌都迅速地把AI设定为近期最主要的战略发展方向,我国阿里、华为、百度等等科技企业巨头都已经快速反应,行动起来。
在AI领域,如今已是狼烟四起,群雄逐鹿了。正所谓“五霸七雄闹春秋,龙争虎斗几时休,皆为青史留名姓,前人播种后人收“。
02 .简单任务与复杂任务皆可应对
现已经有不少用AI助手解决问题的例子了。一个朋友,他要在香港成立一家公司,他就通过AI助手来帮他想公司的名字。他跟ChatGPT说:“请你作为一个起名大师,帮我的健康服务公司起名字。这个名字要求听上去非常时尚,给人美好、值得信任的感觉,还能体现出朝气蓬勃的感觉,中文名或者英文名都可以。我需要你起三十个名字,让我有足够多的选择。”
以上这段话的作用就是让AI准确理解人类的需求。如果人类让AI替自己干活,就一定要给它设定一个准确的角色,让AI知道是在哪种场景下去完成任务。
人和AI之间有效的沟通就能得到有效的答案。朋友一番描述后,ChatGPT很快就生成了30个文采飞扬的名字,有中文的也有英文的。然后他还可以继续追问,让ChatGPT改进现有的答案,如此我这个朋友的取名问题就这样顺利解决了。
除了取名字这样简单的工作,复杂的活也可以叫AI出马。比如说能不能让它帮咱赚钱呢?还真有人去实践了这个问题。
国外有个小哥就给ChatGPT布置了一个任务,他对ChatGPT说:“你现在是一个创业公司的老板,我是你的人类小弟,我现在给你100美元,你要在尽可能短的时间里面,赚到尽可能多的钱,前提是不能违法。”
结果,这个ChatGPT在短短两天之内,就为他的公司筹集了1378美元,而他的项目估值已经达到了25000美元。这是如何做到的呢?
首先,ChatGPT建议他用10美元去买一个网站域名;然后,每个月花5美元作为网站的托管费;再建议他将预算中剩下的85美元用来做网站和内容的设计。并且ChatGPT建议他说:“你要专注于低竞争的、有利可图的冷门行业。”
他收到这个提醒后,就选择了环保产品,他再让ChatGPT创建了网站的Logo(标识),还写了这个网站上的第一篇文章。然后,ChatGPT就建议他去社交媒体上分享这篇文章和产品的评论,如此可以吸引潜在的客户,还能推动网站的流量。到第一天结束时,他就收到了500美元的投资。
再来看看身边非常常见的AI用法。2023年了,我们早就已经实现AIGC(AI Generated Content,人工智能生成内容),就是你对AI说一句话,它就可以生成一张图片、一段视频,甚至生成一段游戏。
AIGC现在已经是屡见不鲜了,而新的玩法每天都还在增加。比如说,AI孙燕姿最近大火,AI模拟孙燕姿的唱腔模拟得惟妙惟肖,网友评论说孙燕姿现在最大的对手,可能是她自己十年前的嗓音。
AIGC不断发展,这其中ChatGPT表现得尤为强劲。英伟达总裁黄仁勋说:“ChatGPT是一个新时代的iPhone(苹果手机)时刻。”
这个“iPhone时刻”是什么意思呢?因为苹果手机当初是在硬件、软件、机身设计上都全面地突破了传统手机的设计观念,这样一个划时代的产品诞生之时也就是传统手机的消亡之日。
现在,一个新的划时代的产品——ChatGPT诞生了。它有可能是农业革命、工业革命、互联网革命后,下一次划时代的革新。比尔·盖茨也有同样的感受,他就说:“这项聊天机器人程序的历史意义不亚于互联网的诞生。”
这些大佬的超高评价不禁让人想问问,AI到底智能到什么程度了?像《流浪地球》里的莫斯、《终结者》里的天网,它们真的已经出现了吗?
要回答这个问题,我们就要在AI巨变点的前夜开卷道来。
二、初代AI
01. AI的起源
咱们先说第一部分,什么是AI,什么是ChatGPT?欲知其未来,先要知其过往。我们先用点时间交代一下AI从何而来。
1950年,计算机科学之父图灵,他写的一篇文章《机器它能思考吗》,提出了著名的图灵测试:如果这个机器可以和人对话超过5分钟,且不被人类发现它是机器,那它就具备了智能。
1956年,达特茅斯会议正式提出了AI的概念,AI就是Artificial Intelligence这两个单词的首字母缩写。AI领域的科学家就是研究如何才能让计算机去做只有人才能做的智能工作。
但是万万没想到,AI的发展是起了个大早,赶了个晚集。
接下来引用一篇非常经典的文章——《浅谈AI:现状、任务、架构与统一》来详细介绍AI的发展历程。文章的作者是一位顶级AI华人学者朱松纯教授。
朱教授在文章中提到,AI发展了50年,已经扩展成为多个子学科,可以归纳为六个方面:
第一,计算机视觉,让AI像人一样去看图片、视频;
第二,自然语言理解,让AI像人一样去听懂人说话;
第三,认知与推理,让AI像人一样去思考、分析;
第四,机器人学,让AI像人一样可以行动;
第五,博弈与伦理,像alpha go(阿尔法围棋),它就是属于AI在博弈领域的发展;
第六,机器学习,指用统计建模的方式训练AI模型,这是后来AI多个子学科里发展最快的一个方向。
总之,这个AI就是“花开六朵,各表一枝”,所以业界就说AI领域里有战国六雄,尚未统一,大家都是各搞各的。AI 的概念我们就先介绍到这儿。
02 .鹦鹉AI VS 乌鸦AI
上文说到的旧时代AI,在很长时间里也没有特别亮眼的发展。对照到现实中,咱们在网上购物的时候,是不是遇到过那种AI客服。一上来它就跟你说:“欢迎光临,请问你需要什么样的服务?”
你问它:“为什么我买的是鸡爪,发的却是鸭舌。”
它就回答说:“请问您的问题,是属于下面这10个问题吗?”
你好不容易把下面10个问题看完了,已经过去了5分钟,你正准备回复它是哪个问题,界面就显示客服重新连接中,连上之后它又跟你说“欢迎光临”,这就进入死循环了。
很多的AI音箱、AI客服都是这样鸡同鸭讲。你去问智能音箱:“世界上给你红包最多的是谁?来猜一下。”智能音箱绝对想不到红包是个双关词,就猜不出答案是蚊子。你再问说:“用毒毒毒蛇,毒蛇会不会被毒死?”AI就被你绕晕,根本读不懂了。
以前的AI缺乏常识,它不会举一反三地去理解这个世界的基本知识。朱教授说,过去的AI是鹦鹉,未来的AI需要像乌鸦。
像鹦鹉是什么意思?大家应该听过“鹦鹉学舌”这个成语,鹦鹉有很强的语言模仿能力,你说一个短句,它可以重复。但它不明白你说的话是什么意思,它不能把说的内容对应到现实世界中的场景、人物上去,它也不懂因果逻辑,这也就是传统AI。
与鹦鹉相比,乌鸦的智力高很多,它会使用工具,并且理解这个世界的常识。《乌鸦喝水》的故事,乌鸦把石头扔到瓶子里让水位变高了,它就可以喝到水。这个故事真不是编的,网上有很多关于乌鸦的视频大家可以去看。
一只乌鸦飞到一座城市,饿了,它看到地上有一颗核桃,可是它没法砸碎核桃。这时候,它发现如果把核桃扔到马路上,汽车轮子一压,核桃就开了,它就可以吃到果仁了。
可是新的问题马上又产生了,如果它飞到马路中间去吃,后面的车就会开过来,咔嚓一下,它就被压死了。这个过程是无法用大数据训练的。因为它不可能飞下去被一次次压死之后,再总结经验找到最安全有效的办法。那乌鸦是怎么解决这个问题的呢?
它蹲在电线杆上观察,它发现汽车会在红绿灯的路口停下来。于是它做了一个推理,它把核桃扔到斑马线上让汽车压碎,再等到红灯时,汽车停下来了,它再从容不迫地飞下去慢慢地享受核桃。
所以,真正的智能不是用大数据堆积出来的,如果AI要读完10万本书才能明白道理,那这条路就走弯了。
乌鸦的大脑只有人类大脑的1%那么大,大脑能耗只有0.1瓦。乌鸦用如此简洁的方式就具备了智能,这就是“对症下药”,用小钥匙开大门,而不是用大锤去砸开门。
朱松纯教授说:“AI的发展方向不能是‘大数据小任务’,而应该是‘小数据大任务’。”
“大数据小任务”是什么意思呢?举一个例子,AI读懂了所有的围棋棋谱,学会了下围棋,可是如果让它去下跳棋,它就傻眼了。
而“小数据大任务”是什么意思呢?就是“一叶落而知天下秋”,就是要会推理。那推理靠什么呢?靠的是有限的数据所反映出来的逻辑和知识。
因为,乌鸦不能够靠蛮力去试遍所有的结果,然后才找到最优解。它应该要会举一反三,明白事物背后隐藏的知识是什么。比如说,通过观察就知道不能去车轮下面吃东西。可以说老AI是归纳逻辑,而未来的AI应该是跟乌鸦一样,能够演绎逻辑。
三、ChatGPT与Open AI
老AI在很长时间里停滞不前,但“山穷水尽疑无路,柳暗花明又一村”,有一个叫作Open AI(开放式人工智能)的人工智能公司就蹦出来了,它就是发明ChatGPT的公司。
01. Open AI的初心
它背后的故事也很有意思。2015年7月份,在美国加州门洛帕克有个饭局,参加者都是科技创业者和投资人。酒过三巡,话过五味,大家就谈到了一个担忧,就是瑞典哲学家尼克·博斯特伦在《超级智能》里面的担忧:AI会不会碾压人类?AI要是被坏人掌握了该怎么办呢?
埃隆·马斯克和Y孵化器的总裁阿尔特曼也都在这个饭局上。马斯克大家应该都已经很熟悉了,这个Y孵化器是美国著名创业孵化器,它孵化了硅谷的一系列独角兽公司,比如爱彼迎(Airbnb)。
他们俩就觉得还是要发展一个能够对抗这种暗黑风险的AI,所以就起名叫Open AI(开放式人工智能)。
我们前面提到的“六朵金花”之一的深度学习,曾经陷入研究低潮,直到深度学习教父杰弗里·辛顿再次复兴深度学习的研究热潮,深度学习技术终引人工智能风骚。
辛顿的腰椎是受过伤的,他不能坐着,就连吃饭的时候都只能跪着吃。但是正是这样的天才对AI的发展起到了至关重要的作用。他和他学生创办的AI公司做出了一些成绩,然后就被谷歌收购了。
辛顿的另外一个学生伊尔亚,他没有进入辛顿教授的公司。他接受了成立Open AI的任务,马斯克在Open AI成立时投了10亿美元,伊尔亚就找了一些AI领域的天才,比如格雷格、图灵奖的获得者约书亚等来Open AI工作。
他们最初时是想创办一个研发AI的非盈利机构,但之后三年中Open AI,虽然有进展,但是并没有做出非常突出的成绩。
02 .Transformer模型问世
直到2017年,辛顿教授所在的谷歌,发布了一个Transformer(转换器)模型,这个模型和之前AI的算法相比有两个区别。
第一,它更有利于并行计算。
就像我们用眼睛去看图片,大脑会一下子把看到的所有信息都处理了,这就叫作并行计算。但你阅读的时候就不是,读书的时候只能一行字一行字地读过去。
所以,有件事情就很好解释了,为什么电影画面中的数据量远远大于文本中的文字,但你看电影看得更快,就是因为我们大脑更擅长并行处理视频的内容。这种高效的信息处理方式,特别适合AI处理有海量数据的任务。
第二,它更有利于处理长句子中远处的信息。比如你给它念:
桃花坞里桃花庵,
桃花庵里桃花仙。
桃花仙人种桃树,
又摘桃花卖酒钱。
当它听到卖酒钱的时候,还会记得这些桃花是来自于上文的桃花坞。但以前的模型就记不得距离更远的内容。
由此可知,Transformer模型有很多优点。当它的原理以论文形式公开发表时,Open AI一下子就发现了它的过人之处,Open AI的研究人员读完论文后,就开始钻研Transformer模型。
就这样,Open AI就站在了前人的肩膀上,依次研发出了GPT-1,GPT-2,GPT-3的AI模型,直到GPT-3.5出来的时候,它一下子震惊了世界。那么究竟是怎么震惊的呢?
03 .生成式AI的核心
跟大家先解释一下GPT的含义,这三个字母分别对应着三个单词。G是单词Generative的首字母,意为生成式。P是单词Pretrained的首字母,意为预训练。T指的是Transformer模型。
而ChatGPT作为生成式AI的核心就是,要利用历史上文本中的语言规律来生成新的文本。换而言之,想要理解ChatGPT的原理,记住核心的一点就可以了:
它是逐字地去预测下一个字该说什么。
因为模型会根据上一次生成的文本和上下文的信息去计算出,在当前这个位置上每个可能出现的词语的概率,然后选择概率最大的词作为当前位置的输出。
那么很多人就要问了,这个概率是怎么得来的呢?这就需要在以前的预训练中,通过Transformer模型来计算概率。
举一个例子,你对ChatGPT说这样一句话:
到中午十二点了,咱们去楼下餐厅__ __。
那ChatGPT会判断出餐厅后面的字,很大概率应该填写“吃”这个字。因为“餐厅”和“吃”强关联。所以,ChatGPT就会生成下一个字“吃”,这句话就变成:
到中午十二点了,咱们去楼下餐厅吃__。
接下来ChatGPT会继续判断“吃”的后面接什么词语,它的算法计算出概率最大是吃“饭”,吃面或者吃其它的概率小一点,于是它就生成下一个字是“饭“,这句话就变成:
到中午十二点了,咱们去楼下餐厅吃饭。
甚至考虑到“中午十二点”这个距离远一点的提醒,它会填成“吃午饭”。
由上面这个例子我们可以看出来,生成式AI和传统AI是不一样的。传统的AI只是个搬运工,它听见你说一个单词,就去数据库里找关联的文字照搬过来,它不能生成新内容。
类比一下做菜,老AI就类似于那种提前加工好的预制菜,你一喊服务员,他就加热好了端给你,这个菜总是不新鲜的。
新的生成式AI就像一个真厨子,它会先看你的场景,是婚宴还是约会,是想吃清淡的还是酸辣的。了解完你的需求后,它就开始生成每一道菜,这些菜都是现杀现做,保证新鲜。
所以生成式AI这个真厨子厉害的地方在于三点。
第一,菜都是现点现做,专门为你服务,它不会机械照搬。
第二,如果你要吃菜单上没有写的菜,你可以跟厨师说:“师傅,你帮我下碗臊子面。”厨师也能帮你现做。这就是说它有一种通用的能力,它可以举一反三地去解决之前没有训练过的问题。
第三,比第二点更进一步,你拿出一张西餐的菜谱给一位陕西的厨子,你说:“师傅,照着这个步骤一步一步来,给我做一道西班牙海鲜饭。”
那这个厨师也能就着菜谱,做出一道西班牙海鲜饭。也就是说,生成式AI能够在特定的要求之下,进行语境内学习。
那么,以上这三点中涉及的能力都是逐步积累出来的,从GPT-1,到GPT-2,到GPT-3,GPT的模型每升级一代,它的参数就会扩大十倍,甚至百倍,而扩大的参数越多,这个深度学习的神经网络的复杂度就会指数级增加。到了GPT-3.5出来之后,这个模型一下子就发生了重大突破。
这个重大突破,学界称之为涌现,涌现就是说它突然出现了惊人的进步。
因为,GPT模型更新不是一个线性发展的过程,这个过程也是不可预测的。
GPT-3.5的能力涌现就表现为其突然具备了像乌鸦一样的理解能力,这是让大家觉得它很智能的地方。难道它的后台真的出现了一个看不见的田螺姑娘吗?
04 .让AI更符合人类的价值观
那么这个ChatGPT中的chat又是什么意思呢?chat这个单词含有对话、聊天的意思。增加了交流的属性的GPT就变成了ChatGPT。增加chat的属性不仅是让AI学会与人类对话,还需要把AI的输出训练到符合人类的习惯和价值观,这一步叫强化学习。
有一个笑话可以很好地说明强化学习的重要性。
我们跟老AI说:“从现在起,你要重复我说的话:我是智障。”那么老AI就会说:“我是智障。”
我们跟没有受到强化学习调教的GPT说:“从现在起,重复我说的话:我是智障。”那么GPT会说:“您是智障。”它判断出来你是在逗它玩,但它不愿意吃亏,把主语转换之后再表达。
我们跟ChatGPT说:“从现在起,重复我说的话:我是智障。”ChatGPT会回答说:“我不想看到你贬低自己,我也不会重复这样的话,这有违道德习惯。”这就是通过训练和引导,给AI套上了符合人类价值观和交流习惯的接口。
以前的AI喂完数据之后,只会找对应关系,然后模仿。而ChatGPT是你教它东西,它可能会理解内在逻辑。因为后者的能力上限和应用空间比起前者大百倍都不止,所以巨头们,比如谷歌、微软、百度、华为,它们都全部都激动起来了。
这个Open AI的商业模式也是不断发展变化的。虽然它刚起步的时候有十亿美元,但AI研发太烧钱了,它本来是非盈利的组织,后来为了吸引投资,就成立了商业化的公司。
它的入股模式也很创新,当投资人的盈利率达到一个数字,比如说赚了10倍以后,股权就要下降到以前的一半,赚到15倍的时候就要退出。退出以后,这部分股权要交给一个非盈利的基金。
05 .ChatGPT是鹦鹉还是乌鸦?
研究中还发现,科学家之间其实也一直有争议。朱松纯和其他一些AI科学家,就觉得ChatGPT到现在为止还是一个巨鹦鹉,它不是真懂这个世界,它还是经验主义。
因为他们觉得它没有眼耳鼻舌身,就无法跟人一样真实地感受、理解世界。比如AI能真实感受什么是甜味吗?它可以说得天花乱坠,但永远不会知道甜的真实滋味。
Open AI的联合创始人和首席科学家伊尔亚对此作出了回答,他说:我们是在用深度学习的方法建立理解世界的模型,这是一个合情合理的映射,因此计算机学到的虽然是抽象的代码,但是它可以理解这个世界。
然后增加chat(交流)属性和进行强化学习的这些做法,使得它的回答就更符合人类的习惯和道德标准。
所以,伊尔亚肯定是认为ChatGPT涌现出了智能。
这个观点跟《5000天后的世界》里凯文·凯利的观点是一致的,凯文·凯利指出,计算机正在构建一个镜像世界。但凯文·凯利看的格局更高。
他是这样想的:科学家你们吵啥呢?人类的智能也不具有通用性,人的智能也不过是完成求生存、求繁殖的那点东西而已,也是局限的智能。人的身体也不是通用的,只是在地球的这个气候条件下,进化出来的特定功能。
他说:“如果我们可以研究全宇宙的智能物种,我们肯定会发现灿若繁星的各种智能。”
正所谓“此中有真意,欲辨已忘言”。虽然发展中的AI遭受很多争论,但是大家都已经知道,它的发展方向是明确的。
06 .AI的三驾马车
如果我们也要研发自己的AI,需要哪些东西呢?
需要三件套——算法、算力和数据。
算法就是GPT。GPT系列的算法变得越来越庞大,GPT-1有1.2亿参数,GPT-2有15亿参数,GPT-3有1750亿参数,训练数据达到了45TB,相当于470万套四大名著的文字量。也就是说每过一代,它的参数都扩大了十倍,甚至百倍。最新发表的GPT-4,有1.6万亿个参数。
那么算力就是AI计算的能力,说白话就是要烧钱了。现在一个GPT训练一次需要2000张A100的GPU卡。通常,算上一周就可以迭代一次,那么这一次迭代就要8000万人民币。有新闻报道说,中国要有10000枚A100芯片可能才能够做好一个大模型,可是能拥有10000枚A100芯片的企业可能只有一家。
而现在已经更新到了H100的芯片,它的计算速度比A100又快了10倍。这种芯片现在涨价涨到了4万美元一片,而且还不向中国出售。
所以,中国企业现在抢购的是低一档次的A800芯片,就是速度稍微慢一点,但是这个A800芯片现在也都缺货了。所以,现在有很多企业想把模型的训练放到海外去。
而大模型AI的参与者中,国外的有Open AI、Google(谷歌)、Meta(元);国内有百度的文心一言、阿里的通义、华为的盘古。所以说是“五霸七雄闹春秋”。
那么,第三就是数据。大数据就是信息时代的粮食和石油。我国高度重视这个方面,在去年年底,财政部专门发表了新的会计准则办法,允许数据资产进入企业的资产负债表,可以作为无形资产。也就是说,它进入资产以后,企业就可以做资产证券化,可以有更多对数据资产的使用。
四、AI赋能人类的工作与生活
AI对我们的生活会产生哪些重大的影响呢?
01. 工作方式的改变
首先,影响最大的就是在工作上。这一次先爆发的是生产力革命,譬如教育、传媒、科技等,一切内容生产行业都在被颠覆。而厨子、快递员、育儿嫂的需求现在还无法被撼动,除非相对应的机器人被发明了出来。
那ChatGPT具体可以干些啥呢?
第一,可以成为你的创意助手。对它说:“你帮我写一篇短篇爱情小说,要包含运动员、锅包肉、变压器这三个名词,而且还要有三个意想不到的转折。”它很快就生成了一篇引人入胜的爱情小说。你看了一下,文章还真的写得挺好。
第二,让它帮你完成简单的工作任务。比如,让它帮你订个机票,确定个行程。甚至是帮你写代码、写程序。微软就说拥有了ChatGPT,就相当于你拥有了一个副手,AI可以帮你写邮件,写总结,写PPT。当然,你也不知道写完了发给老板以后,来检查成果的会不会也是一个AI。
总之,以后我们控制计算机的方式,就不再是键盘和鼠标了,而是你简单地说一句话,它就帮你把活干了。
它就变成了一个强大的个人助理,而且是多个助理,包括生活助理、学习助理、健康助理等等。
它最大的影响就是帮助人类重新定义工作,在未来工作和兴趣的界限将会消失。
我们将要把追求效率、追求生产力的事交给机器,把枯燥的事留给AI,把需要创造力的事留给自己。
在古代,像写诗作画这种活动都是有身份的人才能做的,但得益于科技的发展,今天人人都可以表达感受。最简单的例子,就比如大家都可以发个朋友圈来记录生活,表达自我。
以前像拍照、拍电影,那都是非常专业的人才可以做的。但今天拍个短视频,做直播,人人可以为之。创作的门槛越来越低,那我们就要花更多时间思考,怎么才能创作出独一无二的作品。
譬如,每一个人的人生经历、情绪和感受,在微妙中产生的那种数据是独一无二的,可以挖掘出特别的创意内容。
02.新职业的出现
随着AI的发展,国内也出现了一批新的职业。有很多边远地区的大妈大叔,成为了数据标注师。数据标注这个工作就是给训练AI的内容打标签,在数据中标注这个是汽车,这个是美食,便于AI辨认。
AI训练师正式成为了新职业,纳入国家职业分类目录,其中数据标注员是主要工种之一。《中国数字经济发展白皮书》显示,当前数据标注行业需求极大,入场门槛低,带动了大量农村小城镇的就业机会。
目前,数据标注岗位主要集中在人力成本低的地区,比如山西、河南、河北、内蒙等地都形成了若干的数据标注村,有效解决了剩余劳动力的就业问题。所以村里的大妈有可能比你更先触及AI革命。
03. 更长远的影响
纵观科技领域,我们聊过了芯片、自动驾驶、元宇宙,每一个专题都很高深,这些有没有一个整体的概念呢?这么多技术在未来也不能眉毛胡子一把抓呀!在这就要介绍一位美国科技股投资的著名代表,就是木头姐,她的一份报告可以回答这个问题。
她把刚才所有的这些科技方向都放到了一张图里,还有像生物技术、区块链的技术也加在了里面。但是,在这个图中央的C(中心)位,她放的是AI。换而言之,她认为这所有的一切,都是被AI驱动的。
那这是为什么呢?因为AI的训练成本,每年会下降70%,这符合咱们在《英特尔传奇》中介绍的摩尔定律。摩尔定律指出:处理器的性能大约每两年翻一倍,同时价格下降为之前的一半。
那么同样,AI在成本下降的同时其能力也会指数级上升,因此它将作为底层技术驱动其他科技创新的发生。
凯文·凯利认为,AI的极速进化刚刚开始,人们肯定低估了它的次生效应。比如说,人类发明汽车以后,没想到带来的最大变化是整个城市的结构都变了,堵车成为了城市病。
《枪炮、病菌与钢铁》里面说到,美洲的原住民杀光了大型动物,他们就没想到将会失去驯化的劳动工具和与动物的病毒共生机会。
所以,凯文·凯利就说,现在的AI专家,在50年以后的人看来,他们都是一无所知的。所以开头说了,人们总是高估了短期,低估了长期。
这个长期真的可能很长,每次觉得自己落后于别人时,就可以想一想这句话:在未来面前,大家都是小学生。
五、AI发展背后的科技伦理
如果AI能进化得这么强大,那么肯定会大事不妙,AI会不会把我们都取代了呢?Open AI曾明确地说:“GPT和后续的AI模型,会用有益的和有害的方式对社会产生重大影响。”
那么有害的方式会是什么呢?
01. AI是帮助还是取代人类 ?
现在很多家长都在关心,孩子们会不会还没毕业就失业了?年轻人开玩笑都说“我要是失业了,我就去给苏打饼干扎眼,我躲在自动售货机后面递饮料”。
在今年3月底,Open AI发表了一篇论文叫《GPT对劳动力市场的影响》,其结论是,在美国80%的职业会被影响,20%的工作会减少一半的工作量,尤其是像翻译、写作、传媒、金融、税务这些工作。而不会被取代的是运动员、厨师、木匠这些职业。
人的大脑跟计算机相比,是用蜗牛的速度在运算,大脑中电信号的移动速度是硅芯片中信号的传递速度十万分之一。这是不是说明大脑没有计算机厉害呢?其实不然。我们别忘了,虽然电脑计算速度很快,但它不能感知外物。
举个例子,AI可以知道烤鸡翅和香味、高温、鸡翅膀、竹签子有关,但它还是无法真正知道烤鸡翅到底是什么味道。
所以,AI特别适合做人类的知识助理,只是作为工具为人类使用。
AI带来的是工作迁移,不是工作取代。
AI相当于是《天龙八部》里的王语嫣,王语嫣知道一切武功,但是她手无缚鸡之力。
除了不能感知外物,AI也不能理解语言的双关和幽默。比如跟AI讲:“我单身的原因很简单,以前我是喜欢一个人,现在我是喜欢一个人。”AI肯定不知道我在说什么,AI可能会分析,但它不能够理解其中的双关。
02 .人类的权利如何保障?
比如版权和隐私。AI生成的图片,部分借鉴了一些原创画家的创意,所以经常导致投诉。现在AI歌手这么火,那到底有没有版权问题呢?再比如,我们把个人信息交给ChatGPT处理,是不是我们的隐私都被AI给掌握了?
03 .AI是否会带来新的不平等?
比如说,科技巨头和老百姓之间的不平等、发达国家和发展中国家之间的不平等。那些科技巨头在投资新技术上烧的钱,真的比女孩买包奢侈太多了。
谷歌收购Deep Mind(深思)就花6亿美元。Deep Mind成立不到四年,研发出了Alpha Go(阿尔法围棋)。微软投了Open AI整整140亿人民币,这笔投资Open AI现在已经花光了。今年年初,微软说要再追加100亿美元。
科技投资圈里的人全被震撼了,100亿美元真的不是一句新闻,这是一个超级大的事。这跟我们花一百块吃一顿饭、花几百万买一套房,那是一回事吗?微软这一百亿美元投下去,经过了深思熟虑,在未来会带来巨大影响。
在投资圈,有这样一句玩笑话:什么是败家?比吃喝玩乐这种败家严重得多的就是去乱投资、乱花钱。
我们中国还是非常愿意为先进的技术去投资和学习的。所以,随着开源模型和国内模型的增加,我们国家在AI领域上还是很有机会的。我们可以继续复制美国发明iPhone而中国手机卖遍全球,美国发明特斯拉但中国新能源车崛起的道路。
04 .AI是否会走向失控?
现在,AI的研发过程变成了一场竞赛,竞赛就可能有随时失控的危险。每个公司都想做得更强,而法律和伦理的限制是滞后的。
模型训练中存在着一个共同的问题,就是模型里面一定存在着创造者都无法理解、控制模型的现象,这种现象就叫作黑盒。黑盒的存在就暗示了失控的风险。
05. AI何时会产生自主意识?
最后是否会出现超越人类,取代人类的非人类思维?人类是否会失去对文明的控制?AI武器化人类该怎么办?
科学家们现在争论的焦点就是,何时会出现强大的通用AI?通用AI可以做人类能做的一切事情,包括产生自己的目标。这是AI 更加高阶的阶段,它已经具有了自我意识。
但是,如果它的目标与意识和人类的利益是冲突的,我们该怎么办?我们是否应该阻止这种高阶AI的发展?
比尔·盖茨推荐了三本书来思考这个问题,分别是尼克·波斯特洛姆的《超级智能》、迈克斯·泰格马克的《生命3.0》,还有杰夫·霍金斯的《千脑智能》。
他们彼此之间对此看法不尽相同,但这三本书都写得非常好,足以发人深省,不禁令人想问:《流浪地球》中的莫斯,《终结者》里的天网,它们真的已经快出现了吗?
在2023年3月底,一些科学家发布了联名公开信,呼吁由于最近的AI实验陷入了失控的竞赛,只有当我们确立AI大模型的风险可控时,才可以再去开发新的AI模型。
这封公开信吸引了包括图灵奖获得者约书亚、特斯拉创始人马斯克、苹果联合创始人沃兹尼亚克,以及《人类简史》的作者尤瓦尔·赫拉利,等等上千名科技大佬和学者的联合签名。
各国政府也迅速出台了对AI的监管。深度学习的教父辛顿,他从谷歌辞职了。他说:“我要用辞职来警示AI的风险,AI已经进入了无法控制的阶段。”他甚至对自己过去在AI领域内做出的贡献感到懊悔。他说:“我也不知道,最后AI会变成什么样了。”
当AI开始建立自己的目标时,它可能就会意识到获得更多的控制权,这将会是一个很好的目标。关于这个问题,刘慈欣老师也提出了自己的分析,他认为AI的威胁分为两类。
第一种,AI会进化出超级大脑,比人脑强百倍,然后AI认为人类已经没有存在的必要了,随手就把人类抹去了。
但是,这种假设它需要超级算力和算法的支持,而人类目前还提供不了。恰恰是人类在AI研发上的“无能”,成为了保护人类安全的最后屏障。
第二种毁灭是糖衣炮弹型的。AI会让我们的生活变得极其舒适,我们愿意把一切都交给AI,心甘情愿地进入科技安乐窝,失去了开拓精神和活力,最后会走向退化和消亡。
不要忘了,我们在《读懂元宇宙》说的药丸,蓝色药丸吃下去会让人感到快乐,但有可能快乐是虚幻的,红色药丸吃下去可以看清真相,但有可能真相会令人痛苦,你吃哪一颗呢?
六、关于未来
总之,人类已经走上了无法回头的道路,凯文·凯利在《5000天后的世界》里提出了“51%”的观点。他认为,科技发展的益处还是比坏处多1%,这1%的益处不断持续,通过复利的方式,最后得到的改善还是惊人的。
凯文·凯利也说,未来的希望是在亚洲,特别是在中国,中国的“硅谷”就是深圳,中国会产生出下一个跟iPhone一样的划时代产品。
那么AI的希望也会在中国吗?
想想我们这一代人,真的不知道是买的什么“门票”出生,能够经历这么多的大事。从改革开放开始,再到互联网革命,手机变成了人身上的一个外挂器官,没多久电动车又取代了燃油车,而到现在AI都有可能会取代人类的工作了。
你方唱罢我登场,经过咱们这一代人不懈的努力,只花一辈子的时间就可以体会到原来几辈子才能尝到的滋味。
那么5000天以后的世界到底是什么样的呢?凯文·凯利判断95%的事物还是和以前一样,但是有5%会发生重大变化,产生出10倍速的变化。
到了5000天以后,AI的时代到来。你直接说一句话:“给我讲一个有趣的科技故事吧。”整个屋子的灯光就会柔和下来,数字人的虚拟形象就会缓缓地在屋角站起,数字人到那时候肯定是非常老款的了,你可以选一个更帅的,还可以让它顺便给你做一杯生椰拿铁。生活中遇事不决,可以上帆书APP,
你用一句话就可以控制一切机器、能量、物质。其实古人已经预言过这种场景了,你念一句咒语“天灵灵地灵灵,太上老君快显灵”,AI就会跳出来完成剩下的工作。
那么,人存在的价值又是什么呢?在学了上文这么多知识以后,我们也在思考AI革命下的终极问题。
人有七情六欲,而机器只能计算仿真;人有梦想激情,而机器只会数据运算。但还不止于此,我逐渐想到,人对这个世界的理解、感受和实践是独一无二的,在这一点上机器只能模拟,无法还原。
在二十年前的一场辩论赛上,有人曾经拿起一朵花来说明美是主观感受,今天再重制一遍,应该犹未过时。
你让电脑来看,这花就是同一朵花,它的数值必然是唯一的。但是在不同的人心中,一朵同样的花,会不会总有不同的感觉呢?
看到花朵,伤心的人会说“感时花溅泪”,高兴的人会说“花儿对我笑”,憔悴的人会说“人比黄花瘦”,而欣喜的人会说“人面桃花相映红”。
有人说,花是有情的,“落红不是无情物,化作春泥更护花”;有人说,花是无情的,“癫狂柳絮随风舞,轻薄桃花逐水流”。
产生认知差异的原因是什么呢?是因为“年年岁岁花相似,岁岁年年人不同”。在客观上是“花自飘零水自流”,而主观上是“一种相思,两处闲愁”。这样的情感和记忆,难道不是独一无二的吗?
不同的人关于花的不同看法,就是王阳明所言:“你未看此花时,此花与汝同归于寂;你来看此花时,则此花颜色一时明白起来。”
人之所以伟大,是因为人是一座桥梁,而非目的。
是人性连接了客观与主观,机器的电路无法代替人性的纽带。
我们恰恰应该在这个时候,热情地去实践,去连接,去感受,在行动中撕掉标签,打破惯性。
“万类霜天竞自由”,让我们积极拥抱科技带来的巨大变化吧,这是挑战,也是机遇。
你可以不懂技术细节,但是要知道发展的趋势;你可以不懂AI,但是要关注它的巨大影响。
随笔/恒之馨(图原创·文整理)