上一篇我们简单复盘了下AI基础,基本功这就算打下了。在第二篇的时候我们聊到,因为种种原因,对于企业的AI大模型落地,相比在使用第三方服务上我们会更倾向于使用开源大模型。那么我们今天起了一个篇幅来介绍并不开源的chatgpt?起初小马是并没有把关于chatgpt的介绍放进大纲规划里的,因为它太风靡了以至于互联网上已经有了太多关于它的资料。但也正是因为如此,不得不从它说起。
2022年的时候小马有幸参与调研智能问答的实现,那时候选定的还是利用向量知识库匹配,知识图谱等诸如此类。2023年初,chatgpt一夜之间风靡全球,业界有人称之为“ChatGPT革命”。自然原先的问答方案被推翻洗礼,从熟悉chatgpt到开源大模型的落地应用,chatgpt算是启蒙也是灯塔,chatgpt涌现的能力有力见证了大模型的可行性和无限性,可以算是当今“百模大战”的导火索。
再科幻一点。大家还记得有一部影片叫做《头号玩家》吗?都说其是元宇宙的经典阐述。那么如果元宇宙是一座房子,AI将是可信赖的看门人,始终确保一切顺利进行。实际上,元宇宙中的AI让元宇宙中的NPC更加聪明,使它们能像真人一样在元宇宙中活动。那么chatgpt能写小说吗?能写文案吗?能对它培养感情并爱上你吗?能角色扮演吗?
如果经常刷某音或者微信某某号的小伙伴应该也能感受到了近来多了很多售课的,对于AI大模型的教程还好,那有些号称拥有最高级别的大模型能力,其实有些可能就是gpt大模型api的基础能力简单套壳,笔者这里说的是“有些”,当然也不乏一些优质的服务提供者。看完本文,也许豁然开朗。
一、体验一下
先从体验例子入手,其实这些互联网上已经很丰富了,简单列几个感受下。
通俗地讲,就是能写代码,改BUG,写文案,写邮件,做题,仿真人对话聊天,知识问答,写歌,写诗等等。这只是最基本的能力体验,多模态功能上线后,OpenAI让ChatGPT能说话、会看图。诸如 GPT-4多模态使得它具备看、画、演、听、说等能力。Chatgpt的多模态处理能力包括图像文本生成、音频文本生成、视频文本生成等。9月20日,OpenAI宣布了其AI图像合成模型的最新版本——DALL-E 3。这款模型以ChatGPT为基础,能够根据复杂的描述渲染出图像,并处理图像中的文本生成(如标签和标志),突破了早期模型所面临的挑战。GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。
甚至,我们可以仅利用其基本的文本聊天能力和各种软件结合也可以实现多模态效果和在其他各种场景下的丰富玩法。最经典的就是chatgpt+Midjourney来AI作图,由chatgpt负责生成提示词,Midjourney负责根据提示词AI作图;再比如chatgpt结合langchain agent可以让AI具有决策能力。
当然,它也是有缺陷的,比如经典的“林黛玉倒拔垂杨柳” 以及它的数学能力其实是很差的(这点和它的原理有关,后面会介绍)。
百闻不如一见,想要体验的话也很简单,只需要注册一个openAI账号即可,免费体验。之前小马有简单整理了份指南,可以看这里。当然当今市面上一搜便是有很多的免费套壳站点,只是体验一下的话也勉强够用,但大多不稳定。至于付费的呢,大多封装官方的api,如果图方便直接消费即可,也不失为一种快速体验的方案。