AIGC的来临,对于各行各业都带来了翻天覆地的变化。产品人非常兴奋,将会带来非常多的机会,心里想着又可以改造一遍世界了。技术人普遍焦虑,变化太快怕追赶不上,安全合格带来诸多风险因素。不管怎样,AIGC的的确确给大家带来了非常大的影响。
最近与几位朋友交流,谈到了AIGC的几大趋势,在此做个简单记录,不成熟,希望对大家有用。
整体来说,按照AIGC三层架构,底层算力、中层模型、上层应用的分类,核心还是在上模型层和应用层,底层算力在此就不再探讨了。
先看看中层模型的2个方面:
首先中层模型之融合多模态MLLM。之前只有LLM,现在逐步增加了图片、视频等,当多种媒介做为训练数据集产生融合多模态的大模型时,不管是性能、逻辑上能力都会大大提升,也会更懂人类的需求是什么。人类的需求本身就是综合的,一个场景会涉及多个模态的组合,最终生成一个结果。以多模态的方式解决人类需求将大大提升质量和效能,也会更懂人类,更符合人类的预期。
其次是中层模型之SFT。我理解本质上是人类反馈中强化学习(RLHF),即通过SFT+RM不断训练得到最优模型。引申开来也可以用来基于大模型和专业的行业资料数据训练专业的小模型。大模型具备通用性、普适性,但在专业领域表现不尽人意,专业上会有明显的短板,主要原因是专业知识的语料中是不具备的,都在某些行业巨头的内网里(安全等因素造成的)。目前在提供了相应的接口的情况下,将专业领域资料接入私有化的大模型中训练专业模型,为某个行业服务,提升专业知识的可用性,这个非常有价值和前景的。
接下来看看上层应用的3个方面:
首先还是说一下大家都感受到的变化,就是交互的优化。以往系统需要人工操作,繁琐、工作量大、容易出错,有了AIGC的加持,原来需要手工录入的十几及至几十的步骤,现在一个ChatGPT交互就搞定了。确实会给大家带来非常大的便利,在体验方面可以说是革命式的,具体什么时候真正应用到各产品,取决于各软件厂商的跟进落地。谁跑的快,谁就可能会赢得更多的客户。
其次是Plugins,交互方面得到大大提升后,如何快速的将软件应用服务于客户,避免让操作者在繁多的软件之间切换,真正体现统一超级体验,最终需要靠Plugins。如果说Plugins是一个未来的生态框架,那后续整个生态的建设就是最终的结果,真的能建立起来,在超级体验和智能的前提下,改变世界梦想是有可能实现的。
最后是MLLM的场景融合应用,交互体验发生了变化,生态框架进行了重构,最终解决人类需求的就是多模态组合的成果生成,只有真正做到融合,才能完整的解决客户的一个一个客户需求,才能达到终极的目标,不仅仅是对话、文本、还有图片、视频、推理等。
通过3类上层应用的不断发展,有些场景将可以得到创新,比如说通过ChatGPT进行高效交互,然后通过Plugins进行任务编排,生成串行或并行的任务流,达成最终完成复杂需求的目标。用户体验极简、Plugins编排逻辑丰富、软件功能强大、算法模型专业化、底层通用模型普适性强,基于这些变革时代将真正来临。
我想信,通过上述不断的创新和演进,最终就会达到陆奇说的从信息系统到模型系统到行动系统的真正构建,实现从信息化到知识化到自主化的演进,让我们拥抱AIGC,积极探索、积极创新,改造世界。