计算机自动问答领域,问题被归结为7类
WH单词(WH words)
what/when/where/which/who/why/how
why和how问题比较难以解决
决定“该说什么话”,才是对话系统的核心
当前最核心的对话管理方法,有且仅有一个:填槽,即Slot filling
意图识别-实体提取-填槽
逻辑影响实体&意图,难以判断
指代/歧义,需要常识/背景知识
填表-表是人提前设计好的,不能运行中变化
人们对话的本质是思维的交换
人们用语言来对话,其最终的目的是为了让双方对当前场景模型(Situation model)保持同步。
对话是思想在低维的投影
影响人们对话的,光是信息(还不含推理)至少就有这三部分:明文(含上下文)+ 场景模型(Context)+ 世界模型。深度学习只能处理基于明文的信息
深度学习无法实现真正的智能(AGI)的本质原因:不能进行因果推理
两个系统来处理:
系统1是快思考:无意识、快速、不怎么费脑力、无需推理
系统2是慢思考:需要调动注意力、过程更慢、费脑力、需要推理
系统1先上,遇到搞不定的事情,系统2会出面解决。
系统1做的事情包括: 判断两个物体的远近、追溯声音的来源、完形填空 ( "我爱北京天安 " )等等。
若事物违反了系统1所设定的世界模型,系统2也会被激活。
人是可以通过训练,把部分系统2才能做的事情,变成系统1来完成的。
Yann LeCun的观点:“A learning predictive world model is what we’re missing today, and in my opinion is the biggest obstacle to significant progress in AI.”
对话产品感觉用起来智障,都是因为想跳过思维,直接模拟对话
to C的助理产品做不好,是因为解决不了“如何获得用户的世界模型数据,并加以利用”这个问题
to B的对话智能公司为何很难规模化?(因为场景模型是手动生成的)
我们需要的是对话系统后面的思考能力,解决问题的能力
存在即为被感知
To be is to be perceived.
----George Berkeley
https://mubu.com/doc/explore/10756
https://mubu.com/doc/explore/16246
https://mubu.com/doc/explore/15987
工业革命给人类带来的巨大价值在于解决“重复体力劳动”
从重复的体力,逐步到重复的脑力
经济学家Tyler Cowen:什么行业的就业人越多,颠覆这个工种就会创造更大的商业价值。《Average Is Over》:
20世纪初,美国就业人口最多的是农民;二战后的工业化、第三产业的发展,再加上妇女解放运动,就业人工最多的工种变成辅助商业的文字工作者比如秘书助理呼叫中心(文员,信息输入)。1980/90年代的个人计算机,以及Office 的普及,大量秘书,助理类工作消失。
对话智能类的产品最核心的价值,是进一步的代替用户的重复思考。
尽量去代替用户系统2的工作,而不只是系统1的工作。
先解决思考的问题,再尽可能的转化成语言
我是谁,想去哪里,怎么去
自我-目标-路径
范式转换 paradigm transition
模型、工具:前人的套路,观察世界的方式