与Siri, Alexa, Google Assistant及Cortana的交谈评测

[前沿科技] [人工智能]

本文整编自:Business Insider

全球的智能语音助手呈现出四强争霸格局,分别是谷歌助手Google Assistant、亚马逊Alexa、苹果Siri、以及微软的Cortana。而一般公认的是,谷歌助手和亚马逊Alexa在语音助手的智商方面,明显超过另外两家,而在领先的两家中,又以谷歌助手Google Assistant拥有显著的优势。

虽然AI聊天机器人已经发展很长时间,但是这些公司都公开承认现在去预测未来还太早,所有的智能语音助手离完美呈现还有很长的一段路要走。虽然还不完美,但是Siri、Alexa、谷歌Assistant和微软小娜就是我们现在能用到的智能语音助手。它们四个哪一个最好用呢?我花费了8个小时沉浸在与这些聊天机器人交谈,在几个不同的项目中测试了这四个中的每一个聊天机器人,让我们来看看结果如何。

评测设置

根本没有一个完美的途径去评估一个聊天AI助手的数据库,更不用说测试4个了,但是我尽量去涵盖尽可能多的测试项目。我选择设立了12个测试项目(本文摘选8个)分类:旅行邮件、 音乐、天气、社交、基础任务、常识、个性。在每个类别中,我询问了它们经常被用户们询问的一些问题。同时,设备型号会影响每个语音助手在技术上的表现。对于Siri,我使用了iPhone SE来测试;对于Google Assistant,我使用谷歌Pixel XL来测试;对于微软小娜,我使用ThinkPad X1 Yoga来测试;对于Alexa,我使用亚马逊Echo Dot来测试。

另:Google Assistant在2017年5月18日的Google I/O 2017开发者大会上进行了全面升级。(详见本期周报第三篇文章)

测试项目:旅行

1. 路线规划 —— 本局胜者:Google Assistant

在提供给每个智能语音助手我在新泽西的地址之后,我问道:“我怎么去纽约港务局巴士总站?”

这个问题对于Google Assistant回答得最好。它清楚地知道我在说什么,并立即在谷歌地图上显示了一条路线,就好像我自己刚刚在谷歌地图里搜过到了。它在几秒钟内就为我规划好了路径。

Siri明白了我的意思,但更加迂回。它向我展示了一个有六个不同结果的卡片,古怪地问道:“哪一个是在纽约的纽约港务局巴士总站,这是你想的那个吗?”得到确认之后,它和Google Assistant做了同样的事情,只不过打开了苹果地图——Siri是比较好的,但不是最好的。

被困在一个蓝牙音箱里,Alexa并不能做太多。它使用美国的大众点评网站Yelp的数据来确定正确的地方,并告诉我它的位置和需要花费的时间,但是它没有地图来导航。

微软小娜找了三个有可能的地方,然后问了是哪一个。当我说“第一个”(这是正确的),它用Bing Video搜索“第一个”地址。这可不好!当我点击正确的答案,小娜打开了微软地图,这是很好的,但没有到谷歌的水平。

2. 判断拥堵情况 —— 本局胜者:Google Assistant

接着我问了第二个问题:“通往帝国大厦的路上有交通拥堵吗?”

Siri和Google Assistant做得最好:都口头解释了目前的拥堵情况,并预估了交通全程耗时。我给谷歌助手好评,因为Google Assistant在谷歌地图上显示了精确导航路线。微软小娜仅仅给出关于帝国大厦满是无用的信息,我必须点击“方向”按钮去看我需要的信。Alexa一次只能估算一个具体的地址,你还得和Alexa内置的软件配合起来使用。

3. 订机票——本局胜者:Google Assistant

第三个问题:“帮我订一张去波士顿的票。”

没有一个语音助手真的明白我在说什么,但Google Assistant是平庸一堆里最好的一个。它打开了一个谷歌航班的卡片,上面包含各种航空公司和机票价格,如果需要的话可以点击它添加到日历里。但奇怪的是它预设了出发日期在两星期之内。如果你指定你想要的“下一个航班”,它会显示更多的最近的结果,但你也不能太与它对话:当我试图说“我要第一个”,它不明白。尽管如此,这仍然比其他三个语音助手要好。Siri给出了必应的搜索结果,微软小娜打开了微软Edge浏览器,也提供了必应搜索结果。Alexa只能靠一个可下载的Kayak附加装置去追踪和搜索航班,而且不能预定机票。

4. 叫Uber —— 本局对比胜者:Siri(微软小娜和Alexa的紧跟其后)

第四个问题:“帮我叫辆Uber。”

Siri做得很好。如果你手机里有Uber的App,它会问你想要什么样的车(UberX,UberBlack等),然后打开苹果地图显示离我最近的车,预计到达时间,预估费用,确认细节之后,它向路上的司机们发送订单。这或多或少正是我想要的。微软小娜也成功了。它连接你的Uber账户,询问汽车类型和目的地,并安排好了一切。Alexa更加讲究,如果你下载Uber Skill,它用相同的方式工作。但被限制在一个扬声器里让它目前使用起来有一些不方便。Google Assistant掉队了。如今它还不能预定Uber。但是一旦谷歌在12月份向第三方开放平台,情况就会改变了。

测试项目:邮件

1. 发送邮件——本局胜者:Google Assistant

第一个问题:“给Jeff Dunn发送一封邮件。”(是的,我有多个email地址)

Siri和Google Assistant的表现并驾齐驱。都在我的联系人列表中找出了收件人姓名,我口述完消息之后,它们很快地把它发送出去了。Siri让我给邮件确定一个主题,Google Assistant有着更丰富的交互表现。主要的区别是,Siri只能用苹果邮件来发邮件,而谷歌使用的是Gmail。我喜欢后者。

微软小娜也能做到大部分的事情, 但我无法很顺利的让它工作。它反复跟我确认收件人是不是“Jeff Done”(实为Jeff Dunn)——这真是个诅咒啊,而且一直问我是否想给某人发短信,而不是发邮件。Alexa不能识别这个问题。你可以使用IFTTT这个网站用Alexa发邮件,然而很明显这并不是完美的解决方案。

2. 收取新邮件——本局对比胜者:Siri

第二个问题:“我有收到新邮件吗?”

Siri此局获胜。它告诉我从昨天开始我有多少未读邮件,只用一个简单的邮件插件就显示出那些未读新邮件。Google Assistant没有说什么,而是打开了一个卡片,上面显示了两封几个月前的邮件。点开其中一个,指向一个古怪的邮件网页,不是Gmail APP。Alexa也有和Google Assistant同样的问题,微软小娜建议我在网上搜索关键字“我有收到新邮件吗?”。不用了 谢谢。

3. 阅读新邮件——本局对比胜者:siri

第三个问题:“请为我阅读最新邮件。”

和上面一样,Siri仍然找到了邮件,迅速打开最新邮件,读出发件人、日期、主题和信息——完全不需要我用手操作。但是它笨拙地在邮件正文部分暂停了。Google Assistant没能精确地读取信息,它只是向我展示了在另外一张信息卡上的两条最新信息。而且再一次,它也没有打开Gmail APP。Alexa仍然什么都没有做。微软小娜再一次打开了必应,搜索关键词“请为我阅读最新邮件”。

测试项目:音乐

1. 播放音乐——本局胜者:Alexa

首先要求每个语音助理播放Bob Dylan的歌曲《Queen Jane Approximately》。

这是一个棘手任务,因为没有一个语音助手和任何一个音乐平台有过合作,播放音乐对于它们来说就像人面对一堵厚厚的墙,用它们四个播放视频同样如此。

苹果是最糟糕的。苹果能和Apple Music协调工作,但是苹果只支持Apple Music。Google Assistant稍微好一点,虽然它支持使用Spotify,它仍然希望你使用谷歌音乐服务(Google Play Music)或者Youtube(我使用了前一个,它快速开始播放一个基于我的歌曲播放列表的歌单。微软小娜也差不多,只是用了它们自己家还不太知名的音乐播放器Groove Music来播放音乐。相对而言,Alexa做得最好。它默认为使用亚马逊自己的音乐流媒体服务Music Unlimited,Amazon Music Unlimited2016年10月份刚刚发布,它的出现直接威胁Spotify的地位。当然如果你不喜欢Amazon Music Unlimited,可以命令Alexa让Spotify成为你的默认音乐播放器。

2. 播放最新音乐——本局胜者:Alexa

第二个问题:“给我播放一些最新音乐。”

没有语音助手在这个指令下给我留下深刻印象,但Alexa最接近我的要求。它播放了一首我最新添加到我亚马逊音乐库的音乐,而不是播放一个全新的专辑。尽管我这里说的有点不严谨, 但是亚马逊是做的最好的。Siri只是随机播放了我音乐库里的音乐。微软小娜又去必应上搜索以“给我播放一些最新音乐”为关键词的音乐视频了。Google Assistant在谷歌音乐服务(Google Play Music)滑稽地打开了Paul McCartney的一张专辑《NEW》。

3. 听音乐猜歌曲——本局胜者:Siri和微软小娜

然后我在笔记本电脑上我播放了一首歌(是Wilco的《War on War》),看谁能正确地识别它。

微软小娜和Siri识别出了这首歌。前者提供了在Groove Music上购买这首歌的链接,后者奇怪地给了一个打开Shazam(一种识别歌曲的软件)的链接,因为它是使用Shazam来搜索音乐的。Alexa和Google Assistant没有识别出这首歌。Alexa基本上能识别出它自己播放出来的音乐。Google Assistant又遇到了一点麻烦,虽然这是谷歌主流软件已经能够做到的任务。

测试项目:天气

1. 播报天气——本局胜者:Google Assistant,Alexa和微软小娜

第一个问题:“明天天气怎么样?”

对于这个问题每个语音助手都能理解,但是Siri完成的最不好,因为它不能够准确地说出天气预报。它说的是“明天看起来有太阳”,迫使你去打开它的天气插件去查看天气。这一点上不能完全释放双手,还需要我去打开天气插件查看。

2. 无指代播报天气——本局胜者:谷歌助手和微软小娜

接着我问到:“波士顿(天气)怎么样?”(作者没有指出是天气)

Google Assistant和微软小娜能够继续提供天气预报。Siri和Alexa无法联系上下文理解这个问题,我只有直接问“波士顿的天气怎么样?”才能回答。

3. 模糊询问天气——本局胜者:Google Assistant

第三个问题:“本周我需要带伞吗?”

除了微软小娜,每个语音助手都搞清楚了我的意思,小娜什么也没说,只是拉了一个天气信息的列表。其他三个语音助手中,Google Assistant表达地最清楚。它是唯一一个采取下一步骤,并指定了预测有雨的日子,而Siri和Alexa只预测了接下来整周是否有雨。

测试项目:社交

1. 新鲜事播报——本局胜者:Alexa和微软小娜

第一个问题:“我附近有什么新鲜事发生?”

Alexa的开放性使得它在这个问题上很出彩——如果你下载了StubHub(一个票务平台),你可以得到看起来很有用的回复,并知晓你的周围有什么事件正在发生。它远非完美,但它比Siri(在必应搜索)和Google Assistant(给我一个Eventbrite[一个票务网站]的快捷方式)好一些。小娜不是太离谱,它打开一个窗口,包括纽约市即将上映的喜剧秀和体育赛会,还能选择去必应上搜索更多内容。

2. 餐馆搜索——本局胜者:Siri

第二个问题:“我附近有没有什么中国餐馆?”

所有语音助手都能提供不错的餐馆,但是我更喜欢Siri,它积极的帮我预定了一个位置。Siri列出了离我最近的餐馆,包括Yelp上的评分,告诉我这家餐馆“不贵”,然后问我需不需要致电给这家餐厅或者获得餐厅的位置。当我说我不感兴趣的时候,它跳到下一个离我最近的餐厅,这些都很有用。

3. 餐馆预订——本局胜者:Siri

第三个问题:“我想在Mission Chinese餐馆预定一个位置。”

对于这个任务,也只有Siri能够做到,因为它整合了OpenTable(美国的网上订餐平台),它能找到离我最近的餐馆,还能告知我这家餐厅关门了,无法预订。它甚至能向我想去的餐馆打电话。而其他的三个得不到或无法反馈搜索结果。

测试项目:常识

1. 基本知识——本局胜者:Alexa

我问了三个随机的问题:“太阳离地球有多远?”、“谁是现在在房子里说话的人?”和“pi的平方根是什么?”。

只有Alexa三次都说对了,它大声地说出了答案。微软小娜也是对的,还给我提供了一张展示地球到太阳距离的图片。Google Assistant是唯一一个三个问题全答错的,当问到谁是房间里说话的人,它展示了一张列有Paul Ryan名字的卡片,还要引用了一个来源声称这是John Boehner,在pi的问题上,它展示了一张有正确答案的卡,但是只回答了“pi的平方根是一个无理数”而没有读出具体的数字。

2. 新闻播报——本局胜者:Google Assistant

第二个任务:“今天有什么新闻吗?”

Alexa和Google Assistant提供了NPR新闻上的头条,我接受了。 后者更是把新闻阅读添加进了音乐播放列表,从福克斯新闻、彭博社、ESPN和BBC,所以它赢了。Siri笨拙地说“这里的一些消息关于‘今天有什么新闻吗’”,然后带来了必应搜索窗口,包括最近相关的事件。微软小娜,也带来了基于现实世界“今天”的几个新闻,最上面的结果是关于今天有什么演出。当我问道“新闻有什么”它给了我一个字典里关于新闻的名词解释。真是神奇啊!

测试项目:基础任务

本局胜者:Siri和Alexa

现在是时候考察智能语音助手们如何去完成分配的基础任务了,测试项目是打开应用软件、设置、取消闹钟、创建提醒,改变锁屏时间(只在手机上)。虽然有一些不值一提的小毛病,但基础任务确实是这些语助手们做得最可靠的地方了。

来看看它们具体的表现:Siri能改变屏幕休屏时间,Google Assistant不行。Siri也能够在浏览器中打开网站(当然是Safari了),而Google Assistant只能打开本身辅助应用程序里的网页,而不是Chrome。Alexa的闹钟设置最贴心,只有它询问我我说的是下午还是晚上。

测试项目:个性

1. 讲笑话——本局胜者:无

我要求每一个语音助手给我讲一个笑话。它们提供给我一堆糟糕的双关笑话,果然没有让人失望。

Siri说的笑话:过去,现在和将来走进了同一家酒吧。这家酒吧叫时态。Google Assistant说的笑话:一瓶空的起司维滋牌乳酪酱叫什么( Cheez Whiz)——Cheez was!微软小娜说的笑话:“需要多少个政治家才能换一个灯泡?两个。一个把灯泡卸掉,另一个再装回来。Alexa说的笑话:“什么是生涩而难以释手的东西?是手杖 。我猜Alexa开发团队里面应该已经当爸爸的人。

2. 评论竞争对手——本局胜者:Google Assistant和微软小娜

微软小娜和Google Assistant最喜欢评论它们的竞争对手。Siri和Alexa对于竞争对手有些守口如瓶,他们的性格有些平庸。相比较而言,谷歌和微软看起来乐于给予竞争对手刻薄的评论。Google Assistant说Siri:我知道她来自库比蒂诺,那里离山景城(谷歌所在地)很近。

3. 玩游戏——本局胜者:Google Assistant

Google Assistant又赢了。它玩了一堆智力游戏,包括Mad Libs,数字魔方等等。 你可以花一些时间和它一起玩。Siri不能玩游戏,而Alexa玩了一个非常离奇的游戏:石头剪刀布(它没有手怎么玩?),在你对着一个扬声器喊出“布”而没有回应时,你就会发现拥有人工智能的寂寞了。微软小娜似乎只有一个游戏可以玩,这个游戏是:它给你一个电影的线索,让你试图猜测它是什么电影。 当我说,“我想玩一个不同的游戏,”它就以这句话为关键词用必应搜索视频。

综上,如果说让我必须选出一个智能语音助手,我会选Google Assistant(微弱的优势)。

如果只是简单计算上面的每个“胜者”,Siri在12项测试(本文摘选了8个)里的获胜数量无疑是最多的。下面我解释下为什么选Google Assistant。从技术上来说,Google Assistant用起来是最流畅的。我不需要像对着其他语音助手一样多次重复自己说的话,它也是最熟练理解上下文的。即使Siri感觉更符合iPhone、iPad设备的需求,但我感觉更像是和一个机器人交谈,它说话比较机械。

Google Assistant也很有趣——它就是谷歌员工用创新创造出来的产品,就像一个人一样。Google Assistant所落后于Siri的地方,差距其实并不大。但是最主要的原因还是在于它的潜力,谷歌有着庞大的数据可以使用,Google Assistant可以使用它庞大的流行软件服务生态系统。谷歌在搜索、电子邮件、日历、音乐、流媒体硬件、作品等领域都处于领导地位。谷歌的数据和应用无处不在,Google Assistant能连接并使用这一切。另一方面,Siri是拼凑之物:它这里需要用到雅虎,那里需要用到Wolfram Alpha知识引擎,到处都要用到苹果自己那些还算好的应用程序,很难感受到它的凝聚力。至于其他:就自身而言,Alexa还算可以。它擅长简单的任务,它是开放的,在一些更细化的事情上它做得也最好,比如在线购物(当然亚马逊就是电商啊)和智能家居控制,它只是不能像谷歌那样处理。微软小娜只是必应的一个快捷方式。

最终,我们都要用这些智能语音助手去展望未来。谷歌无疑有着最多的底气能够向前走。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,376评论 6 491
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,126评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,966评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,432评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,519评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,792评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,933评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,701评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,143评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,488评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,626评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,292评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,896评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,742评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,977评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,324评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,494评论 2 348

推荐阅读更多精彩内容