新数据集:为科学而献身,真人成为私人助理应用
... AI研究人员希望搭建出下一代个人助理应用,但对于这些系统应如何与人们进行互动,仍是个悬而未决的问题。现在,微软放出了一个新数据集,旨在提供一些关于人类和机器如何共同合作来解决信息搜索问题的数据。
...数据集由22对搭档(提问者和回答者)组成,每组花大约两个小时来完成一系列信息搜索任务。提问者无法访问互联网,但可以和能访问互联网的回答者说话。提问者询问一些预先分配的问题,比如我想读有关HPV疫苗的资料,从哪里可以获得?我想在三个月内不用自己开车,尽可能多地在美国旅行,这样公共交通的最佳路线是什么? 而回答者要扮演一个真人版Google Now / Cortana / Siri (你说什么我好像不明白),用浏览器查找更多信息,在必要时可以向对方澄清问题。这个人与人之间的数据集,是为了获得当人们尝试得到问题答案时的一些稀奇古怪的方法。
... 完整数据集: Microsoft Information Seeking Conversations (MISC)
...更多信息:MISC: A dataset ofinformation-seeking conversations.
本周数字:80 EB (1EB = 10亿 GB)
...这是中国当局与参与了在福州进行的大型数字医药项目的公司,一起共享的心脏超声视频数据集的大小。(作为比较,2014 ImageNet比赛数据集大小约为200吉GB,0.2TB,0.002EB)。
...阅读更多关于中国如何利用大量数据来刺激其AI经济, 彭拜新闻: China’s Plan forWorld Domination in AI Isn’t So Crazy After All
本周特别数:450万:
...这是在克莱姆森大学和埃塞克斯大学研究人员刚刚公布的数据集中的演讲记录的数量。数据集涵盖了1919年至2013年在爱尔兰议会上发表的讲话。
...这些数据集可以开发出很多很棒的东西。比如说,研究人员试图通过分析议会中的发言,预测爱尔兰财长的政策立场。还可以尝试用这个数据集来分析某个时代所有发言人的发言,然后模拟出他们随着时间立场的变化。作为彩蛋,试试训练一个自己来产生爱尔兰政治辩论的语言模型?
...阅读更多: Database ofParliamentary Speeches in Ireland (1919 – 2013).
成长中的 Amazon Web Services AI云:
...AWS作为目前最大的云计算服务,亚马逊正开始在其中许多服务中实现机器学习功能。最新消息? Macie可以搜索存储在AWS上的文件,使用机器学习以半监督的方式查找敏感数据(如个人身份信息,知识产权等)。
...更多关于亚马逊Macie。
重要的是AI,不是外壳:
...一家中国公司最近发布了Eufy,一款运行亚马逊 Alexa 操作系统的冰球型智能音箱。亚马逊正在鼓励大家开发各种可以连接到自己的Alexa AI服务的硬件,这显然是因为亚马逊认为其基础的AI软件才是战略性的,而硬件(像自己的“Echo”系统)只不过一个外壳。
...更多:This company copiedthe Amazon Dot and will sell for less – with Amazon’s blessing.
Psycho (Digital) Filler,这是啥?
...谈话节目主持人大卫·贝恩认为,技术正在使我们每个人都更加孤独还有高度自动化了,通过在日常生活中用机器替代人类 (如ATM机对出纳员,自动驾驶软件对司机等等)。
...“人类的随机事故和奇怪的行为很有趣 - 这使生活更愉快了。 我想知道当人际交往越来越少时,会留下什么。 当把人类从一切等式中抹去之后,可能我们就不再是完整的人类和社会了,“他写道。
...阅读更多:Eliminating the Human
Google展示了更好预测网络广告点阅率的方法:
... Google是一家主要业务是广告业务的AI公司。因此非常值得注意,该公司发布关于这两个领域交叉的论文。这篇论文定义了一种新的AI技术,可以非常好地预测给定的广告的点击率。 (要理解这个研究课题对Google的业务有多重要,我们可以将这篇论文视等同于Facebook发布一项研究,能更好预测好友进行哪些行为,可以将休眠帐户变成活跃帐户)。
...本文概述了“Deep & Cross Network(DCN)模型,可以实现同时对稀疏和密集输入的网络级别规模的自动特征学习”。这是一种新型的神经网络组件,能够更好学习广告公司感兴趣的更好更简单的行为模式。“我们的实验结果表明,通过交叉网络,DCN具有比DNN有更低的损失,而且参数也少了几乎一个数量级”他们写道。
...效果如何?在测试中,DCN系统获得了最好的成绩,同时比其他系统的计算效率更高。 “DCN大量优于其他所有型号。特别是,它胜过最先进的DNN模式,但仅使用DNN中消耗的内存的40%,“Google写道。该公司还对非广告数据集进行了DCN系统的测试,在这些领域也表现出非常强劲的表现,这意味着该方法的通用性。
...阅读更多:Deep & CrossNetwork for Ad Click Predictions.
AI安全研究的投资组合:
...如何防止一个幻想的未来超级智能将整个已知宇宙变成小小的,层层叠加起来的抽象的梦呢 (吐槽黑客帝国)? AI安全! 看法是,如果现在我们开发更多的技术来使智能系统更安全以及具有更多可预测性,那么我们就有更大的几率确保,我们能生活在一个和机器友好共存的社会,并且可以模糊理解它们。
...但是,如何实现呢? DeepMind AI安全研究维多利亚·克拉科夫纳有些想法,简单说就是“不要把所有的鸡蛋放在一个篮子里”,她在一篇博文中概述了。
...阅读更多在: A portfolio approach to AI safety research.
英国诺丁山狂欢节中脸部识别的应用:
... 英国的几大都市将会在本月进行大范围的脸部识别测试,如最近用这项技术来监视伦敦诺丁山狂欢节街头聚会的狂欢者们。期盼能看到ML算法被烤鸡头,红条纹饮料罐,还有自拍用的智能机搞得傻傻分不清。
...阅读更多:Met police to use facial recognition software at Notting Hill carnival.
自动化与政治的关系,美国共和党人比民主党人接近机器人:
...布鲁金斯学会从国际机器人协会的数据中找出了美国部署工业机器人的地方。结果重点强调了技术的分布不均匀。
...机器人最多的州:密歇根州,约28,000台,占美国全国的12%。
...最令人惊讶的是,机器人的分布是否能让我们预测某些政治局势吗?有可能!布鲁金斯写道:“十一月投票选举特朗普的红色州的机器人数量,是投票支持希拉里的蓝色州的两倍多。
...阅读更多:Where the robots are.