人机交互 动嘴时代来了
2017-09-12

“机器不仅生产产品,它还能说话,能思考。”马云这样认为。

撰文>>>本刊记者 耿秋

 

2017年7月5日,阿里人工智能实验室如约发布了其第一代智能音箱天猫精灵X1,售价仅为499元,并将于8月8日正式发售。

是的,阿里人工智能实验室推出的首款智能语音终端设备天猫精灵X1是一个音箱,却又不仅仅是一个音箱。它内置第一代中文人机交流系统AliGenie。AliGenie生活在云端,它能够听懂中文普通话语音指令,目前可实现智能家居控制、语音购物、手机充值、叫外卖、音频音乐播放等功能,带来崭新的人机交互新体验。依靠阿里云强大的机器学习技术和计算能力,AliGenie能够不断进化成长,了解使用者的喜好和习惯,成为人类贴心的智能助手。

科技发展到今天,人机交互已不再是新鲜事,如今也已进入多通道、多媒体的智能人机交互阶段,而在这个阶段,人工智能也将越来越亲民地走进寻常百姓家。

 

恋上你的贴心

如今,人工智能(AI)已经正式成为主流。行业研究公司Gartner已经连续两年将AI列为第一大战略技术,而各大巨头例如谷歌、IBM、Salesforce和苹果公司等收购AI初创公司的竞赛可谓如火如荼,仅在2016年就有大约40宗和AI相关的收购案。相关研究预测,到2018年62%的大型企业都将会使用AI技术。

相信很多人都还记得电影《Her》中那段奇异的爱情故事。这是一部在不远的未来人与人工智能相爱的科幻爱情电影。主人公西奥多是一位信件撰写人,心思细腻而深邃,能写出最感人肺腑的信件。他刚结束与妻子凯瑟琳的婚姻,还没走出心碎的阴影。一次偶然机会让他接触到最新的人工智能系统OS1,它的化身萨曼莎拥有迷人的声线,温柔体贴而又幽默风趣。西奥多与萨曼莎很快发现异常投缘,而且存在双向的需求与欲望,人机友谊最终发展成为一段不被世俗理解的奇异爱情⋯⋯

这部影片在当年看来,是一部典型的爱情科幻电影,更多的还是在说爱情本身。然而,大部分观众还是记住了善解人意的萨曼莎。影片中的OS系统会根据用户的不同状况和需求做个性化定制,是人根据意识创造出来的基于电子设备的一套程序,通过人的日常行为、生活习惯等大量数据的研究总结出诸如其想做什么、想说什么时会有何表现等特点而编写的智能化程序。

没错,西奥多爱上的正是这样一套程序,确切地说是一种被贴心关爱的体验。这种体验不再是冷冰冰的人机图文对话或者是手动操作,而更像是专属于高等生命体之间的语言与思想的人机交互。

语言是人与人之间最主要的沟通方式,也应该是人与另外一种智能进行交流的主要方式。随着云端一体化带来的高度智能化,消费者倒逼智能终端需要匹配比手机触屏更强大的人机交互方式,而不仅仅停留在简单的交互之上。几年前的科技幻想,在今天强大的云计算时代,正在一步步实现。

搜索引擎如谷歌和必应在语音搜索查询方面已经取得了长足的进步;而Facebook也推出了DeepText来理解和学习每一位用户的对话模式和喜好。与此同时,随着专注于聊天机器人、数字助理甚至致力于社交网络即时通讯的公司呈爆炸式增长,语音接口的发展也是欣欣向荣。

可以说,人工智能正在逐渐贴心起来,汽车的语音控制系统、语音识别文字软件、手机的语音识别功能、家电语音遥控等等,各大商家都在将“贴心”服务尽量做到极致。

 

家庭入口战已打响

事实上,随着天猫精灵X1的面世,一场围绕智能技术、家庭入口的争夺战已经打响。

毫无疑问,巨头们争夺的并非是音箱本身,当前的人机交互方式依然以屏幕为主,但是未来则是一个多通道的交互形式,不需要屏幕就可以与用户进行交流,而人工智能将会渗透进各个物联网设备,万物都可以进行对话。这也就意味着,当初诸多科幻电影里那些会交流、会思考、会看孩子的智能产品终将与人们的生活密不可分。

目前,智能音箱主要应用于智能家居领域,智能音箱以语音交互为核心,正逐步搭建智能家居生态体系,并在电视、路由器等家电设备中广泛使用,正在悄悄实现着智能家居生态体系的第一步。

前瞻产业研究院分析,行业巨头纷纷进入智能音箱领域,究其根本,是看中了语音交互功能带来的互联网服务的变革。另外,智能音箱背后的智能家居市场巨大,预计到2020年,我国智能家居产业规模将达1396亿元,巨大的智能家居市场将引爆我国智能音箱市场。

根据IDC预测,截止到2020年,全球智能设备数量将会达到307.3亿,届时将会有大量的智能设备,拥有与用户进行语音交互的能力,想象空间巨大。

阿里巴巴作为商业巨头,其强大的云计算能力有目共睹,但这几年,都一直在人工智能方面投入,神经网络、社会计算(social computing)、情绪感知、深度学习等领域都有所突破,只不过其强大的商业帝国掩盖住了其在人工智能方面的布局,直至小AI机器人成功预测了《我是歌手》第四季冠军之后,阿里巴巴这个商业巨头才在人工智能方面“秀出自己的操作,爆出不一样的输出”。

有媒体报道,美国新墨西哥州Tijeras市的一对情侣发生了激烈争吵,男主人Eduardo Barros情绪高涨时掏出一把枪指着自己的女友,当时房间中还有女友的女儿。“你是不是电话打给警察了?”Barros端着枪对女友大吼,然而就是男子这句话触发了房间里的智能音箱,自己拨通了911电话,随后警方在电话中听到了争吵的声响,特警队到达现场后控制住了Barros,而女友只受了一点小伤。

显然,该智能音箱拨打报警电话是因为识别的准确度不够高,误认为“报警”这句话是指令。但毋庸置疑的是,智能产品正在被越来越多的家庭所接受。

事实上,是亚马逊的智能音箱Echo掀起的这场新风潮,两年间,它从不被看好到销量千万。巨头们纷纷追赶这人工智能的新“入口”,谷歌Home、微软Invoke、苹果Homepod蜂拥而至。可在国内,一切才刚刚开始,腾讯的“耳朵”正在研发,百度更注重底层技术开发,巨头中,也就阿里巴巴的“天猫精灵”抢到了智能音箱的“第一张船票”,成为中国版的Echo。

 

智能+亲民

“机器不仅生产产品,它还能说话,能思考。”马云这样认为。

在美国国家标准署2016年举办的全球说话人识别竞赛(NIST SRE 2016)中,阿里巴巴以OpenSesame(芝麻开门)为队名,采用了基于深度学习网络的特征提取,借助距离测度学习来提高数据的算法能力,开创性提出利用对称性支持向量机器来提高系统性能,在近200支参赛队伍中,阿里最后的系统性能在大中华区声纹识别性能排第一,美国赛区第二。同时递交了4个相关的专利,这一系统曾受邀在声纹识别顶级(NIST SRE 2016 workshop)作公开演讲。

如今,马云不仅打响了智能音箱战场上的第一枪,同时做了非常亲民的定价。

阿里公众与客户沟通部张启表示,“我感觉现在的天猫精灵有点像2003年、2004年淘宝刚开始发展的时候,一切都刚开始。除了硬件本身,我们还发布了AliGenie开发者平台。可能现在硬件上面的各种功能,大家会看到一些,但是未来好的东西,能感受到服务的东西肯定会越来越多,这跟那个时候的淘宝状态比较像。”

与淘宝的初衷一样,天猫精灵将目标精准地锁定在了家庭用户上,“天猫精灵X1背后的团队在降噪技术上做了大量研究,并专门针对家庭使用场景做了优化。天猫精灵不是在绝对安静的环境下工作的,家庭中有各种各样的噪音,开发人员在厨房、客厅、卧室、书房等环境里面,对玻璃、木材、混凝土、金属、石材等各种材质和环境进行了上千次实验,其中对中国家庭环境大量使用的石材和木头材质进行了针对性的测定,能够适应在家庭环境噪音下进行唤醒;并且具备一定的学习功能,可以根据环境噪音进行学习和进化,适应不同家庭环境噪音,经过7天左右优化,会更加适应所在家庭环境。”阿里人工智能实验室的工作人员表示。

阿里人工智能实验室(A.I.Labs)成立于2016年,负责阿里巴巴集团旗下消费级AI产品的研发。阿里人工智能实验室负责人陈丽娟介绍,对于消费者定位,“三个角色是我们比较在意的,一个是我们这些年轻人,这个群体追求效率爽快,真希望动动嘴就可以实现操作;第二个是小朋友,因为小朋友好奇心非常强,可以让他有一个可以玩的科技产品,但又不带屏幕,这个也是我们非常想要解决的问题;再一个就是对于老年人还是比较方便,老年人很多繁复的操作很难学会,比方手机APP什么的,现在也只需要他动动嘴就可以了。而中国家庭是群居家庭,美国人可能就夫妻俩,所以对于中国家庭来说还是更实用一些。”

陈丽娟表示,天猫精灵X1就是阿里NASA的“航天飞船”,它让阿里开始获得硬件产业的知识与实践,也只有很好的软硬件集成,才能最终实现499元的超低市场定价。而与“航天飞船”的“上天”目标相反,天猫精灵X1的目标是“入地”,通过499元的硬件产品把阿里的互联网产品固定到上亿家庭中。

当然,人工智能的家庭用户固然重要,最重要的还是要和具体产业尤其是传统产业相结合,因为智能化的运用和拓展会带来社会生产方式的剧烈改变,届时会出现诸如智能制造、智能农业、智能国防、智能服务、智能电网、智慧城市、智能家居等新兴产业,这才是真正影响生活和社会未来的方向。