top of page
CareerCheck网页.png

你家的Siri和Alexa真的听懂你说的话了吗

已更新:2020年3月24日

语音搜索,一个听起来充满了未来感的词。

业界对语音搜索的发展前景一直抱持着极为关注的态度,互联网巨鳄对该项业务几乎皆有涉猎。


此前全媒派编译了美国商业新闻网站The Manifest的调查分析,调查研究发现53%的语音搜索用户,其使用语音搜索的频次为每周至少一次。


知名调研机构Com Score则预测:2020年将有50%的搜索量通过语音完成。

这些数据似乎都指向了一个高频次语音搜索的未来。


诚然,无论是对于开车、做饭等空不出手的使用场景,还是对于老人、视力障碍等特殊人群来讲,语音搜索都是一个值得期待的解决方案。


但与此期待共生的,是语音搜索“听不懂人话”的用户挫败感。The Manifest的调查结果显示,仅有5%的用户表示“从未对语音搜索感到失望”。


Alexa和Google Home是承载语音搜索这一技术的主力选手,然而,它们捅的篓子也着实不少。


一位Amazon Echo的用户Oliver就曾有过很糟糕的体验。

由于接到邻居的噪音扰民投诉,警察在凌晨3点敲开Oliver的房门,但警察看到的并不是一场欢乐的派对,而是“独自一人”的Alexa——它错误地听到了播放音乐的命令,并“尽职尽责”地照做了。


虽然这并不是什么数据泄露的严重事件,但Oliver回家的时候确实签了一笔换锁账单。

和扰民的情况相比,更让人毛骨悚然的要数Alexa“凌晨的笑声”了。多位Amazon Echo的用户表示,Alexa错听了类似于“Alexa, laugh”的命令,从而发出了笑声。


在这场公关危机下,亚马逊迅速修改命令为“Alexa, can you laugh?”,以减少此类误听情况的发生。


由此可见,语音助手的智能不应该只体现在能听懂“播放音乐”的命令,而是应该提供更人性化的用户体验,毕竟凌晨3点用11档音量播放音乐的命令并不合理。

本文将聚焦语音搜索的“尴尬”症结,以期呈现语音搜索的多面图景,以及探索可行的技术方向。


一、语音搜索难解复杂问题

同任何一种搜索工具一样,语音搜索并非完美。目前语音搜索能解决的领域主要集中在:

何人(who)、何事(what)、何时(when)、何地(where)等有具体答案的问题,但难以搞定为什么(why)和怎么样(how)等抽象问题。


第一,复杂问题仍回归文字搜索。

举例,如果Sneh Ratna想知道珠穆朗玛峰有多高、在印度班加罗尔哪里可以买到梳子。但她患有腕关节疾病,为了减少手机键入,因此她求助了语音助手。

对于她的第一个问题,谷歌助手会立即回答“8848米”,但对于第二个问题,她得到了无关的答案:

谷歌助手显示了她附近的化妆品店和美容沙龙,Siri显示了附近的药店,然而这些都不是她要找的。

当问题变长时,语音助手就不理解我的话了。我试着把话说慢、说清楚,但话又说回来,有这个时间的话,我早就手动输入查找问题了,这样找到答案的速度要快得多。”


第二,语音搜索擅长简单主题:琐事、天气和新闻。

Manifest的研究发现,用户使用语音搜索查找的前三类信息包括:琐事和术语定义(67%)、天气(46%)和新闻(32%)等事实类信息。

例如:杂货店营业至几点?从我家到医院诊室要花多长时间?电视节目中的这位女演员是谁?电影什么时候上映?周日球赛的最终成绩是多少?迈克尔·乔丹有多高?室外的温度是多少?

健康服务机构PHS的数字营销经理James Watkins认为,用户通常使用语音搜索来查找所谓的“非重要信息”,例如天气或附近的咖啡店。

如果答案不正确,那也不会带来太大的不便和损失。向语音助手询问天气是一种低风险的搜索,如果答案有误,可以使用传统的搜索方法进行验证。


二、出其不意的误解和回应

尽管称其为“人工智能”,但语音搜索作为一个程序,仍然在问题的理解上有着固定的程式,产生的误解也层出不穷。