少说三个字母成为Siri近十年来最大的升级
您平时有使用手机语音助手的习惯吗?
作为人工智能技术在我们日常生活中最直观的应用,手机上的智能语音助手总是以一张“人工智障”的面孔出现在我们身边。无论是国外的Alexa、GoogleAssistant、Siri还是国内的小爱同学、小度,它们的智能距离真正的“人”还有很远的距离,这也导致我们在网上发现了很多“玩”的语音助手。让它进入一个有趣的情况,死锁不断循环。
苹果的Siri无疑是“人工智能”领域的“领头羊”。
至于Siri的“智能”,一句话可以概括为“连联通语音机器人都不如”。毕竟连联通的机器客服在听到“机器人”这个关键词后也只会播放语音回复,而苹果Siri则是成语接龙中可以被要求“为所欲为”并进入无限循环的存在。

图片来源:苹果
不过,从其工作原理来看,Siri能够拥有如此“人工迟缓”的表现,其实也是有道理的:Siri是少数几个可以选择不与苹果共享数据,甚至只在本地运行的手机语音助手之一。装置。。这些对用户信息的隐私处理让Siri或许成为“发展最慢”的语音助手——Siri的第一个初始版本诞生于2011年10月,距离诞生已经有10多年了。但就一些冠军爱你的功能而言,Siri所能做到的甚至还不如一些国内公司的“来者”。
不过,对于广大Siri用户来说,未来Siri的使用体验有望达到一个新的高度,因为Siri终于即将迎来“史诗级”升级:
以后使用Siri时,不再需要喊“HeySiri”,只需喊Siri即可。
取消唤醒词有多难?
说实话,取消“嘿”直接“Siri”并不能从根本上解决Siri不好用的问题。无论你如何减少Siri的唤醒词,Siri能实现的功能仍然只有这样:你仍然无法使用一句话。Siri控制两种不同的智能家电,它无法阻止Siri利用网络搜索结果回复你提出的复杂问题,也无法像GoogleAssistant或小爱同学那样帮助你自动接听电话。
但从技术角度来看,取消《嘿》、执导《Siri》背后的技术挑战其实并不简单。
有些人可能认为取消“嘿”并没有什么特别的,甚至还有效减少了Siri识别用户语音所需的时间。如果我们简单地从唤醒词中删除“嘿”,那就非常简单了。但在此之前,我们需要考虑另一个问题:如何保证用户确实需要唤醒语音助手?

图片来源:苹果
听不懂?那么我们就从语音助手唤醒词背后的选择条件开始说起。什么短语可以成为“好”的语音唤醒词?从产品的角度来看,除了易于传播之外,我们还需要考虑两个在一定程度上互斥的因素:容易触发和难以意外触发。
先说第一个“容易触发”的问题。顾名思义,语音助手的唤醒词必须易于触发。具体来说,唤醒词必须易于发音且不易读错。同时,时间也不能太长。最好让用户可以用一句话说出唤醒词和语音命令。
但另一方面,唤醒词又不能太短,更不能是日常生活中经常使用的词。试想一下,如果Siri的触发词是“嘿”,那么高频的误触只会让Siri变得更加难用。更重要的是,触发词必须是“排他性的”,即当用户说出“触发词”时,用户想要并且只想要触发语音助手。就误触而言,亚马逊的Alexa是语音助手的典型代表:
由于亚马逊语音助手Alexa的名字太大众化,加上智能设备的触发灵敏度太高,这些设备会对日常生活中的所有“Alexa”做出反应,甚至会被电影电视剧中含有Alexa的台词唤醒。这也是从唤醒词中去掉“嘿”背后的技术难点:修改唤醒词很容易,但缩短唤醒词后避免语音助手误触却并不简单。
智力的边界在哪里?
当然,也有人认为语音助手不小心碰到了也没关系。毕竟,误触只发生在手机上。只需划掉浮动球即可。但这种情况并非如此。语音助手触发词背后其实隐藏着一个更长远的问题:智能助手的边界应该在哪里?
在各个企业的想象中,智能助手就像一个体贴的“管家”。这在智能家居品牌中尤其常见:作为用户,只要我们说话,家里的电器就会自动工作。如果你在TikTok上看到过“智慧生活”的理念,那么你一定“听说过”这种生活。
但实际上还是需要依靠语音交互智能家居已经是智能家居2.0时代的“过时产品”。在智能家居3.0中,智能助理不再需要你的语音命令来“观察”用户在幕后的状态并

图片来源:VeerGallery授权
“主动”调整智能家居设置。在智能家居系统中,这一特性被称为“不敏感”,即用户不需要给出实质性指令(语音、文字或机械开关),智能家居系统就会根据用户的实际情况主动做出反应。
当技术成熟后,优秀的智能家居系统可以主动识别用户的真实场景。但对于一些关心个人隐私的用户来说,这种被机器、算法、甚至屏幕后面的人不断观察的生活是一刻也不能容忍的。从好的方面来说,这种体验被称为“不受影响”,但从另一方面来说,它就像生活在一面“黑镜”中,是鱼缸里的“人类生活观察样本”。
以本主题中心的HeySiri为例:由于我们只能使用Siri来唤醒Siri,所以这至少意味着两件事:
1.手机一直在录音以响应我的语音唤醒电话;
2.电话录音后,会被处理以了解我所说的话的意思,以及我什么时候想唤醒Siri以及我什么时候在说话时提到它。
与其他智能助手不同,Siri在这里保持了高度的“克制”。即使Siri可以做到刚才提到的两件事,设备端处理机制也保证了录音数据只会保存在手机本地,而不会上传到其他服务器(飞行模式可以证明这一点);另外,本地数据也保存在硬件加密设备中。
但从iPhone4S的长按触发Siri,到后来的语音触发Siri,再到手表的“抬腕”唤醒以及未来的“不嘿嘿直接Siri”,可以预见的是,智能语音助手将进一步走向“不敏感”。前进。至于未来的语音助手能否保持功能与隐私之间的界限,以及绝大多数用户是否担心被“大数据”困扰,此前魅族“San0手机”的市场反应已经给了我们答案。