“小度小度,我想听周杰伦的新歌《等你下课》。” “小度小度,帮我打开卧室的灯。” “小度小度,定一个明早七点半的闹铃。”

和很多智能语音交互产品一样,当你使用搭载DuerOS系统的智能音箱的时候,需要多次这样叫出它的名字——“小度小度”,才能让它更好的为我们服务。但是什么样的名字才是好名字?什么样的名字顺口悦耳人人喜爱?产品经理想叫A,其他同事想叫B,到底应该叫什么好呢?

本篇文章将从数据的角度,科学的告诉你,智能语音交互产品该“叫”什么名字。

一、什么是“唤醒词”以及它为什么重要?

1. “唤醒”和“唤醒词”

在讨论名字之前,我们首先对语音交互过程中的一些定义做一个简单的介绍。

语音交互的过程,和我们平时与人交流的方式非常相似。比如某天中午你正坐在办公室看到窗外阴天,你担心接下来会不会下雨,于是你向正在低头办公的同事喊了一声“小明”,小明听到了抬头看你表示在听,你接着问“今天会下雨么?”小明打开手机查了一下今天的天气预报,然后回答你说“天气预报说下午3-4点有雷阵雨”。

在百度AI交互设计院的研究地图中,语音交互流程被划分为五个环节 – 唤醒、响应、输入、理解、反馈。其中唤醒是每一次用户与语音产品交互的第一个接触点,因此唤醒环节的体验在整个语音交互流程中至关重要,它的体验好坏将直接影响用户对产品的“第一印象”。

我们知道,尽管是“智能”的语音交互产品,机器仍然没有我们人类聪明。对于目前市面上常见的语音交互产品来说,一个眼神或者一个动作还不能引起它的注意,因此需要定义一个将产品从待机状态切换到工作状态的词语,我们称这种词为“唤醒词”。

还记得我们刚刚提到的“问天气”的例子吗?我们通过呼喊“小明”的名字,来引起他的注意,而对于智能语音交互产品,我们也需要通过叫出“名字”,也就是唤醒词来激活设备。以智能音箱产品为例,“小度小度”是唤醒渡鸦raven H的唤醒词,“Hey Google”是唤醒Google Home的唤醒词,“Alexa”是唤醒Echo的唤醒词。

2. “唤醒词”对用户体验的影响

百度AI交互设计院基于大量的对智能语音交互产品用户测试的经验,发现影响语音唤醒体验的因素包含两个维度——输入和输出。输入环节的影响因素包括唤醒词、唤醒方式,输出环节的影响因素包括唤醒响应速度、唤醒反馈方式、唤醒成功率和误唤醒率。为了确定影响语音唤醒体验的主要因素,我们通过问卷调查的方法对其重要性进行了研究。调查结果发现,对于用户来说,唤醒词是语音唤醒输入环节中较为重要的影响因素,且一个好的唤醒词,会直接影响唤醒率。

而目前,关于唤醒词设计的关键因素还未进行科学的研究。鉴于此,本期我们以唤醒词为对象进行研究,希望能够对唤醒词的设计提供理论和数据上的支持。

另外,我们将在后续的文章中,为大家陆续呈现关于影响语音唤醒体验的更多研究,敬请关注。

二、怎样设计一个好的“唤醒词”?

针对唤醒词,我们先后通过以下两个实验进行了研究。

实验一:现有唤醒词组合方式研究

实验二:唤醒词语音要素研究

下面我们对每个实验的结论进行逐一详述:

实验一:现有唤醒词组合方式研究

首先,我们对市场上各类语音交互设备唤醒词的组合方式进行拆解,发现唤醒词均是在一个简单“名字”的基础上加以变化而构成,此外,“名字”本身也具备不同的构成方式。在实验中,我们为用户提供了不同组合方式的唤醒词,由用户根据其个人喜好程度在5点量表上进行评价(1-非常不喜欢、2-不喜欢、3-一般、4-喜欢、5-非常喜欢)。

实验结果表明,不同组合方式下,用户的喜好程度不同:

1)在以“名字”为基础的不同组合方式中,“名字+名字”的叠词式组合方式最受用户喜欢,而“品牌+名字”的组合方式最不被用户喜欢。

2)另外,就“名字”本身而言,“小+字”的名字最受用户喜欢。这点也与汉语人名命名习惯相符,《汉语人名用字的统计分析(郑淑花,2010)》显示,“小”字在人名命名十大常用字之中。

实验二:唤醒词语音要素研究

音节是听觉上最容易分辨出来的语音单位,也是最自然的语音单位,汉字中一个汉字读音就是一个音节,每个基本音节都是由声调、声母和韵母三个部分构成。

理想条件下,我们希望对唤醒词每一音节的声调、声母、韵母进行研究,但是由于音节数的增加,研究变量数将大幅度增长,导致我们无法通过一次实验来完成。另外,通过文献查阅,我们发现人们在起汉语人名时,会将尾音节的发音情况列入考量,同时,汉语人名/宠物名统计研究中也多见其对尾音节发音情况的统计。

因此,综合文献和前文实验的结论,本次实验中我们以唤醒词尾音节为研究对象,选取“小+字”的构词结构,变换尾音节,进行唤醒词的发音偏好实验。同时为避免用户受汉字本身字义的影响,实验中用户看到的唤醒词均为标有声调的拼音。在实验中,我们要求用户根据其个人喜好程度在5点量表上对唤醒词进行评价(1-非常不喜欢、2-不喜欢、3-一般、4-喜欢、5-非常喜欢)。

实验结果表明:

1)声调方面,用户最喜欢阴平(1声);另外相较“仄声”(3声上声、4声去声统称为“仄”),用户更加喜欢“平声”(1声阴平、2声阳平统称为“平”)。

2)声母方面,用户更加喜欢尾音声母为零声母,而包含了z、c、s的舌尖前音最不被用户所喜欢。

3)韵母方面,从韵母发音时的开口口型来看,用户更喜欢开口口型较大的齐齿呼和开口呼;另外从韵母结构来看,音节韵母为单韵母的词最受用户的喜欢。

三、小结

本文主要围绕智能语音交互设备的唤醒词展开研究,从唤醒词组合方式和语音要素两个方面探讨了影响用户体验的因素,我们发现:

1)现有唤醒词组成方式方面:

在以“名字”为基础的不同组合方式中,“名字+名字”的叠词式组合方式最受用户喜欢,而“品牌+名字”的组合方式最不被用户喜欢;

就“名字”本身而言,“小+字”的名字最受用户喜欢。

2)语音要素方面:

声调:用户最喜欢阴平,同时相较“仄声”,用户更加喜欢“平声”;

声母:用户更加喜欢尾音声母为零声母,而包含了z、c、s的舌尖前音最不被用户所喜欢;

韵母: 按照韵母发音时的口型开口情况来看,用户更喜欢开口口型较大的齐口呼和开口呼;另外按照韵母结构来看,音节韵母为单韵母的词最受用户的喜欢。

基于本文的研究,相信你已经掌握了如何构造一个好的唤醒词的方法了吧?以下是我们结合收集的用户自定义唤醒词及本文研究结论,为唤醒词作出的分类,供读者们应用参考。

需要注意的是,本文是从用户视角出发,对唤醒词进行了科学的研究和探讨,但是实际在设计唤醒词时,需要考虑的因素还有很多,如:唤醒词是否过于常见导致语音设备容易被误唤醒,唤醒词与品牌之间是否具有关联。另外,受当前语音技术的限制,现有的唤醒词多以4音节词居多,但未来随着语音技术的进步,唤醒词的长度存在变短的趋势,在设计唤醒词时还应考虑其可优化的空间等等。

特别注明:由于实验设定的条件和样本数量等限制因素,本次实验研究结论或许不能代表所有智能产品用户在家居环境的全部感受,但希望通过我们的研究和探索,可以为语音交互中唤醒环节的设计提供支持和依据,帮助打造自然和极致的语音交互体验。

未来,我们还将继续围绕AI交互设计各个环节、体验要素开展更多研究,不断拓展人工智能交互设计领域的研究地图,也欢迎感兴趣的同学一起交流、探讨。

百度人工智能交互设计院微信公众号:百度AI交互设计院,欢迎扫码关注: