语音交互启蒙篇-行业资讯-UICN用户体验设计平台

恭喜你成为UI中国推荐设计师（详情）

快速搭建网站

查看全部热门榜单

全部

常用搜索：作品集 AE ui设计 aigc icon logo app

您的意见是我们 UI 中国进步的动力！

点击立即反馈按钮，发表您的意见！

立即反馈

QQ群反馈

您也可以加入UI中国官方反馈群进行反馈！

群号：302892100

备注：反馈问题后@管理员能让我们及时了解您的意见

提交需求

赛事与广告咨询合作，请填写需求表单，我们会在第一时间与您联系！

0/20

0/200

设计大赛

设计大赛
发布广告
发布招聘
其它需求

取消发送需求

提交完成
感谢您对UI中国的支持和信赖！

我知道了

语音交互启蒙篇

0.0°

2018-04-25 原创文章 行业资讯 举报 1853 2 2 0

橙芝儿关注

2018年的3月，小米，百度等多个公司发布智能音箱产品，小爱音响mini、小度在家、豹豹龙……可见智能音箱产业链这一年来的发展之快。随着智能音箱、智能家居等智能硬件的普及，语音交互热度也不断飙升。

Image title

△ 语音交互设计（Voice User Interaction Design)：它是一个以用户心理模型为中心的设计过程，交谈式为核心的交互设计。

本文内容为语音交互启蒙篇，不含详细设计原则和方法。

︱一、语音交互的优势

如今，我们熟练并习惯用手指进行触控交互，那么为什么要在现有的交互方式上增加语音交互方式呢？对于这样的疑问，其实主要是语音交互有一些很重要的优势，包含以下几个方面：

1.输入效率高：百度、斯坦福大学和华盛顿大学，曾共同完成了一项与智能手机输入方式对比的相关研究。研究结果表明：智能手机利用语音输入的速度比键盘输入快3倍，且输入准确率更高，语音输入以绝对优势胜出。在日常生活中我也感受颇深，用微信发消息时，我经常用讯飞输入法语音转文字，语音输入速度快，识别的准确率也很高，大大提升了输入效率。

2.释放双手和双眼：在一些生活场景下，如在驾驶行车时，驾驶员的状态是目视前方，手握方向盘。若想要完成选歌，或是接听电话等操作这个时候语音交互会比其他交互方式更便捷，也更安全。另外，对于一些残障人士来说语音交互也是友好的交互方式。

3.交互方式更自然：每个人都知道如何说话，就算是个新手用户，也会通过直觉性自然地用语言进行回复，语音交互是最为自然地交互方式。

4.传递丰富的信息：日常生活中我们会发现纯文字沟通很难理解对方的情绪和语气，但语音中却包含了语气、音量、语调和语速，这些特征可以传达大量的信息。例如：“什么”这个词，文字背后的可能包含惊讶、疑问、气愤、不耐烦…的语气，这是通过看文字感受不到的情绪。

5.设备特征需求：语音交互也常常成为小屏幕设备和不带屏幕设备的首选，甚至是唯一的交互方式。

当然也有很多情况不适合使用VUI场景的，如在公共场所的场景、用户不适应对机器说话或更习惯打字等情况，面对这些场景，多模态交互就很有必要了。

︱二、语音交互——语言对话与技术支持

1. 语言对话

在人际交往中，我们对话双方似乎在有意无意地遵循着某一原则，来完成有效的社交对话。

语言学家Paul Grice 于1975年提出合作原则，即：

· 质的准则 (QualityMaxim)：所说的话需是自己相信的真实信息；

· 量的准则 (QuantityMaxim)：恰到好处的信息含量，满足并不超出交际所需的信息量；

· 相关准则(RelevantMaxim)：所说的话需与当前对话有关；

· 方式准则 (MannerMaxim)：说话需简明扼要，直奔主题，避免模糊晦涩表达。

同样没有遵循这些原则VUI体验也会很差：

（1）质的准则：宣传自己做不到的事

如：你对用户说：“有什么可以帮助您的？”，而实际上整个VUI系统只能提供点歌功能。

（2）量的准则：多余的措辞

如：“好的主人，我已经收到了，请您注意听主人，我要开始给你讲故事了……”（废话好多）

（3）相关准则：给用户当前用不到的指示

如：用户还没下单的时候就开始解释退货政策。

（4）方式准则：使用用户难以理解的专业术语

如：“您的SSID是什么？”

人们已经习惯于各种各样的会话和社交行为，VUI虽然不是人类，但遵循基本的社会习俗是有好处的。

2. 相关技术

如今我们的手机和设备都已经可以用语音处理很多事情了，从听到我们的语音到执行正确的指令为我们解决问题，都离不开语音交互的两个重点核心技术：语音识别（Automatic Speech Recognition，ASR）、自然语言处理（Natural Language Processing，NLP）。

Image title

（1）语音识别的挑战：

· 噪音处理：恒定以及突然产生的噪音、周遭说话声；

· 多人讲话情况：辨别谁在说话仍将是VUI系统的挑战；

· 儿童：声带短，音调高，语音数据少；低龄儿童容易自言自语，口吃、长时间停顿等；

· 中英文混合，名字、拼写和字母数字：预设列表和上下文信息，运行时抛弃无效结果，优选可能性高的。

（2）语义识别的挑战：

· 语言的多样性：各种不同国家或地域语言：中英文、方言等；

· 语言的多义性：语言存在歧义，比如“我要去拉萨”，是理解为火车票？音乐？景点查询？

· 语言的表达错误：错字、多字/少字、不连贯（我要看那个恩琅琊榜）；

· 语言的知识依赖：七天（时间/酒店）、大鸭梨（水果/餐厅）、别称；

· 语言的上下文：对话上下文、因果关系、不同类型用户的表达。

就目前行业来看，语音识别发展较为成熟，一些数据显示ASR的准确性已经超过90%，但那是在理想条件下。目前语义识别是学术界研究的聚焦领域，也是行业巨头布局重点。

设计师需要在现有技术基础上去做设计，理解语音交互相关的技术。并找到有效的设计方法来最大程度的利用科技进步，尽可能避免行业存在的技术瓶颈。

语音交互已经出现在我们的视野，作为一名设计师，若不想局限自己，就是要培养自己的“敏感体质”，保持好奇心、拓宽眼界、快速学习。

因为笔者并非语音交互相关的从业人员，所以本文内容主要是笔者在业余学习过程中的的思考和总结，该篇章为启蒙篇大部分观点来源于《语音用户界面设计对话式体验设计原则》这本书（这本书是关于VUI比较全面的一本书，也是天猫精灵团队的参考书籍之一）分享给大家，希望对大家有所帮助，文章若有疏漏之处，欢迎交流指正。

Image title END

更新：2018-04-25

2人已收藏

橙芝儿

坚持我的设计是我的态度，但做更好地设计是我的初心。

22

作品
89

粉丝
72

关注

猜你喜欢

2018-04-25 原创文章 行业资讯 举报 1853 2 2 0

语音交互启蒙篇

0.0°

添加收藏！

您还可以进行分类收藏

您确认要推荐？

该作品发布时间：2018年04月25日

评分

完整度

启发性

勤奋性

排版布局

提交需求

猜你喜欢

举报理由:

您确认要推荐？

评分

推荐心得