恭喜你成为UI中国推荐设计师 (详情)
//百度统计 20220402 uicn

您的意见是我们 UI 中国进步的动力!
点击立即反馈按钮,发表您的意见!
立即反馈
QQ群反馈
您也可以加入UI中国官方反馈群进行反馈!
群号:302892100
备注:反馈问题后@管理员能让我们及时了解您的意见

提交需求

赛事与广告咨询合作,请填写需求表单,我们会在第一时间与您联系!

0/20
0/200

设计大赛

  • 设计大赛
  • 发布广告
  • 发布招聘
  • 其它需求

提交完成
感谢您对UI中国的支持和信赖!
语音交互启蒙篇
0.0°
2018-04-25 原创文章 行业资讯 举报 1253 2 2 0


        2018年的3月,小米,百度等多个公司发布智能音箱产品,小爱音响mini、小度在家、豹豹龙……可见智能音箱产业链这一年来的发展之快。随着智能音箱、智能家居等智能硬件的普及,语音交互热度也不断飙升。

Image title

△ 语音交互设计(Voice User Interaction Design):它是一个以用户心理模型为中心的设计过程,交谈式为核心的交互设计。

本文内容为语音交互启蒙篇,不含详细设计原则和方法。


︱一、语音交互的优势


如今,我们熟练并习惯用手指进行触控交互,那么为什么要在现有的交互方式上增加语音交互方式呢?对于这样的疑问,其实主要是语音交互有一些很重要的优势,包含以下几个方面:


1.输入效率高:百度、斯坦福大学和华盛顿大学,曾共同完成了一项与智能手机输入方式对比的相关研究。研究结果表明:智能手机利用语音输入的速度比键盘输入快3倍,且输入准确率更高,语音输入以绝对优势胜出。在日常生活中我也感受颇深,用微信发消息时,我经常用讯飞输入法语音转文字,语音输入速度快,识别的准确率也很高,大大提升了输入效率。


2.释放双手和双眼:在一些生活场景下,如在驾驶行车时,驾驶员的状态是目视前方,手握方向盘。若想要完成选歌,或是接听电话等操作这个时候语音交互会比其他交互方式更便捷,也更安全。另外,对于一些残障人士来说语音交互也是友好的交互方式。


3.交互方式更自然:每个人都知道如何说话,就算是个新手用户,也会通过直觉性自然地用语言进行回复,语音交互是最为自然地交互方式。


4.传递丰富的信息:日常生活中我们会发现纯文字沟通很难理解对方的情绪和语气,但语音中却包含了语气、音量、语调和语速,这些特征可以传达大量的信息。例如:“什么”这个词,文字背后的可能包含惊讶、疑问、气愤、不耐烦…的语气,这是通过看文字感受不到的情绪。


5.设备特征需求:语音交互也常常成为小屏幕设备和不带屏幕设备的首选,甚至是唯一的交互方式。


当然也有很多情况不适合使用VUI场景的,如在公共场所的场景、用户不适应对机器说话或更习惯打字等情况,面对这些场景,多模态交互就很有必要了。


︱二、语音交互——语言对话与技术支持


1. 语言对话

在人际交往中,我们对话双方似乎在有意无意地遵循着某一原则,来完成有效的社交对话。

语言学家Paul Grice 于1975年提出合作原则,即:

· 质的准则 (QualityMaxim):所说的话需是自己相信的真实信息;

· 量的准则 (QuantityMaxim):恰到好处的信息含量,满足并不超出交际所需的信息量;

· 相关准则(RelevantMaxim):所说的话需与当前对话有关;

· 方式准则 (MannerMaxim):说话需简明扼要,直奔主题,避免模糊晦涩表达。


同样没有遵循这些原则VUI体验也会很差:

(1)质的准则:宣传自己做不到的事

如:你对用户说:“有什么可以帮助您的?”,而实际上整个VUI系统只能提供点歌功能。

(2)量的准则:多余的措辞

如:“好的主人,我已经收到了,请您注意听主人,我要开始给你讲故事了……”(废话好多)

(3)相关准则:给用户当前用不到的指示

如:用户还没下单的时候就开始解释退货政策。

(4)方式准则 :使用用户难以理解的专业术语

如:“您的SSID是什么?”

人们已经习惯于各种各样的会话和社交行为,VUI虽然不是人类,但遵循基本的社会习俗是有好处的。


2. 相关技术

如今我们的手机和设备都已经可以用语音处理很多事情了,从听到我们的语音到执行正确的指令为我们解决问题,都离不开语音交互的两个重点核心技术:语音识别(Automatic Speech Recognition,ASR)、自然语言处理(Natural Language Processing,NLP)。

Image title

(1)语音识别的挑战:

· 噪音处理:恒定以及突然产生的噪音、周遭说话声;

· 多人讲话情况:辨别谁在说话仍将是VUI系统的挑战;

· 儿童:声带短,音调高,语音数据少;低龄儿童容易自言自语,口吃、长时间停顿等;

· 中英文混合,名字、拼写和字母数字:预设列表和上下文信息,运行时抛弃无效结果,优选可能性高的。


(2)语义识别的挑战:

· 语言的多样性:各种不同国家或地域语言:中英文、方言等;

· 语言的多义性:语言存在歧义,比如“我要去拉萨”,是理解为 火车票?音乐?景点查询?

· 语言的表达错误:错字、多字/少字、不连贯(我要看那个恩琅琊榜);

· 语言的知识依赖:七天(时间/酒店)、大鸭梨(水果/餐厅)、别称;

· 语言的上下文:对话上下文、因果关系、不同类型用户的表达。


就目前行业来看,语音识别发展较为成熟,一些数据显示ASR的准确性已经超过90%,但那是在理想条件下。目前语义识别是学术界研究的聚焦领域,也是行业巨头布局重点。


设计师需要在现有技术基础上去做设计,理解语音交互相关的技术。并找到有效的设计方法来最大程度的利用科技进步,尽可能避免行业存在的技术瓶颈。


语音交互已经出现在我们的视野,作为一名设计师,若不想局限自己,就是要培养自己的“敏感体质”,保持好奇心、拓宽眼界、快速学习。


因为笔者并非语音交互相关的从业人员,所以本文内容主要是笔者在业余学习过程中的的思考和总结,该篇章为启蒙篇大部分观点来源于《语音用户界面设计对话式体验设计原则》这本书(这本书是关于VUI比较全面的一本书,也是天猫精灵团队的参考书籍之一)分享给大家,希望对大家有所帮助,文章若有疏漏之处,欢迎交流指正。

Image titleEND


更新:2018-04-25

收藏

2人已收藏

橙芝儿

坚持我的设计是我的态度,但做更好地设计是我的初心。

  • 22

    作品

  • 89

    粉丝

  • 72

    关注

  • 如何输出一份会表达的交互文档
  • 手绘璎珞姐(含步骤)
  • 橙芝儿の日常
  • 呱呱UI

    猜你喜欢

      2018-04-25 原创文章 行业资讯 举报 1253 2 2 0

      语音交互启蒙篇

      0.0°

      你确定要举报语音交互启蒙篇

      如果查出恶意举报,十天内禁止提交任何举报申请。

      0/200

      上传证据: 超过10M的附件请使用网盘地址

      点击上传附件

      对谁可见:

      全部设计师
      • 全部设计师
      • 推荐设计师和认证设计师

      您确认要推荐?

      该作品发布时间:2018年04月25日

      评分

      完整度

      启发性

      勤奋性

      排版布局

      推荐心得

      建议20-200字以内

      0/200

      2
      2
      0

      账号或密码错误,请重新输入

      账号或密码错误,请重新输入

      登录

      手机号

      发送验证码 120s 验证码错误

      登录
      第三方账号登录