本文目录一览:
语音识别技术的应用情况
语音识别是将语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。
语音识别应用场景有下面几个方面
1、语音输入
摆脱生僻字和拼音障碍,使用语音即时输入。略带口音的普通话、粤语四川话方言、英文,均可有效识别,并可根据句意自动纠错、自动断句添加标点,让输入更快捷,沟通交流更顺畅。
2、 语音搜索
搜索内容直接以语音的方式输入,应用于网页搜索、车载搜索、手机搜索等各种搜索场景,解放双手让搜索更加高效,适用于视频网站、智能硬件、手机厂商等多个行业 。
3、 语音指令
无需手动操作,可以通过语音直接对设备或者软件发布指令,控制操作,适用于智能硬件、车载系统、机器人、手机APP、游戏等多个领域 。
4、 社交聊天
社交聊天时直接用语音输入的方式转成文字,让输入更加便捷;或者在收到语音消息不适合播放时可以转为文字进行查看,满足更多的聊天场景 。
5、 游戏娱乐
游戏中聊天必不可少,双手无法打字,语音输入可以将语音聊天转为文字,让用户在操作的同时也可直观看到聊天内容,多样化满足用户聊天需求。
智能语音面临的挑战主要有
智能语音面临的挑战主要有如下几点:
首先是针对专业领域的优化,比如在医疗领域,通常专用词汇比较多,让我们普通人去听的时候可能都写不下来,只有经过专业训练的医生和护士才能准确记录;影视节目查询、商品搜索、路径导航等方面也同样需要做针对性的优化。
其次是相对复杂的口音和噪声环境,包括全国各地的口音和方言、远讲、噪声、混响等,都是比较复杂的。声音传播能量是随距离平方成反比关系的,传播距离增加一倍能量就衰减到四分之一,在五米外采集的语音能量,和在一米采集能量相比就相差25倍,但噪声并没有因为距离而降低,加上距离远之后,房间会出现多次反射和叠加,还会形成混响效果,信噪比会下降很多,都会对识别效果造成影响,这些是需要麦克风阵列结合语音声学模型去解决的问题。
第三是低功耗、低成本、高可靠的问题,智能家电需要满足绿色环保标准,需要确保24小时误唤醒低于1次,尽量不出现误操作,要实现大规模量产出货,还要降低整体方案的成本。面向物联网的智能语音交互方案,如果功耗成本下不来就不能普及,智能手表、手环等依赖电池的穿戴设备,功耗和成本问题就更加严重。
计算机文字转语音技术的发展现状
计算机文字转语音技术(Text-to-Speech,TTS)已经成功应用到了不同的领域,比如智能客服、智能对话系统、在线教育和电子设备上的语音交互等。TTS正在发展的方向是个性化,例如通过人工智能将文字转换成真实、逼真的语音来更好地模仿真实说话者的声音,以提高用户体验。