首页 理论教育 智能语音识别:版本助您实现指令喊出来

智能语音识别:版本助您实现指令喊出来

时间:2023-10-19 理论教育 版权反馈
【摘要】:与此同时,语音识别也正在快速发展中。当智能语音识别系统可以达到这样与人类流畅对话的阶段,那么“把指令喊出来”就会升级为“与人工智能进行语音交流确定最佳选择”,它能够更加提升我们的效率,同时也能轻松服务于孩子、老人等群体。小爱音箱、小安智能语音系统,这只是语音识别的第一步。所以,声纹识别成为未来智能语音识别领域的重点方向。不同于语音识别的是,声纹识别更多的是用来进行身份确认和核查。

智能语音识别:版本助您实现指令喊出来

刷脸识别,这是人工智能识别商业应用的一个方向。与此同时,语音识别也正在快速发展中。“把指令喊出来”,这样识别技术更加快捷,用户甚至不必面对相关人工识别设备,用声音即可“控制整个世界”!

这样的应用,事实上很多人已经不再陌生,尤其在汽车领域。如长安汽车推出的“小安”智能语音交互系统,可以让驾驶员不必进行任何手动操作即可完成车内设施的控制,“打开空调制冷”“开启天窗”“打开收音机,收听中国音乐广播”……这一切都可以通过语音指令完成,让驾驶者在享受车载娱乐的同时兼顾行车安全。

小米推出的小爱音箱,同样具备这些功能,并可以与家中其他智能设备相关联。用户通过语音,不仅可以开启音箱、播放音乐,还能够通过“智能小爱”开启电视机、空调等,只需一句“小爱同学,开启电视”,那么相关智能设备就会立刻进入工作状态。

智能语音识别其实并不复杂,它就是让人工智能能够将语音信号转换为相应的命令程序,以此进行识别、理解和执行。相比较其他各类智能识别技术,智能语音技术的探索最早,并逐渐走向成熟。

例如,苹果手机的Siri,安卓手机的Google now,电脑端win10系统的Cortana,都是智能语音识别与助理系统,它们都是各家宣传的重点。

人工智能时代,智能语音识别主要应用于三个领域,这是语音识别商业化发展的主要方向:

1.语音输入系统

将语音识别成文字,提升用户的效率。如微信语音转换文字、讯飞输入法等,都是这个领域的主要代表。

2.语音控制系统

通过语音控制设备,进行相关操作,彻底解放双手。例如小爱音箱、长安汽车小安系统等,是这种应用的代表。

3.语音对话系统

相比较语音输入系统和语音控制系统,语音对话系统更为复杂,却代表着语音识别的未来方向。这种系统,将会根据用户的语音实现交流与对话,保证回答的内容准确,对语义理解要求较高。在家庭机器服务员、宾馆服务、订票系统、银行服务等方面,都将会起到非常重要的作用。

例如,当我们想要购买飞机票时,向智能购票机器人说出:“我需要明天飞往上海的机票。”

智能机器人:“请问您的时间安排是怎样?需要下午到达还是上午到达?”

我们:“下午到达就可以。”

智能机器人:“向您推荐××××次航班,下午两点到达虹桥机场,您是否能够接受?”(www.xing528.com)

我们:“可以。请帮我选择经济舱。”

智能机器人:“好的,正在为您办理。现在余票还有靠窗位置,请问您是否需要?”

……

当智能语音识别系统可以达到这样与人类流畅对话的阶段,那么“把指令喊出来”就会升级为“与人工智能进行语音交流确定最佳选择”,它能够更加提升我们的效率,同时也能轻松服务于孩子、老人等群体。

小爱音箱、小安智能语音系统,这只是语音识别的第一步。它们的确可以为我们大大提升工作效率和生活质量,但是有一个问题却始终存在:任何人都可以启动这些人工智能设备,隐私保护较差,并不是我们的“专属语音管家”。

所以,声纹识别成为未来智能语音识别领域的重点方向。

相比较语音识别,声纹识别最大的特点在于:智能系统不仅会捕捉语音内容,还会根据音波特点、说话人的生理特征等参数,自动识别说话人的身份。因为,声音的发出是一个复杂的生理过程,每个人的舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面的差异很大,所以发出的声纹图谱会与其他人不同。通过差异,声纹识别可以快速确认用户的身份。

如果说声音识别的目的是提升效率,那么声纹识别的目的,则是进行身份确认与审查,尤其适合应用于金融领域。例如,我们通过声音进行账户资金提取、转移等,借助声音识别就可以确认用户是“真正的主人”,保护相关活动的安全。同时,相关工作人员也将接入声纹识别系统,保证相关操作合规、安全、可追踪信息。

已经有相关机构,将声纹识别作为用户验证的方式进行应用。2018年5月,泰康保险宣布:声纹识别已在泰康在线移动客服APP上使用。泰康在线的坐席人员,需要在移动客服APP预留八位数的数字声音,系统会为每一个客服进行识别模型的创造,当客服登陆后台时,直接通过八位语音数字确认身份,不必再输入密码。

不同于语音识别的是,声纹识别更多的是用来进行身份确认和核查。比如,在上文提到的智能家居、订票系统的智能对话系统中,如何确认发出语音指令的是你的主人?如何保证机器的操作是根据“真正的主人”的命令而执行的?在这一过程中就需要声纹识别来确认主人身份。

尤其在社保领域,声纹识别的作用更加明显。众所周知,中国已经进入老龄化社会,存在数量庞大的离退休人员。他们需要每年至少进行一次生存状态验证,这样才能进行养老金的发放。而目前的方式,是相关人员前往社保大厅进行验证,这对于行动不便的老人非常麻烦。

有了声纹识别,这样的情况将会大为减少。老人只需通过电话与人工智能设备对接,设备通过声纹识别确认老人的生存状态,这样一来既给参保人员提供了便利,同时国家也能够大大节省成本,保证养老金的正常运转。

此外,在一些特定领域,声纹识别也将发挥巨大的优势。例如在环境较为黑暗的场景之中,人脸识别因为光线过弱而无效,虹膜识别同样需要补光才能进行捕捉,指纹识别又因为复制和伪造的难度较低导致安全性不佳,但声纹识别却没有相关困扰,在漆黑的场景中同样能够发挥作用。

各种丰富的生物识别技术,让人工智能识别成为安全领域关注的焦点,各个厂商都在不断推出新的产品。每一种识别技术,都有其独特的优势,所以未来,刷脸、虹膜、声纹识别等会形成有效的组合矩阵,而不是某一单一类型垄断江湖。就像知名科技公司科大讯飞,在2015年,依托于声纹识别、人脸识别技术,构建了业界首个统一生物认证系统,用人脸识别补充声纹识别的不稳定性,全方位提高安全系数。未来,相互组合才是智能识别的商业新模式!

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈