首页 理论教育 案例分享:语音转文本技术的应用

案例分享:语音转文本技术的应用

时间:2023-06-27 理论教育 版权反馈
【摘要】:如何在Python中将语音转换为文本?我们使用的是百度的语音识别服务。图6-9进入控制台图6-10创建应用图6-11得到的注册信息实现百度AI语音平台的调用。例6_4_voice_Recognation.py效果如图6-12所示。图6-12语音识别效果课程思政小课堂网络爬虫,盗亦有道想必大家心里也清楚,爬虫固然很方便,但是也会引发一系列的问题。检查来访HTTP协议头的User-Agent域,只响应浏览器或已知友好爬虫的访问。思考与练习1.豆瓣读书爬虫。

案例分享:语音转文本技术的应用

如何在Python中将语音转换为文本?我们使用的是百度的语音识别服务。

(1)进入百度AI官网,注册账号和语音识别服务,创建语音识别应用,获取百度AI应用的App ID、APIKey、Secret Key,如图6-9、图6-10、图6-11所示。

图6-9 进入控制台

图6-10 创建应用

图6-11 得到的注册信息

(2)实现百度AI语音平台的调用。

①pyAudio库的安装。该库因为需要C++的依赖,所以无法直接使用pip安装,需要下载其wheel文件安装。下载地址https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyaudio。

打开该文件目录安装:

②wave和baidu-aip库的安装。

(3)代码实现。

例6_4_voice_Recognation.py

效果如图6-12所示。(www.xing528.com)

图6-12 语音识别效果

课程思政小课堂

网络爬虫,盗亦有道

想必大家心里也清楚,爬虫固然很方便,但是也会引发一系列的问题。大家也听说过因为爬虫违法犯罪的事,例如,爬取网站后台用户的个人隐私信息,违法爬取国家事务、国防建设、尖端科学技术领域的系统等涉及国家机密的数据,但是只要我们严格按照网络规范上网,遵守道德法律,正确正常使用网络是不受这些问题影响的。

根据网络爬虫的尺寸,可以简单分为以下三类:

例如,有些网站的服务器就可以设置防范爬虫的骚扰,只接受人类本身操作的请求。爬虫可以利用计算机的性能,1 s内可以发起成千上万甚至数万次的访问请求,给服务器造成一定的开销压力,有时甚至会带来法律问题,如有些新闻数据、用户隐私被爬取等。

因此总结了网络爬虫所引发的问题,将之分为三大类:

(1)服务器骚扰问题。

(2)网站内容法律风险问题。

(3)用户隐私泄露问题。

目前互联网上很多公司对网络爬虫进行了一定的限制,关于网络爬虫的限制包括两种:

(1)来源审查:判断User-Agent进行限制。检查来访HTTP协议头的User-Agent域,只响应浏览器或已知友好爬虫的访问。

(2)发布公告:Robots协议。告知所有爬虫网站的爬取策略,要求爬虫遵守。

思考与练习

1.豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数大于1 000的高分书籍,可依据不同的主题存储到Excel不同的Sheet中。

2.图像转换。拍摄自己的一张照片,通过图像处理的步骤,完成自己照片的手绘效果。

3.文本转换语音。利用百度AI开放平台,完成文本转换语音的功能。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈