如何在Python中将语音转换为文本?我们使用的是百度的语音识别服务。
(1)进入百度AI官网,注册账号和语音识别服务,创建语音识别应用,获取百度AI应用的App ID、APIKey、Secret Key,如图6-9、图6-10、图6-11所示。
图6-9 进入控制台
图6-10 创建应用
图6-11 得到的注册信息
(2)实现百度AI语音平台的调用。
①pyAudio库的安装。该库因为需要C++的依赖,所以无法直接使用pip安装,需要下载其wheel文件安装。下载地址https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyaudio。
打开该文件目录安装:
②wave和baidu-aip库的安装。
(3)代码实现。
例6_4_voice_Recognation.py
效果如图6-12所示。(www.xing528.com)
图6-12 语音识别效果
课程思政小课堂
网络爬虫,盗亦有道
想必大家心里也清楚,爬虫固然很方便,但是也会引发一系列的问题。大家也听说过因为爬虫违法犯罪的事,例如,爬取网站后台用户的个人隐私信息,违法爬取国家事务、国防建设、尖端科学技术领域的系统等涉及国家机密的数据,但是只要我们严格按照网络规范上网,遵守道德法律,正确正常使用网络是不受这些问题影响的。
根据网络爬虫的尺寸,可以简单分为以下三类:
例如,有些网站的服务器就可以设置防范爬虫的骚扰,只接受人类本身操作的请求。爬虫可以利用计算机的性能,1 s内可以发起成千上万甚至数万次的访问请求,给服务器造成一定的开销压力,有时甚至会带来法律问题,如有些新闻数据、用户隐私被爬取等。
因此总结了网络爬虫所引发的问题,将之分为三大类:
(1)服务器骚扰问题。
(2)网站内容法律风险问题。
(3)用户隐私泄露问题。
目前互联网上很多公司对网络爬虫进行了一定的限制,关于网络爬虫的限制包括两种:
(1)来源审查:判断User-Agent进行限制。检查来访HTTP协议头的User-Agent域,只响应浏览器或已知友好爬虫的访问。
(2)发布公告:Robots协议。告知所有爬虫网站的爬取策略,要求爬虫遵守。
思考与练习
1.豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数大于1 000的高分书籍,可依据不同的主题存储到Excel不同的Sheet中。
2.图像转换。拍摄自己的一张照片,通过图像处理的步骤,完成自己照片的手绘效果。
3.文本转换语音。利用百度AI开放平台,完成文本转换语音的功能。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。