在文本处理中,很多的文本数据是采用文件的方式存储,因此,需要掌握文件的存取技术,实现文本数据的处理。在Python中负责文件操作的对象称为文件(file),可用来实现文本文件、图像文件、视频文件、二进制文件等文件的存取操作。
在对文件进行处理过程中,需要通过open()函数打开一个文件,并返回一个文件对象,可实现文件存取操作,关闭文件可使用close()来关闭文件对象。
1.常用函数
1)open()
open函数描述如下:
参数:
(1)filename:字符串类型,是指要打开的文件名,其包含文件的存储路径,可以使用绝对路径和相对路径。
(2)mode:是指文件的打开模式,文件打开模式有很多类型,比较常用的有r、w、r+、w+、a五种。
r:以只读方式打开文件。
w:打开一个只用于写入的文件。如果文件存在则直接打开,并删除原有文件的内容;如果文件不存在,则创建后再打开。
r+:打开一个文件,既可读文件,也可写文件。
w+:打开一个文件,既可读文件,也可写文件;但是在打开一个已有的文件时会删除掉文件中的内容。
a:打开一个文件,并追加新的内容。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
(3)buffering:设置文件读取缓冲区,有三种值可选:0、1、-1。0表示不设缓冲区,1表示设置一行缓冲区,-1表示系统默认值。
(4)encoding:指定打开文件的编码方式,默认是utf-8,编码方式的选择与文件存储编码有关。
2)close()
关闭文件,不能再进行文件读写操作。
3)wirte()(www.xing528.com)
向文件写入字符串,并返回写入字符串的长度。
4)writelines()
向文件写入字符串列表。
5)redline()
读取文件中的一整行,包括换行符“\n”。
6)readlines()
读取文件中的所有行,返回以行为单位的列表。
2.打开文件并进行读写操作
例如,打开文本文件text.txt,如图3-4所示。
图3-4 文本文件text.txt的内容
1)通过只读方式打开文件并读取
2)通过只写方式打开文件并写入字符串
如果以只写的方式打开,会删除原来的内容,例如:
读取原文件的内容,发现文件中的内容已经发生了变化,例如:
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。