1.格式
XLS(Microsoft Office 2003及以前版本)和XLSX(Microsoft Office 2007以后版本)是Microsoft Excel工作表,是一种非常常用的电子表格格式。XLS或XLSX文件可以使用Microsoft Excel打开,另外微软为那些没有安装Excel的用户开发了专门的查看器Excel Viewer。使用Microsoft Excel可以将XLS或XLSX格式的表格转换为多种格式:XML表格、XML数据、网页、使用制表符分割的文本文件(*.txt)、使用逗号分隔的文本文件(*.csv)等。
虽然,Microsoft Excel支持一些可视化及数据分析,但是,如果需要更加灵活和强大的可视化效果及数据分析,则需要把Microsoft Excel文件导入到Python等专业的数据分析软件中。从Excel文件导入数据的通常做法是:把数据从Excel中导出为CSV格式的文件,然后再用上一节提供的CSV文件处理方式进行数据导入。但是,如果想在数据分析与挖掘流程中自动地对大量文件进行数据导入,那么手动把每个Excel文件转换成CSV文件的做法就不太合适了。
2.导入Excel文件
在Python中要想自己导入Excel文件,需要读和写导入软件包,读和写的操作是通过不同的模块实现的,而且和平台无关(可以使用Windows平台,也可以使用Linux等平台)导入。Excel文件读取库-xlrd模块,用于直接读取Excel文件,但是只能读取。若写入,需要用xlwt模型,意为:Excel文件写入库,可以实现指定表单、指定单元格的读取。
(1)读取Excel文件:
import xlrd
file="inputFile"
wb=xlrd.open_workbook(filename=file)(www.xing528.com)
(2)写入Excel文件:
import xlwt
workbook=xlwt.Workbook(encoding=ascii
)
workbook=xlwt.Workbook(encoding=ascii
)
worksheet=workbook.add_sheet(My Worksheet
)
worksheet=workbook.add_sheet(My Worksheet
)
worksheet.write(0,0,label=Row 0,Column 0 Value
)workbook.save(
Excel_Workbook.xls
)
worksheet.write(0,0,label=Row 0,Column 0 Value
)workbook.save(
Excel_Workbook.xls
)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。