1、测试数据:testData.xlsx
2、代码示例
注:xlrd最新版不支持xlsx格式,安装旧版本即可:
pip uninstall xlrd
pip install xlrd==1.2.0
备注: 单元类型: empty为0,string为1,number为2,date为3,boolean为4, error为5 (左边为类型,右边为类型对应的值)
#!/usr/bin/python
# -*- coding: utf-8 -*-
# @Time : 2021/12/1 17:21
# @File : read_excel_test.py
import os
import xlrd
def read_excel(excel_path, sheet_num=0):
"""
:param excel_path: xls/xlsx 路径
:param sheet_num: sheet下标,默认为0,即第一个sheet页
:return:
"""
# 判断文件是否文件
if os.path.exists(excel_path):
# 打开excel文件,获得句柄
excel_handle = xlrd.open_workbook(excel_path)
# 获取第一个工作表(就是excel底部的sheet)
sheet = excel_handle.sheet_by_index(sheet_num)
# nrows 返回该工作表有效行数
for i in range(0, sheet.nrows):
# 读取第i行数据,返回的是列表类型
print(sheet.row_values(i))
print("====================================")
# ncols 返回该工作表有效列数
for i in range(0, sheet.ncols):
# 读取第i列数据,返回的是列表类型
print(sheet.col_values(i))
else:
raise FileNotFoundError("文件不存在")
if __name__ == '__main__':
excel_data = read_excel(r"E:\MyProject\DK-AutoTest\testCode\testData\testData.xlsx")
print(excel_data)
# 【打印结果】:
['编号', '姓名', '性别', '年龄', '籍贯']
[1.0, '张三', '男', 15.0, '江苏南京']
[2.0, '李四', '男', 20.0, '安徽合肥']
[3.0, '王五', '男', 30.0, '广西桂林']
[4.0, '陈真', '男', 15.0, '湖南长沙']
[5.0, '扎哈', '女', 50.0, '广东深圳']
====================================
['编号', 1.0, 2.0, 3.0, 4.0, 5.0]
['姓名', '张三', '李四', '王五', '陈真', '扎哈']
['性别', '男', '男', '男', '男', '女']
['年龄', 15.0, 20.0, 30.0, 15.0, 50.0]
['籍贯', '江苏南京', '安徽合肥', '广西桂林', '湖南长沙', '广东深圳']
3、Xlrd模块学习
1. 打开Excel文件
# 获得一个句柄
excel_handle = xlrd.open_workbook(r"E:\MyProject\DK-AutoTest\testCode\testData\testData.xlsx")
print(excel_handle)
# 【打印结果】:
<xlrd.book.Book object at 0x0000000001E14730>
2. 工作表sheet的操作
# 获得一个句柄
excel_handle = xlrd.open_workbook(r"E:\MyProject\DK-AutoTest\testCode\testData\testData.xlsx")
print(excel_handle)
sheet1 = excel_handle.sheets()[0] # 通过索引顺序获取
sheet2 = excel_handle.sheet_by_index(0) # 通过索引顺序获取
sheet3 = excel_handle.sheet_by_name("Sheet1") # 通过名称获取
# 以上三个函数都会返回一个xlrd.sheet.Sheet()对象
print(sheet1)
print(sheet2)
print(sheet3)
sheet_names = excel_handle.sheet_names() # 返回book中所有工作表的名字
print(sheet_names)
# 判断sheet表是否加载完毕,参数为索引或者sheet名称
print(excel_handle.sheet_loaded("Sheet1"))
print(excel_handle.sheet_loaded(0))
# 【打印结果】:
<xlrd.book.Book object at 0x00000000021546D0>
<xlrd.sheet.Sheet object at 0x00000000024A8400>
<xlrd.sheet.Sheet object at 0x00000000024A8400>
<xlrd.sheet.Sheet object at 0x00000000024A8400>
['Sheet1', 'Sheet2', 'Sheet3']
True
True
3. 行的操作
# 返回有效行数
nrows = sheet1.nrows
print(f"有效行数:{nrows}")
# 返回由该行中所有的单元格对象组成的列表
print(sheet1.row(0))
# 返回由该列中所有的单元格对象组成的列表(可以指定起始列)
print(sheet1.row_slice(0))
print(sheet1.row_slice(0, start_colx=1, end_colx=None)) #切片的方式
# 返回由该行中所有单元格的数据类型组成的列表
print(sheet1.row_types(0, start_colx=0, end_colx=None))
# 返回由该行中所有单元格的数据组成的列表
print(sheet1.row_values(0, start_colx=0, end_colx=None))
# 返回该行的有效单元格长度
print(sheet1.row_len(0))
# 【打印结果】:
有效行数:6
[text:'编号', text:'姓名', text:'性别', text:'年龄', text:'籍贯']
[text:'编号', text:'姓名', text:'性别', text:'年龄', text:'籍贯']
[text:'姓名', text:'性别', text:'年龄', text:'籍贯']
array('B', [1, 1, 1, 1, 1])
['编号', '姓名', '性别', '年龄', '籍贯']
5
4. 列的操作
# 返回有效列数
ncols = sheet1.ncols
print(f"有效列数:{ncols}")
# 返回由该列中所有的单元格对象组成的列表
print(sheet1.col(0))
# 返回由该列中所有的单元格对象组成的列表(切片的方式)
print(sheet1.col_slice(0, start_rowx=0, end_rowx=None))
# 返回由该列中所有单元格的数据类型组成的列表
print(sheet1.col_types(0, start_rowx=0, end_rowx=None))
# 返回由该列中所有单元格的数据组成的列表
print(sheet1.col_values(0, start_rowx=0, end_rowx=None))
# 【打印结果】:
有效列数:5
[text:'编号', number:1.0, number:2.0, number:3.0, number:4.0, number:5.0]
[text:'编号', number:1.0, number:2.0, number:3.0, number:4.0, number:5.0]
[1, 2, 2, 2, 2, 2]
['编号', 1.0, 2.0, 3.0, 4.0, 5.0]
4. 单元格的操作
# 返回单元格对象
print(sheet1.cell(0, 0))
# 返回单元格中的数据类型
print(sheet1.cell_type(0, 0))
# 返回单元格中的数据
print(sheet1.cell_value(0, 0))
# 【打印结果】:
text:'编号'
1
编号