Python自动化办公Excel模块openpyxl原理及用法解析

时间：2020-12-01 数据分析查看: 1056

openpyxl 介绍

openpyxl 是一个直接可用于读写 xlsx 、xlsm、xltx、xltm 文件的 Python 内置库，借助它可以利用 Python 语法对本地 xlsx 文件进行自动化批量操作

先说一下安装部分，如果小伙伴们用 Anaconda 作为 Python 环境的话，openpyxl 无需安装可直接使用；需要安装的话方法也非常简单 pip 工具一行命令即可

pip install openpyxl

xlsx 文件属性

在对 Excel 表格处理之前，需要了解一下 xlsx 文件的几个名词解释及构造

1，Workbook 指的是神什么？

Workbook 名叫工作薄，可以代指一个 xlsx 文件；

2， sheet、cell、row 、col 分别指的是什么？

关于问题2 ，可参考下图(见注释)

openpyxl 基本命令操作

1，创建一个空的 workbook

from openpypl import Wrokbook
from openpyxl.utils import get_column_letter

wb = Workbook()
ws1 = wb.active

一个 Workbook 默认至少含有一个 worksheet ，通过命令 Workbook.active 来获取当前第一个 sheet(也就是第一个 sheet)；

2，创建新的 worksheet

ws1 = wb.create_sheet("Mysheet") # insert at the end (default)

ws2 = wb.create_sheet("Mysheet", 0) # insert at first position
# or
ws3 = wb.create_sheet("Mysheet", -1) # insert at the penultimate position

可通过 create_sheet() 命令创建新的 worksheet ， create_sheet 默认有两个参数 name、index;

name，定义 sheet 的名字；
index，来设置插入 sheet 的位置，默认为 None 即新创建的 sheet 插入到最后面；0 代表插入第一个 sheet 的位置；

3，更改 sheet 的名字

一行代码即可

ws.title = 'New Title'

4，更改 sheet 上 tab 背景颜色

ws.sheet_properties.tabColor = "1072BA"

通过修改 Wroksheet.sheet_properties.tabColor 参数即可，需要注意的是这里只接收 RRGGBB 颜色代码；

关于不清楚 sheet tab 背景颜色不清楚是什么的小伙伴，可参考下图；

5, 返回 Workbook 中所有 sheet 的名字

通过 Workbook.sheetname 命令即可查看

>>> print(wb.sheetnames)
['Sheet2', 'New Title', 'Sheet1']

# 或者用迭代方法

>>> for sheet in wb:
... print(sheet.title)

6，将现有的 worksheets 复制新创建的 workbook 中

可通过 Workbook.copy_worksheet()函数方法

# 将 source 中的worksheet复制到 target 中去

source = wb.active
target = wb.copy_worksheet(source)

需要注意的是，当 workbook 为只读或只写模式时不可复制；另外只有 cells(值，样式，超链接、注释) 和特定的 worksheet 属性(维度、格式、属性)可以复制，其他的一些 workbook / worksheet 属性不可复制( Images Charts 等)

7，获取某个 cell 的数据

成功创建完 Workbook、Worksheet 之后，接下来就可以修改 cell(单元格中的内容，Cells 可以通过 worksheet 中特有关键词来获取

>>> c = ws['A4'] # 获取第4行列名为A 单元格中的值
通过赋值命令对其修改

ws['A4'] = 4

openpyxl 中有一个函数 Worksheet.cell() 可修改单元格中的数据，可定位到具体行、具体列进行更改，

d = ws.cell(row = 4,columns = 2,value = 10)

row 表示指定行
columns 表示指定列
value 表示该单元格中需替代的数据值；当此参数不设置时表示只对该 cell 创建内存空间，不赋值

例如

>>> for x in range(1,101):
... for y in range(1,101):
... ws.cell(row=x, column=y)

8，获取多个单元格

8.1 , openpyxl 也可以进行切片操作，来获取多个单元格

>>> cell_range = ws['A1':'C2']

8.2， worksheet 中多行多列数据获取方式相似

>>> colC = ws['C']
>>> col_range = ws['C:D']
>>> row10 = ws[10]
>>> row_range = ws[5:10]

8.3，Worksheet.iter_row() 来获取 sheet 中行列范围，再利用循环迭代获取每一个单元格数据

>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2):
... for cell in row:
... print(cell)

8.4，Worksheet.iter_cols() 也可以实现同样功能

>>> for col in ws.iter_cols(min_row=1, max_col=3, max_row=2):
... for cell in col:
... print(cell)

需要注意的时在 read-only 模式中，Worksheet,iter_cols() 方法不能使用

9，只查看 cell 中的 value

9.1，只查看 worksheet 中的 value 时，可通过 Worksheet.values 属性，该属性将迭代 worksheet 中所有行，但返回的仅仅是 cell values

for row in ws.values:
for value in row:
print(value)

9.2，通过 Worksheet.iter_rows() 和 Worksheet.iter_cols() 也可以实现，在函数中加入一个参数 values_only = True 即可返回 cell 的值

>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2, values_only=True):
... print(row)

(None, None, None)
(None, None, None)

10，读写文件操作

10，excel 文件加载

openpyxl.load_workbook() 函数来打开一个指定本地存储的 xlsx 文件

>>> from openpyxl import load_workbook
>>> wb2 = load_workbook('test.xlsx')
>>> print wb2.sheetnames
['Sheet2', 'New Title', 'Sheet1']

10.2，excel 文件存储

Workbook 修改成功后，后创建完成之后，通过Workbook.save(path) 命令即可保存至本地磁盘

>>> wb = Workbook()
>>> wb.save('balances.xlsx')

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持python博客。

展开全文