使用python脚本对excel进行去重

使用python便捷进行excel文件列的去重操作,并保留唯一行:

上脚本:

PS:drop_duplicates的用法:

subset='去重复的列名'

keep='重复处理保留第一个还是最后一个,可选first或last'

inplace='去除重复项true,保留重复项的副本false'

import pandas as pd

frame = pd.read_excel('source.xlsx')
data = pd.DataFrame(frame)
data.drop_duplicates(['车位号','客户名称','关联主房间'], keep='first', inplace=True)
data.to_excel('out.xlsx')
print('去重结束')

1、将source.xlsx替换为当前需替换的excel文件名

2、将脚本保存为filter.py

3、进入目录执行:python filter.py


注意:如果有未安装的库,会报错

举例1:执行pip install pandas

白俊遥博客

举例2:执行pip install xlrd白俊遥博客

举例3:执行pip install openpyxl白俊遥博客