使用python便捷进行excel文件列的去重操作,并保留唯一行:
上脚本:
PS:drop_duplicates的用法:
subset='去重复的列名'
keep='重复处理保留第一个还是最后一个,可选first或last'
inplace='去除重复项true,保留重复项的副本false'
import pandas as pd frame = pd.read_excel('source.xlsx') data = pd.DataFrame(frame) data.drop_duplicates(['车位号','客户名称','关联主房间'], keep='first', inplace=True) data.to_excel('out.xlsx') print('去重结束')
1、将source.xlsx替换为当前需替换的excel文件名
2、将脚本保存为filter.py
3、进入目录执行:python filter.py
注意:如果有未安装的库,会报错
举例1:执行pip install pandas
举例2:执行pip install xlrd
举例3:执行pip install openpyxl
本文为胖虎原创文章,转载无需和我联系,但请注明来自胖虎博客panghucat.cn