所需相关python库
编写原因:
奔腾电脑,十万数据,实属卡死,万般无奈
库介绍
Pandas
Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。
ps:咱用不到里面高大上的东西 φ(* ̄0 ̄)
Openpyxl
A Python library to read/write Excel 2010 xlsx/xlsm files
用于读取/写入Excel 2010 xlsx/xlsm文件的Python库
ps:最后发现不需要,不过在此介绍一下
代码结构
因保密协议无法贴出完整代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
| import pandas as pd
def fileRead(fileName, sheetName): return pd.DataFrame(pd.read_excel(fileName, sheet_name=sheetName))
def vlookup(filePd1, filePd2, column_array, how, on): return pd.merge(filePd1, filePd2.loc[:, column_array], how=how, on=on)
def main(): renShi = fileRead('人事.xlsx', 'Sheet1') print('获取Excel数据完毕......')
result1 = vlookup()
print('数据筛选完毕......正在保存ing......')
writer = pd.ExcelWriter('result.xlsx') print('结果保存到"result.xlsx"') result.to_excel(writer, index=False)
writer.save()
print('数据保存完毕')
if __name__ == '__main__': print('Hello World') main()
|