所需相关python库

编写原因:
奔腾电脑,十万数据,实属卡死,万般无奈

  • Pandas
  • Openpyxl

库介绍

Pandas

Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。

ps:咱用不到里面高大上的东西 φ(* ̄0 ̄)

Openpyxl

A Python library to read/write Excel 2010 xlsx/xlsm files

用于读取/写入Excel 2010 xlsx/xlsm文件的Python库

ps:最后发现不需要,不过在此介绍一下

代码结构

因保密协议无法贴出完整代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
import pandas as pd

# 读取文件
def fileRead(fileName, sheetName):
return pd.DataFrame(pd.read_excel(fileName, sheet_name=sheetName))


# vlookup
def vlookup(filePd1, filePd2, column_array, how, on):
return pd.merge(filePd1, filePd2.loc[:, column_array], how=how, on=on)


def main():
# 获取excel数据
renShi = fileRead('人事.xlsx', 'Sheet1')

print('获取Excel数据完毕......')

# 合并并筛选
result1 = vlookup()

print('数据筛选完毕......正在保存ing......')

# 保存最终结果
writer = pd.ExcelWriter('result.xlsx')
print('结果保存到"result.xlsx"')
result.to_excel(writer, index=False)

writer.save()

print('数据保存完毕')


if __name__ == '__main__':
print('Hello World')
main()