项目目标
用Python实现两张Excel或Csv表数据关联处理。
项目准备
软件:PyCharm
需要的库:pandas
项目分析
1)如何读取要处理的Csv文件?
利用pandas库读取Csv文件。
2)如何读取要处理的Excel文件?
利用pandas库读取Excel文件。
3)如何通过关键字段关联匹配两张表中的数据?
利用merge()函数,通过关键字段,关联组合两张表中的数据。
4)如何保存结果?
利用to_csvl保存关联组合后的数据。
项目实现
第一步导入需要的库
- import pandas as pd
第二步读取要处理的Csv文件
- # 读入表1
- df1 = pd.read_csv('D:/a/1.csv', encoding='gbk')
第三步读取要处理的Excel文件
- # 读入表2
- 第四步关联匹配数据,并保存结果文件
- # 关联数据
- data = df1.merge(df2, on='姓名',left_index=False, right_index=False, sort=False)
- # 保存数据
- data.to_csv('D:/a/result.csv', encoding='gbk',index=False)
效果展示
处理前表1数据: