赞
踩
有时候需要将多个列名均相同的csv文件合成一个。
首先需要导入并合并多个csv文件,但是这会把除第一个csv文件外的列名也当成一行数据,这时候需要进行去重,删除所有的列名,最后根据需要来决定是否对新生成的DataFrame对象进行排序后输出csv。
一、导入所需的包1
2
3import os
import pandas as pd
import glob
二、合并多个csv文件1
2
3
4
5
6
7
8csv_list = glob.glob('*.csv') #查看同文件夹下的csv文件数
print(u'共发现%s个CSV文件'% len(csv_list))
print(u'正在处理............')
for i in csv_list: #循环读取同文件夹下的csv文件
fr = open(i,'rb').read()
with open('result.csv','ab') as f: #将结果保存为result.csv
f.write(fr)
print(u'合并完毕!')
共发现9个CSV文件
正在处理............
合并完毕!
三、去重函数
这个函数将重复的内容去掉,主要是去表头。
1df = pd.read_csv("result.csv",header=0)
1df.info()
RangeIndex: 659867 entries, 0 to 659866
Data co
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。