时间:2020-07-08 数据分析 查看: 980
需求:
1.大量csv文件,以数字命名,如1.csv、2.cvs等;
2.逐个打开,对csv文件中的某一列进行格式修改;
3.将更改后的内容写入新的csv文件。
解决思路:
先读取需处理的csv文件名,去除文件夹下的无用文件,得到待处理文件地址名称和新文件保存的地址名称,分别读取每一个csv文件进行处理后写入新的文件。
if __name__ == '__main__':
filenames_in = '../Train_data/' # 输入文件的文件地址
filenames_out = '../Train_data1/' # 新文件的地址
pathDir = os.listdir(filenames_in)
for allDir in pathDir:
child = re.findall(r"(.+?).csv", allDir) # 正则的方式读取文件名,去扩展名
if len(child) > 0: # 去掉没用的系统文件
newfile=''
needdate = child #### 这个就是所要的文件名
domain1 = os.path.abspath(filenames_in) # 待处理文件位置
info = os.path.join(domain1, allDir) # 拼接出待处理文件名字
domain2 = os.path.abspath(filenames_out) # 处理完文件保存地址
outfo = os.path.join(domain2, allDir) # 拼接出新文件名字
print(info, "开始处理")
# ------省略数据处理过程----------------------
df.to_csv(outfo, encoding='utf-8') # 将数据写入新的csv文件
print(info,"处理完")
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持python博客。