首页 > 数据分析

Python批量处理csv并保存过程解析

时间:2020-07-08 数据分析 查看: 980

需求:

1.大量csv文件,以数字命名,如1.csv、2.cvs等;

2.逐个打开,对csv文件中的某一列进行格式修改;

3.将更改后的内容写入新的csv文件。

解决思路:

先读取需处理的csv文件名,去除文件夹下的无用文件,得到待处理文件地址名称和新文件保存的地址名称,分别读取每一个csv文件进行处理后写入新的文件。

if __name__ == '__main__':
  filenames_in = '../Train_data/' # 输入文件的文件地址
  filenames_out = '../Train_data1/' # 新文件的地址
  pathDir = os.listdir(filenames_in)
  for allDir in pathDir:
    child = re.findall(r"(.+?).csv", allDir) # 正则的方式读取文件名,去扩展名
    if len(child) > 0: # 去掉没用的系统文件
      newfile=''
      needdate = child #### 这个就是所要的文件名
    domain1 = os.path.abspath(filenames_in) # 待处理文件位置
    info = os.path.join(domain1, allDir) # 拼接出待处理文件名字
    domain2 = os.path.abspath(filenames_out) # 处理完文件保存地址
    outfo = os.path.join(domain2, allDir) # 拼接出新文件名字
    print(info, "开始处理")
# ------省略数据处理过程----------------------
    df.to_csv(outfo, encoding='utf-8') # 将数据写入新的csv文件
    print(info,"处理完")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持python博客。

展开全文
上一篇:Python使用Excel将数据写入多个sheet
下一篇:解决Python数据可视化中文部分显示方块问题
输入字:
相关知识
python数据挖掘使用Evidently创建机器学习模型仪表板

在本文中,我们将探索 Evidently 并创建交互式报告/仪表板。有需要的朋友欢迎大家收藏学习,希望能够有所帮助,祝大家多多进步早日升职加薪

Python多进程共享numpy 数组的方法

本文章主要介绍了Python多进程共享numpy 数组的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

python数据分析近年比特币价格涨幅趋势分布

这篇文章主要为大家介绍了python分析近年来比特币价格涨幅趋势的数据分布,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步

python调用matlab的方法详解

这篇文章主要为大家介绍了python调用matlab,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助