python教程网

当前位置：首页 » 数据分析 » 正文

python 实现读取csv数据,分类求和再写进 csv

看: 2148次时间：2020-07-08 分类 : 数据分析

这两天在测试过程中，遇到这样的问题：

数据量很大，一份csv文件的数据与另外一个文件的数据进行对比，但是csv中的文件数据量很大，并且进行统计，如果手动单个去对比，会很花时间，吃力不讨好，还容易出错。

比如说，这样的数据

需要对AskPrice值相同对应的AskQuantity 统计出来。

直接上脚本：

import pandas as pd
import csv
df=pd.read_csv('D:\test\orderBook.csv')
df_sum = df.groupby('AskPrice')['AskQuantity'].sum() 
df_sum.to_csv('D:\test\orderBook2.csv')

然后运行得到：

这对于大数据量的处理特别方便。

补充知识：python处理csv文件（场景分类）

最近做一个关于场景分类的比赛，总共有20类，不到2万张图片，首先要做的就是把20类图片分到每个文件夹下。

import numpy as np
import os
import xlrd
import pandas as pd
import shutil
list_0 = []
list_file = []
flag = []
filename = os.listdir('F:\工作\比赛\未来杯\image_scene_training\data')
af = pd.read_excel('19.xlsx')
ww = af.values.tolist()
for i in ww:
  for j in i:
    list_0.append(j)
for name in filename:
  list_file.append(name[0:-4])

for name in list_file:
  if name in list_0:
    flag.append(True)
  else:
    flag.append(False)

for name in list_file:
  if flag[list_file.index(name)]:
    oldname = u'F:\工作\比赛\未来杯\image_scene_training\data\\'+name+'.jpg'
    newname = u'F:\工作\比赛\未来杯\image_scene_training\\train_data\\beach\\'+name+'.jpg'
    shutil.copyfile(oldname,newname)

unicodeDecodeError:'utf-8' codec can't decode byte 0xce in position 72: invalid continuation byte

1:升级pip python -m pip install --upgrade pip

2:改python文件内容：找到lib\site-packages\pip\compat\__init__.py

return s.decode('utf-8')

将‘utf-8'改成'gbk'

以上这篇python 实现读取csv数据,分类求和再写进 csv就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持python博客。

标签：pandas numpy

2021-12-20python数据挖掘使用Evidently创建机器学习模型仪表板
2021-12-20Python多进程共享numpy 数组的方法
2021-12-20python数据分析近年比特币价格涨幅趋势分布
2021-12-20python调用matlab的方法详解
2021-12-20python学习与数据挖掘应知应会的十大终端命令
2021-07-20pandas中NaN缺失值的处理方法
2021-07-20Python数据分析入门之数据读取与存储
2021-07-20Python 如何读取字典的所有键-值对
2021-07-20如何获取numpy的第一个非0元素索引
2021-07-20Python机器学习之KNN近邻算法

搜索

推荐资源

python教程网

当前位置：首页 » 数据分析 » 正文

python 实现读取csv数据,分类求和 再写进 csv

看: 2148次 时间：2020-07-08 分类 : 数据分析

相关文章

搜索

推荐资源

python 实现读取csv数据,分类求和再写进 csv

看: 2148次时间：2020-07-08 分类 : 数据分析