首页 > 数据分析

Series和DataFrame使用简单入门

时间:2021-02-23 数据分析 查看: 1093

(1)、导入库

from pandas import Series,DataFrame
import pandas
import numpy

(2)、Series简单创建与使用

#Serires
obj = Series([4,7,-5,3]) #简单创建Serires
print(obj) #简单输出
print(obj.values) #输出值
print(obj.index)  #输出索引

obj2 = Series([4,7,-5,3], index=['d','b','a','c'])  #指定索引
print(obj2)   #简单输出
print(obj2.index)  #输出索引
print(obj2['a'])  #根据索引输出单个值
obj2['d']=6   #根据索引修改值
print(obj2['d'])  #输出
print(obj2[['d','a','c']]) #输出多个值
print(obj2[obj2 > 0])  #按条件输出
print('b' in obj2) #根据索引看数组里面是否有,返回True
print('e' in obj2) #返回False

(3)、根据字典创建Series

#根据字典创建Series
sdata = {'Oer':56,'asdgr':32,'rgg':89,'greg':44}
obj3 = Series(sdata)
print(obj3)

(4)、列表与字典进行匹配

#列表与字典进行匹配
sdata = {'Oer':56,'asdgr':32,'rgg':89,'greg':44}
states = ['Casfef','Oer','rgg','greg'] 
obj4 = Series(sdata, index = states)  #列表与字典进行匹配
print(obj4)
print(pd.isnull(obj4)) #查看数据是否为空
print(pd.notnull(obj4)) #查看数据是否非空

(5)、两个Serires相加

#两个Serires相加
obj1 = Series([3,7,-4,3], index=['q','b','a','c'])
obj2 = Series([4,7,-5,3], index=['d','b','a','g'])  
print(obj1 + obj2) #两个Serires相加,具有共同索引的则相加,如果不是共同索引就置为NaN

(6)、修改索引的名字

#修改索引的名字
#obj = Series([4,7,-5,3], index=['d','b','a','g'])  
#obj.index = ['Bob','Steve','Jeff','Ryan']
#print(obj.index)

(7)、dataframe的简单应用

#dataframe的简单应用
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data)   #根据字典创建DataFrame
frame2 = DataFrame(data, columns= ['state', 'pop', 'year'])   #指定列的排列顺序
frame3 = DataFrame(data, index= ['a','b','c','d'])   #指定行索引

(8)、获取DataFrame其中的一列(相当于Series)

#获取DataFrame其中的一列(相当于Series)
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data,index= ['q1','q2','q3','q4'])   #根据字典创建DataFrame
print(frame['year'])  #获取其中的一列
print(frame.loc['q2'])  #获取其中的一行

(9)、修改DataFrame中的值

#修改DataFrame中的值
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data,index= ['q1','q2','q3','q4'])   #根据字典创建DataFrame
frame['grg'] = numpy.arange(4) #修改某一列的值
val = Series([8.2,8.5,8.7], index=['q1','q3','q4'])   #修改指定列的值
frame['pop'] = val
print(frame)

(10)、输出DataFrame整体值

#输出DataFrame整体值
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data,index= ['q1','q2','q3','q4'])   #根据字典创建DataFrame
print(frame.values)

(11)、DataFrame的构造函数

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持python博客。

展开全文
上一篇:numpy.array 操作使用简单总结
下一篇:基于Python实现ComicReaper漫画自动爬取脚本过程解析
输入字:
相关知识
python数据挖掘使用Evidently创建机器学习模型仪表板

在本文中,我们将探索 Evidently 并创建交互式报告/仪表板。有需要的朋友欢迎大家收藏学习,希望能够有所帮助,祝大家多多进步早日升职加薪

Python多进程共享numpy 数组的方法

本文章主要介绍了Python多进程共享numpy 数组的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

python数据分析近年比特币价格涨幅趋势分布

这篇文章主要为大家介绍了python分析近年来比特币价格涨幅趋势的数据分布,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步

python调用matlab的方法详解

这篇文章主要为大家介绍了python调用matlab,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助