pandas 是numpy的一种工具,是在数据分析时使用的一种工具本文主要讲:
序列的创建
序列是能够保存任何类型的数据的一维标记数组。轴标签统称为索引
#引入模块
import numpy as np
import pandas as pd
#创建一个空的Series
ser0 = pd.Series(dtype='float64')
ser0 Series([], dtype: float64)
通过ndarray创建一个系列ser1 = np.array(['a','b','c','d',9,3,np.NaN,10.9])
ser2= pd.Series(ser1)
print(ser2)
ser1
查看series的各项属性#查看series的索引,类型,值
print(ser2.dtype)
print(ser2.index)
print(ser2.values)
通过一维数组创建
ser = pd.Series([40,60,90])
print(ser)
#设置索引
ser.index=['语文','数学','英语']
print(ser)
#在创建序列的时候进行指定索引
ser = pd.Series(data=[80,100,95],dtype='float64',index=['英语','语文','数学'])
ser
通过字典进行创建
data = {'a':2, 'b':4, 'c':5}
ser = pd.Series(data)
ser
指定索引
#指定索引
ser = pd.Series(data,index = ['a','k','h','c'])
ser
通过series获取值
ser = pd.Series([80,90,95],dtype='int32',index=['英语','语文','数学'])
print(ser)
print(ser['语文'])
print(ser[0])
print(ser[-1])
print(ser['语文':'数学'])
Series运算
#Series运算
data = ({'金钱_1':1000,'金钱_2':87898,'金钱_3':80})
ser= pd.Series(data)
ser
ser[ser<2000]
加减乘除
print(ser+10)
print(ser-10)
print(ser*2)
print(ser/4)
#两个series相加
ser1 = pd.Series({'金钱_1':100,'金钱_2':102,'金钱_3':20})
ser1+ser
ser2 = pd.Series({'金钱_1':100,'金钱_2':102,'金钱_3':20,'金钱_4':70})
ser+ser2
series使用numpy的函数进行运算
ser = pd.Series([3,4,5])
#)计算各个元素的指数e的x次方 e 约等于 2.71828
np.exp(ser)
#求其最大值
np.max(ser) 5
Series缺失值检测
ser = pd.Series({'金钱_1':100,'金钱_2':102,'金钱_3':20})
ser = pd.Series({'金钱_1':100,'金钱_2':102,'金钱_3':20},index = ['金钱_1','金钱_2','金钱_3','金钱_4'])
ser
print(pd.isnull(ser))
print(pd.notnull(ser))
print(ser[pd.notnull(ser)])
print(ser[pd.isnull(ser)])
series自动对齐
series = pd.Series({'a':1,'c':2,'b':3})
series2 = pd.Series({'a':1,'b':2,'c':3,'d':100})
print(series+series2)
series属性name
ser = pd.Series({'金钱_1':100,'金钱_2':102,'金钱_3':20})
ser.name='收入'
ser.index.name='项目一组收入'
ser
print(ser.name)
print(ser.values)
print(ser.index)
print(ser.dtype)
print(ser.index.name)
print(ser.size)
print(ser.head(2))
print(ser.tail(2))
|