Tic商业评论

关注微信公众号【站长自定义模块】,定时推送前沿、专业、深度的商业资讯。

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫码,快速开始

pandas基础: series创建以及运算

0
回复
5517
查看
[复制链接]
已绑定手机

49

主题

4

回帖

1228

积分

管理员

积分
1228
QQ
来源: 2020-6-26 20:41:01 显示全部楼层 |阅读模式
pandas 是numpy的一种工具,是在数据分析时使用的一种工具本文主要讲:
  • 序列的创建
  • 通过序列获取值
  • 序列的各种运算





序列的创建
序列是能够保存任何类型的数据的一维标记数组。轴标签统称为索引


#引入模块

import numpy as np

import pandas as pd
#创建一个空的Series

ser0 = pd.Series(dtype='float64') 

ser0
Series([], dtype: float64)
通过ndarray创建一个系列
ser1 = np.array(['a','b','c','d',9,3,np.NaN,10.9])

ser2= pd.Series(ser1)

print(ser2)

ser1
xinxi.jpg
查看series的各项属性
#查看series的索引,类型,值

print(ser2.dtype)

print(ser2.index)

print(ser2.values)
xinxi.jpg

通过一维数组创建
ser = pd.Series([40,60,90])

print(ser)

#设置索引

ser.index=['语文','数学','英语']

print(ser)
xinxi.jpg

#在创建序列的时候进行指定索引

ser = pd.Series(data=[80,100,95],dtype='float64',index=['英语','语文','数学'])

ser
xinxi.jpg

通过字典进行创建
data = {'a':2, 'b':4, 'c':5}

ser = pd.Series(data)

ser
xinxi.jpg

指定索引
#指定索引

ser = pd.Series(data,index = ['a','k','h','c'])

ser
xinxi.jpg

通过series获取值
ser = pd.Series([80,90,95],dtype='int32',index=['英语','语文','数学'])

print(ser)

print(ser['语文'])

print(ser[0])

print(ser[-1])

print(ser['语文':'数学'])
xinxi.jpg

Series运算
#Series运算

data = ({'金钱_1':1000,'金钱_2':87898,'金钱_3':80})

ser= pd.Series(data)

ser
xinxi.jpg

ser[ser<2000] xinxi.jpg

加减乘除
print(ser+10)

print(ser-10)

print(ser*2)

print(ser/4)
xinxi.jpg
#两个series相加

ser1 = pd.Series({'金钱_1':100,'金钱_2':102,'金钱_3':20})

ser1+ser
xinxi.jpg

ser2 = pd.Series({'金钱_1':100,'金钱_2':102,'金钱_3':20,'金钱_4':70})

ser+ser2
xinxi.jpg

series使用numpy的函数进行运算
ser = pd.Series([3,4,5])

#)计算各个元素的指数e的x次方  e 约等于 2.71828

np.exp(ser)
xinxi.jpg

#求其最大值

np.max(ser)
5

Series缺失值检测
ser = pd.Series({'金钱_1':100,'金钱_2':102,'金钱_3':20})

ser = pd.Series({'金钱_1':100,'金钱_2':102,'金钱_3':20},index = ['金钱_1','金钱_2','金钱_3','金钱_4'])

ser
xinxi.jpg

print(pd.isnull(ser))

print(pd.notnull(ser))
xinxi.jpg

print(ser[pd.notnull(ser)])

print(ser[pd.isnull(ser)])
xinxi.jpg

series自动对齐
series = pd.Series({'a':1,'c':2,'b':3})

series2 = pd.Series({'a':1,'b':2,'c':3,'d':100})

print(series+series2)
xinxi.jpg

series属性name
ser = pd.Series({'金钱_1':100,'金钱_2':102,'金钱_3':20})

ser.name='收入'

ser.index.name='项目一组收入'

ser
xinxi.jpg
print(ser.name)

print(ser.values)

print(ser.index)

print(ser.dtype)

print(ser.index.name)

print(ser.size)

print(ser.head(2))

print(ser.tail(2))
xinxi.jpg









回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册
电话咨询: 135xxxxxxx
关注微信