数据抽取

数据抽取

1. 数据抽取pandas属性

1
2
3
loc属性:以列名(column)和行名(index)作为参数,当只有一个参数时,默认是行名。

iloc属性:以行和列的位置索引(0,1,2...)作为参数,0 表示第一行(列)。

2. 准备工作

1
2
3
4
5
6
import pandas as pd 
pd.set_option('display.unicode.east_asian_width', True)
data = [[11,12,13],[12,13,14],[13,14,15],[14,15,16]]
columns = ['语文','数学','英语']
index = ['lili','anan','dan','zhu']
df = pd.DataFrame(data=data, columns=columns,index=index)

3. 属性应用

3.1. 抽取某一行的数据
df.loc['lili']

3.2. 抽取某行某列的特定单元格的数据
df.loc['lili', '语文']

3.3. 抽取某一行的数据
df.iloc[0]

3.4. 抽取某行某列的特定单元格的数据
df.iloc[0, 0]

3.5. 抽取多行数据
3.5.1. 抽取任意多行数据
df.loc[['lili', 'dan']]

df.iloc[[0, 2]]

3.5.2. 抽取连续多行数据

df.loc['lili':'anan']

df.loc[:'anan']

df.loc['anan':]

df.iloc[1:3]

df.iloc[:3]

df.iloc[2:]

3.6. 抽取列数据

print(df['语文'])

print(df.loc[:, '语文':'英语'])

print(df.iloc[:, [0, 1]])

3.7. 抽取行、列数据

print(df.loc[['lili','anan'],['语文','数学']])

print(df.loc['lili':'dan','语文':'英语'])

print(df.iloc[0:2,0:1]) # 这种形式下输出结果不包含:右边的数据

print(df.iloc[[0,2],[0,1]])

3.8. 按照指定条件获取数据

df.loc[(df['语文']>10) &( df['数学']<14)]


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!