Pandas索引设置

索引设置

函数介绍

1
2
3
4
5
6
7
8
9
10
11
# 重新输入索引值(行、列皆可)
df.reindex(lables=None, index=None, columns=None, axis=None,
method=None, copy=True, level=None,fill_value=nan,
limit=None,tolerance = None)

# 设置某列为行索引(drop=Ture为删除列记录,改写为0,1,2等默认索引)
df.set_index(['买家会员名'])
df.set_index(['买家会员名',drop=True])

# 删除空值后,重置索引
df1= df.dropna().reset_index(drop=True)

准备工作

1
2
3
4
5
6
import pandas as pd
pd.set_option('display.unicode.east_asian_width', True)

df = pd.read_excel(
'F:/project2_pandas/Python数据分析从入门到精通/MR/Code/03/37/TB2018.xls')
df.head()

正式应用

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
''' 
df.reindex(lables=None, index=None, columns=None, axis=None,
method=None, copy=True, level=None, fill_value=nan,
limit=None, tolerance=None)
method为填充方法(默认为None,向后填充为bfill/backfill,向前填充为ffill/pad
fill_value为填充值。默认为NaN,若使用其他值如0,fill_value=0
该方法手动输入索引信息,
当输入的索引数量大于表格自身索引数时,则可以使用填充方法,默认填充NaN;
当输入的索引数量小于表格自身索引数时,则不再显示超过索引数的记录。
'''
# 只输入索引数值时,默认为行索引
df1 = df.reindex([1,2,3,4,5,6])
print(df1)

# 设置列索引时,需要将已有的列索引重新输入一遍,然后添加新的索引值
df2 = df.reindex(columns=['买家会员名','买家实际支付金额','宝贝总数量','宝贝标题','类别','订单付款时间','备注'])
print(df2)

# 设置某列为行索引
df4 = df.set_index(['买家会员名'])
df4.head()

# 数据清洗后,设置连续的行索引
'''
在进行数据清洗后,删除的记录的索引也会被删除,于是导致索引不连续
'''
df6 = df.dropna().reset_index(drop=True)
df.head()

本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!