Sereies
series -一组数据 vs DateFrame=二维、多维数据
注意:Series 的首字母大写, 表示小写的series
DateFrame:
字典: {索引:值}
列表:【'a','b','c'】
如果数组很大。 可以用frame.head()来显示前5列(默认,当然, 括号里可以填写数字,表示显示前几列。
也可以通过调整column的位置来调整列的顺序。使用pd.DataFrame(data, columns=['year','state','pop']) 本例子中交换了'year' 和'state' column.
上图,pd.DataFrame 定义了一个debt 列,但是没有赋值,这样系统就默认赋一个空值NaN
也可以直接查询数组的columns 来得到二维数组的表头名。
要想获取dataframe的一个列,可以用点 也可以用【‘列名’】
切片
给某一列赋值可以用frame['列名']=16.5 ,也可以用=np.arrange(6) 函数赋一个序列。
注意要先import numpy as np ,另外,arange(6)是1~6是整型, 如果是arange(6.)则表示浮点型。
用frame.T 来将数组转置
drop()方法可以丢弃某些列
iloc =indexlocation, data.iloc[2<第3 行>,[3,0,1<第4,第1,第2 列>] 实际位置是该数字+1, 如2 代表第2+1行。
重点:frame.sort_index() 和 sort_values()
skipna=false空值排除掉,不参与tong