#数据NaN值故障排除、统计、排序
data.isnull()
*数据是一个数据框架结构。
# np.sum(data.isnull())
*找到的缺失值总数
# data.sort_values()
*根据某一列对数据进行排序,
*或按某两列排序。
#四种基本统计方法
*最大np,最大(),最小np.min(),平均np.mean(),分位数np.quantile()
#分组数据.分组依据
*分组:df.groupby(),根据某个字段分组;返回分组对象df。groupby (by=[.]) df。groupby (by=[.])可以由多个字段分组,以形成分层索引结构。
qvj2l q49k 0/25f 690 e 991474 ca e9 d 35 aeeeecd 0 e 354 /
*聚合还可以根据具体字段按字典设置不同的统计方法:group . agg({字段名称:统计方法名称})
qvj2l q49k 0/394 a 89 f2ef 340 f 59798657416423 FFA /
* apply的参数也可以是函数,用于在df中操作一系列。
#转换
*返回与数据长度相同的行,并且不能聚合。