"""=====================================标准化数据========================================"""
# 一般特征之间有不同的量纲,如果不做处理,会造成数据间的差异很大,则涉及空间距离计算或者相似度计算时,需要对不同特征数据标准化
# (1.)离差标准化:x=(x-min)/(max-min) 注意:1、当max= min 没有意义 2、min/max是否为异常值
x_max = detail['amounts'].max()
x_min = detail['amounts'].min()
x = (detail['amounts'] - x_min) / (x_max - x_min)
# print(x)
# (2.)标准差标准化:x=(x-mean)/std
x_mean = detail['amounts'].mean()
x_std = detail['amounts'].std()
x1 = (detail['amounts'] - x_mean) / x_std
# print(x1)
# (3.)小数定标标准化数据 x=x/10`k 将所有的数都化为小数
# 1、找到最大值 x.max()=10`k k=log10(|x|.max()):k可能是小数,向上取整
k_max = abs(detail['counts']).max()
k = np.ceil(np.log10(k_max))
m = detail['counts'] / 10 ** k
# print(m)