处理等深分箱 深度不为整数的处理方法 equi-depth binning

    xiaoxiao2022-06-26  76

    @划分(Binning)

    遇到处理等深分箱 深度不为整数的处理方法

    N = [1, 2, 3, 4, 5, 6] bins = 4

    那么我们划分的深度 就是 depth = N/bins = 1.5>0 每个分箱给约1.5,这里其实可以进行拆分

    将 1 划给第一个分箱 [1], 将剩余的 0.5 给下一个分箱子,这样下一个分箱就有 1.5 + 0.5 = 2 个数可取 ,也就是说 [2,3] 划给了第二个分箱,后面的处理也一样,这样我们就能得到完整的分箱:[1], [2, 3], [4], [5, 6]

    以上depth不为整数的划分,depth为整数就比较好划分了 如果bins = 3 那么 depth = N/3 = 2 则每个分箱会获取到两个数据。 划分结果:[1, 2], [3, 4], [5, 6]

    部分结果参考:https://stackoverflow.com/questions/34264268/equal-depth-binning-whether-it-is-just-grouping-data-into-k-groups


    最新回复(0)