知识问答

基尼系数的公式

基尼系数是评价数据分布均匀程度的一种常用方法,通常用于衡量贫富分配不均或者分类变量分布不均等情况。其公式如下:

G = 1 - (p1)^2 - (p2)^2 - ... - (pn)^2

例如如果有数据集包含四个类别,它们的占比分别为0.1、0.2、0.3和0.4,则基尼系数可以通过以下方式计算:

G = 1 - (0.1)^2 - (0.2)^2 - (0.3)^2 - (0.4)^2 = 0.54