偏态数据分布(Skewed Distribution)是指数据的分布不对称,意味着数据集的分布在某一侧有更多的数据点,而另一侧则相对较少。根据数据分布的偏斜方向,偏态可以分为两种类型:
- 正偏(右偏)分布(Positively Skewed Distribution):
- 数据的右侧尾巴较长,意味着大多数数据点集中在分布的左侧。
- 均值 > 中位数 > 众数,即均值大于中位数,且中位数大于众数。
-
例如:收入、房价等数据通常呈正偏分布,因为大多数人或房产的价格较低,但少数人或豪宅的价格极高。
-
负偏(左偏)分布(Negatively Skewed Distribution):
...