正态分布为什么最常见,什么情况是正态分布的单位,正态分布为什么最常见,什么情况是正态分布的单位
点击上面的“
迅速的微笑学视觉
”,选择添加“星标
”或“置顶
”
重货,第一时间送达。本文转自:机器学习算法,那些事
在统计学中,正态分布是最常见的。身高、寿命、血压、考试成绩、测量误差等。男女比例都属于正态分布。
以前我认为中间状态是事物的常态,过高过低都是少数,导致了正态分布的普遍性。最近看了约翰d库克的一篇文章,我意识到我的想法是错误的。
正态分布为什么常见?真正原因是中心极限定理(central limit theorem)
。
"几个独立统计量之和的平均值符合正态分布."
上图中,随着统计数的增加,它们之和的平均值越来越符合正态分布。
根据中心极限定理,如果一个事物受到很多因素的影响,不管每个因素的分布是怎样的,它们相加后,结果的平均值就是正态分布。
比如人的身高,既有先天因素(基因),也有后天因素(营养)。每个因素对身高的影响是一个统计。无论这些统计量的分布是什么,它们之和的平均值都符合正态分布。(注:男女身高均呈正态分布,但男女混合身高不呈正态分布。)
很多事情受很多因素的影响,导致了常见的正态分布。
读到这里,读者可能马上会问一个问题:正态分布是对称的(高个子和矮个子的比例是一样的),但现实世界中很多分布是不对称的。
例如,财富的分配是不对称的。zsdct的财富(可能比平均值高几万倍)远远超过了穷人的贫困(平均值的十分之一是极端贫困),即财富分布曲线右侧有一条长尾。相比较而言,身高的差异要小得多,最高和最矮的人与平均身高的差异都在30%以上。
这是为什么呢?财富显然受到很多因素的影响。为什么不是正态分布?
原来,正态分布只适合各种因素累加的情况,如果这些因素不是彼此独立的,会互相加强影响,那么就不是正态分布了
。一个人能不能赚很多钱,是由很多因素决定的:
家庭的
教育
运气
工作
.
这些因素不是独立的,它们会相互加强。如果你出生在上流社会的家庭,你有更好的机会获得良好的教育,找到高薪的工作,遇到好的机会,反之亦然。也就是说,这不是1 1=2的效果,而是1 1 2。
统计学家发现,如果各种因素对结果的影响不是相加的,而是相乘的,那么最后的结果就不是正态分布,而是对数正态分布,即x的log(x)满足正态分布。
也就是说,财富的对数值满足正态分布。如果平均财富为1万元,那么1000元中在1万元之间(比平均值低一个数量级,宽度为9000元)的穷人和1万元到10万元之间(比平均值高一个数量级,宽度为9万元)的zsdct一样多。所以财富曲线左边幅度窄,右边长尾。
下载1:OpenCV-Contrib扩展模块中文版教程
在“迅速的微笑学视觉
”微信官方账号后台,回复:扩展模块中文教程
,
下载全网首个中文版OpenCV扩展模块教程,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理
等20多个章节。
下载2:Python视觉实战项目52讲
在“迅速的微笑学视觉
”微信官方账号后台,回复:Python视觉实战项目
,
下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别
在内的31个视觉实用项目,帮助快校计算机视觉。
下载3:OpenCV实战项目20讲
在“迅速的微笑学视觉
”微信官方账号后台,回复:OpenCV实战项目20讲
,
,可以基于20
下载20个OpenCV
,实现OpenCV的高级学习。
交换组
欢迎加入读者微信官方账号,与同行交流。目前有SLAM、3D视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群。(以后会逐步细分)。请扫描以下微信号加群,并注明:“昵称学校/公司的研究方向”,例如:“jpdyf上海交大视觉SLAM”。请按格式备注,否则不能通过。添加成功后,会根据研究方向邀请你进入相关微信群。实战项目
在群里发广告,不然就请你出群。谢谢理解~