中心极限定理与大数定律

## 什么是中心极限定理(Central Limit Theorem) >中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些<font color=Blue>**平均值**</font>**的分布接近正态分布**。 --- ++我们先举个**栗子**?++ 现在我们要统计全国的人的体重,看看我国平均体重是多少。当然,我们把全国所有人的体重都调查一遍是不现实的。所以我们打算一共调查1000组,每组50个人。 然后,我们求出第一组的体重平均值、第二组的体重平均值,一直到最后一组的体重平均值。**中心极限定理说:这些平均值是呈现正态分布的**。并且,随着组数的增加,效果会越好。 **最后,当我们再把1000组算出来的平均值加起来取个平均值,这个<font color=Blue>平均值会接近全国平均体重</font>**。 --- **其中要注意的几点:** - **总体本身的分布不要求正态分布** 上面的例子中,人的体重是正态分布的。但如果我们的例子是掷一个骰子(平均分布),最后每组的平均值也会组成一个正态分布。(神奇!) - **样本每组要足够大,但也不需要太大** 取样本的时候,一般认为,每组<font color=Blue>**大于等于30个**</font>,即可让中心极限定理发挥作用。 --- ## 大数定律 概率论历史上第一个极限定理属于伯努利,后人称之为“大数定律”。概率论中讨论随机变量序列的算术平均值向常数收敛的定律。概率论与数理统计学的基本定律,又称弱大数理论。 大数定律(law of large numbers),又称大数定理 ,是一种描述当试验次数很大时所呈现的概率性质的定律。但是注意到,虽然通常最常见的称呼是大数“定律”,但是大数定律并不是经验规律,而是严格证明了的定理。 有些随机事件无规律可循,但不少是有规律的,这些“有规律的随机事件”在大量重复出现的条件下,往往呈现几乎必然的统计特性,这个规律就是大数定律。确切的说大数定律是以确切的数学形式表达了大量重复出现的随机现象的统计规律性,即频率的稳定性和平均结果的稳定性,并讨论了它们成立的条件。 简单地说,大数定理就是“**当试验次数足够多时,事件出现的频率无穷接近于该事件发生的概率**”。该描述即*贝努利大数定律*。 在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。比如,我们向上抛一枚硬币,硬币落下后哪一面朝上本来是偶然的,但当我们上抛硬币的次数足够多后,达到上万次甚至几十万几百万次以后,我们就会发现,硬币每一面向上的次数约占总次数的二分之一。偶然中包含着某种必然。 1733年,德莫佛—拉普拉斯在分布的极限定理方面走出了根本性的一步,证明了二项分布的极限分布是正态分布。拉普拉斯改进了他的证明并把二项分布推广为更一般的分布。1900年,李雅普诺夫进一步推广了他们的结论,并创立了特征函数法。这类分布极限问题是当时概率论研究的中心问题,卜里耶为之命名“中心极限定理”。20世纪初,主要探讨使中心极限定理成立的最广泛的条件,二三十年代的林德贝尔格条件和费勒条件是独立随机变量序列情形下的显著进展。伯努利是第一个研究这一问题的数学家,他于1713年首先提出后人称之为“大数定律”的极限定理。 大数定律有若干个表现形式。常用的有:切比雪夫大数定理,伯努利大数定律,辛钦大数定律,马尔可夫大数定律。 详细可见:[大数定理的通俗理解(辛钦、伯努利、切比雪夫大数定理) 余珏](https://zhuanlan.zhihu.com/p/77312635) --- 转载:[中心极限定理通俗介绍](https://zhuanlan.zhihu.com/p/25241653)