大数定律与中心极限定理是统计学家总结出的自然现象,是概率统计的基石。很多定理和推论都是基于它们之上的研究。
大数法则
讲个故事,一位数学家调查发现,欧洲各地男婴与女婴的出生比例是22:21,只有巴辈是25:24,这极小的差别使他决心去查个究竞。最后发现,当时巴黎的风尚是重女轻男,有些人会丢弃生下的男婴,经过一番修正后,出生比例依然是22:21。中国的历次人口普查的结果也是22:21。人口比例所体现的,就是大数法则。
大数法则(Lawoflargenumbers)又称“大数定律”或“平均法则”。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这类规律就是大数法则。在试验不变的条件下,重复试验多次,随机事件的出现的次数近似于它的概率。简单来说就是把频率当作概率。
至于为什么叫平均法则是因为它的数学定义:若对任意的\(n>1\) 都有\(X_{1},X_{2},\cdots X_{n}\) 相互独立,期望为\(m\) , \(Sn=X_{1}+X_{2}+\cdots+X_{n}\) ,则\(\frac{S_n}{n}\)收敛到\(m\)。
含义:在\(n\) 很大时,某随机变量序列的均值收敛于它的期望,这里的收敛即“充分接近”。如,样本数量很大时,样本均值依概率收敛于总体均值。
大数法则反映了世界的一个基本规律:在一个包含众多个体的大群体中,由于偶然性而产生的个体差异,着眼在一个个的个体上看,是杂乱无章、毫无规律、难于预测的。但由于大数法则的作用,整个群体却能呈现某种稳定的形态。例如花瓶是由分子组成,每个分子者不规律地剧烈震动。但可曾见过一只放在桌子上的花瓶,突然自己跳起来?
小数法则
大数法则是统计学的基本常识,有人称为“统计学的灵魂”。大数法则虽然威力无穷, 普通人却因其貌不扬而忽视。针对人们在思考时常常无视大数法则的现象,特韦斯基提出了“小数法则”(Lawofsmallnumbers)的概念。“小数法则”不是什么定律或法则,而是一种常见的心理误区。举个简单的例子,在玩抛硬币游戏的时候,如果连续五次抛硬币的结果都是正面,会有很多人倾向于猜测下一次抛硬币的反面的概率比正面大,这就是小数法则带来的心理误区。
中心极限定理
中心极限定理(CentralLimitTheorem)指大量随机变量的和分布趋近于正态分布,即大量( \(n\rightarrow\infty\) )、独立、同分布的随机变量之和,近似服从于一维正态分布。讲通俗一些:中心极限定理指的是给定一个任意分布的总体。每次从这些总体中随机抽取\(n\) 个抽样,一共抽\(m\) 次。然后把这\(m\) 组抽样分别求出平均值。这些平均值的分布接近正态分布。服从:
$$\overline{x}\sim N\Bigg(\mu,\Bigg(\frac{\sigma}{\sqrt{n}}\Bigg)^2\Bigg)$$
例1-9:现在要统计全国的人的体重,看看我国平均体重是多少。当然,把全国所有人的体重都调查一遍是不现实的。所以假设共调查1000组,每组50个人。然后,求出第一组的体重平均值、第二组的体重平均值,一直到最后一组的体重平均值。中心极限定理表明这些平均值是呈现正态分布的。并且,随着组数的增加,效果会越好。最后,再把1000组算出来的平均值加起来取个平均值,这个平均值会接近全国平均体重。
之所以叫做“中心”,只是突出它的重要性,有两个较为接近的解释。一是,早时的研究者认为正态分布是一切分布甚至万物的中心(《数理统计简史》):二是,研究和分布的极限定理的人,认为这个定理是数学学科的中心(张宇)
暂无评论内容