- UID
- 1029342
- 性别
- 男
|
大数定律严格的数学表述需要一些测度论的语言。根据其收敛性的不同,我们一般区分强大数律(SLLN)和弱大数律(WLLN)。
我不打算从这个角度来谈大数定律。理由一方面觉得要用数学的方式讲清楚得费一番工夫;另一方面,个人觉得对于大数定律更重要的在于理解,特别对于非概率专业的朋友,挖掘“大数定律揭示了何种的自然规律”才是更有意义的事情。
大致上讲,大数定律表达了这样一件事:将大量在微观上的随机运动作宏观的平均,这个宏观平均量会表现出某种确定性。之所以会这样,直观上可以理解成当观测的微观粒子足够多,“随机扰动”就会被“averageout”。这是不难理解的,在生活中我们会遇到许许多多这样的经验。比如扔硬币,如果扔的次数很少,比如三、五次,这样统计一下出现“正面”的频率,会发现波动很大;但是当多次之后,比如100次,就会发现出现“正面”的频率大约在1/2上下徘徊。所以我们都能接受扔硬币出现正面的概率是“1/2”的说法。但大家必须明白,“概率”是无法测量的,只有“频率”是可以被测量的。所以正是大数定律告诉我们,用“频率”去推测“概率”是合理的。
几乎每本初等概率论的书都会在大数定律的部分讲解上面的内容。在教科书里,对于大数定律总会强调两件事:“独立性”和“大量”。个人不愿意把这两个词严格化,我更希望朋友们能“模糊”的去体味。独立性就是指系统中的个体运动尽量保持独立,不要太受其它个体的影响。如果不是这样,“averageout”就不一定会起作用。
基于大数定律的启示,我们在处理实际问题的时候,可以有这样的倾向:如果我们面对的系统存在大量的粒子或个体,在处理系统动力学方面问题的时候,可以尝试忽略个体随机噪声的影响,而这种忽略不会对系统的整理行为分析带来太多误差。当然这只是一种方法倾向,严格起来还是得具体问题具体分析。
个人体会概率论最为诡异的地方在于“真实的概率”是“不可观测”。虽然在理论上,概率论有非常严格的公理体系和丰富的研究成果。但是在现实中,人们仍然会质疑概率论在哲学层面的意义。我的一些朋友,学法律,学中文,学生物等等,跟我交谈最多的就是“概率”本身的涵义。很遗憾,给出一个满意答复的难度不小。
但是我想一定程度上大数定律可以扮演这样的角色。
大数定律反映了“大量微观随机会产生宏观稳定”的这样一条朴素原则。回避了数学式的讲解。这次的讨论依旧会按照这样的模式。我计划在第三次的时候用数学的方式和观点去讨论大数定律。
这次引入一个新的概念“ ergodicity”,遍历性。它有很深的物理背景,又是很多数学分支关心的话题。这里只是把它作为大数定律的某种推广供大家体会,不会深入发散。
遍历性源自于统计物理的“遍历假设”。下面的内容摘自百度百科http://baike.baidu.com/view/692121.htm
“系统的一个状态在相空间中有一个代表点P=(p,q),系统的运动就对应于点P在相空间中的运动。如果系统是保守的,其总能量E便是常数,点P的运动就被限制在相空间中的等能面(称为能量面)H=E之上。
假如系统的自由度n非常大,例如在一定容器中气体分子的运动(宏观上微小的体积中仍含有大量的分子),如果与外界没有能量交换,就是一个保守的力学系统。这时n=3N,N是分子的数目。因为人们无法去解如此巨大数目的哈密顿方程组,也无法实际地测得解方程时所必需的初始资料,所以不可能再用纯经典力学的方法来研究这样的系统。其实,系统中大量分子运动的综合作用才决定出系统的宏观性质。例如,气体的单个分子只是断续地冲撞容器壁,而大量分子冲撞的综合平均作用才形成了气体对器壁的稳定的压强。为了研究这类本质上是统计性质的运动规律,人们设想同时考虑都是含有N个粒子,处于同一外部条件之中并且具有同一哈密顿量,但微观状态不一样的一切可能的系统。这些系统在相空间中的代表点就不一样。这些宏观条件一样的一切可能的微观系统的全体称为系综(ensemble)。L.E.玻耳兹曼,特别是J.W.吉布斯建立了完整的统计系综方法,类比于流体力学中的刘维尔定理,证明了系综的概率分布守恒定理。如果用φt(P)表示相点P经过时间t之后在相空间中达到的点,那么φt便是相空间的一个变换。所谓概率守恒,就是说φt能使一定的概率测度保持不变。如果某系综相应的概率分布不显含时间,就称做稳定系综。统计力学基本假设之一是认为真实的平衡物理系统在某时刻的状态与其相应的稳定系综在相空间中的点有相同的概率。
但实验中的量测总要经历一段时间。即使宏观上很短的时间,从微观的角度来考察也是相当长的。例如,在0℃和1大气压下,1立方厘米体积中的气体分子每秒钟大约碰撞1029次,即使在10-6秒这样宏观很短的时间里,碰撞也达1023次。所以,宏观量测的物理量,都是一个微观相当长时间的平均值,可以认为就是。但这一(极限)平均值无法从微观的力学分析中推算出来,因为无法确定相轨道的初始数据。为了用微观的力学分析解释宏观的物理现象,统计力学中提出了以下基本原理(或基本假设):对于平衡物理系统,物理量在相空间中按概率测度的平均应等于这物理量沿一轨道的时间平均。
为了支持这一基本原理的引入,玻耳兹曼提出所谓遍历假设,认为一条相轨线可以跑遍(或者说充满)整个能量面。以后又有人提出准遍历假设,认为一条相轨线可以任意接近能量面上的任何一点。然而数学的研究指出,上述遍历假设不可能成立,而准遍历假设又不足以保证“相平均=时间平均”。因此,以后关于统计力学数学基础的研究,集中注意力于“相平均=时间平均”这一条件本身,把满足这一条件的系统称为是遍历的,或者称为是具有遍历性的。自20世纪30年代开始,以G.D.伯克霍夫、J.冯·诺伊曼、Α.Я.辛钦和其他许多数学家的工作为标志,关于遍历性的研究形成了一个重要的数学分支。 ”
我们回顾强大数定律的表述:X1,X2,...,Xn代表了独立同分布的随机变量,当X1的一阶矩存在时
X1+X2+...+Xn/n几乎处处收敛到E(X1)。
左端的算术平均可以理解成“时间平均”,右端的E(X1)代表了“相平均”(也可叫做空间平均)。所以大数定律是可以纳入到遍历理论的体系当中。即我们可以讲,独立系统满足“基本假设”。
熟悉马氏过程的朋友一定能联想到,类似地,当马氏链满足一定条件时,也能满足“基本假设”。姑且我们把满足这种假设的马氏链叫做“遍历链”。
所以对于大家最熟悉的随机过程,“独立系统”和“马氏系统”,在一定条件下都能够具备统计力学研究中期望看到的“相平均=时间平均”的基本假设。
至于还有怎样的过程或者系统能满足这样的假设,数学物理中有比较专门的研究。
我想跟大家分享的是,大数定律的表述简单而朴实,而这恰恰又能揭示本质的物理背景,联系多个学科分支。数学当然是充斥着“技巧”的艺术,但是好的数学研究多半是能归于简单而朴素的思考和观察。
作为结束,本次对于大数定律的讨论将从数学角度进行。
首先,数学最希望得到命题的“充要”条件,因为充要条件是对命题本身的一次等价刻画,是对命题内涵的重新认识。以下均假设X1,X2,...,Xn...代表独立同分布的随机变量序列,
强大数定律 等价 X1的一阶矩存在;
弱大数定律 等价 xP(|X1|>x)收敛到0,当x趋近于正无穷。
由此也很容易看出,强大数定律蕴含了弱大数定律。具体内容大家可以查阅Durrett的教材第一章。定理的证明用到了“截断”技术。
另外,我们以强大数定律为例,“X1+X2+...+Xn/n几乎处处收敛到E(X1)”。把E(X1)移到左端通分之后,可以理解成
Xi-E(Xi)(i=1,2,3...)的算术平均值几乎处处收敛到0。我们换个角度看,可以把它理解成Xi-E(Xi)求和之后的增长速度不如“n”快。数学分析的一个重要内容就是寻找变量的“阶”。那么Xi-E(Xi)求和之后的阶应该是多大?除以这个“阶”以后,它在什么意义下收敛到非零量?
由此,引出了中心极限定理。中心极限定理告诉我们,这个“阶”应该是“根号n”的样子。 |
|