概率统计及其应用

   概率统计系教授 谢衷洁

一般人都认为数学所研究的数量关系或空间形式都是确定的。其实,许多数学问题的答案可以是不确定的,如:圆内任意作一弦,问它的长度是否大于该圆内接等边三角形的边长?学过平面几何的人很快就会说:“不一定。有可能大于,也有可能小于该边长。”如果进一步问:任意画圆内的弦一百次,至少有多少次会大于该边长?要回答这—问题,初等数学已是很难准确回答了,甚至说要确切将它提成数学问题已很不容易。由于此问题叙述得不够清楚,历史上曾有人用三种方法给出了“同一”问题的三种不同答案。这就是著名的Bertrand氏奇论。研究不确定性及其规律就是概率论研究的内容。不确定性、或称偶然性、随机性,在概率论里认为是现实世界中普遍存在的,在大量观察中它们是具有稳定的规律的,而确定性的现象和规律则是随机现象及其规律的特例。

历史上概率论的研究是与赌博中掷骰子出的点数的机会有关的。许多著名的科学家都参与过分析和计算。然而,由于没有把概率论的研究建立在严密的数学基础上,往往使一些问题的解答不准确或者有“多个答案”。上面提到的Bertrand氏奇论就是一例,其实运用近代概率论来分析,发现它的三个不同答案都是对的,只是问题的提法对应于三个不同的概率空间。概率论建立在严格的公理化体系基础上是前苏联数学大师ANKolmogorov在二十世纪卅年代完成的。他把概率论建立在三条公理的体系下,而这一体系又是和近代的测度理论相联系的。由此,概率论的一切理论成果和其它数学分支的成果一样,既是数学宝库中不可缺少的一部分也彼此相互印证和相互促进。例如:在数论的研究中许多人知道代数、分析和几何起了很重要的作用,其实现今数论中就有概率数论这样一个方向。大数学家高斯1812年提出的一个小数展成连分式的问题,一百多年后才于1928年给出了概率表达式。近代概率论的发展已在全球形成了一支庞大的队伍,尤其是二十世纪开始研究的随机过程的理论和方法在许多科技领域中得到了许多成功的应用。

数理统计学是研究如何有效地收集随机数据,如何科学地分析这些数据并在概率统计理论的基础上对考察的问题作出决策、推断或估计。这些结果,小的可以对具体产品质量作结论,大的可以影响政府部门的方针和决策。例如上一次世界性石油危机期间许多国家的政府部门都请统计学家研究国家石油库存的安全线及石油价格对整个国民经济的运作的影响等等。

“统计”来源于拉丁文“status”,其原意就是“情况”——如人口统计成为古代许多国家作决策时的依据。在十七世纪资本主义上升时期、封闭的封建经济逐渐为航海商业经济所取代。而航海商业是冒风险的事业,大量投资是否有利可图?怎样估计可能出现的灾难的概率等等都是早期统计学研究的问题。

二次大战后统计学的基本概念与方法发生了许多根本性的变化并使这门学科面貌一新。其动力在于社会生产和科技的需求。统计学中的多元分析、实验设计、序贯分析、可靠性等理论与方法是和工农业生产紧密相关的;抽样调查、列联表分析等内容又与社会调查有关;计算机的出现及军事工业、生物、医学的发展推动了统计模式识别、Bootstrap方法、投影追踪等新方向的出现。国防、气象、石油、经济等部门推动了随机过程统计推断理论的发展。近代高科技中的图象处理技术、高精度导弹的制导及高可靠性的通信技术等都广泛地运用了统计学的最新成果。

本世纪末到下世纪可预见的将来,统计学将面临更大的挑战。统计作为由观测样本获得尽可能多的总体信息的学科,关系到信息的加工和处理,而在3C的时代(ComputerCommunication and Control),爆炸式积累的信息与数据必须依靠统计学才能得到有效的利用。大规模信息处理关系到3C中的信息压缩、特征检测、可靠性分析乃至图形、语言及智能技术都需要计算技术与统计方法的结合。生命科学也许是下个世纪最富挑战性的科学领域,许多意义重大的问题,如DNA大分子结构分析、遗传密码、爱滋病流行病学、大范围生态模型以及祖国传统医学的探讨等统计学都将发挥自己的特长,作出自己的贡献。同时,统计学也在和这些边沿学科的结合过程中得到新的发展和创新。

原文刊登在北京大学校刊第714期, 1995年9月15日