统计学的创始人威廉.配第(1623-1687)在17世纪英国发表的《政治算术》一书,大量使用数字对英、法、荷三国的经济实力进行比较,以论证“英格兰的情况和各种问题,并非处于可悲的状态”。该书采用了不同于以往的方法,而是“用数字、重量和尺度来表达他自己想要说明的问题”。因而马克思称其为“政治经济学之父,在某种程度上也可以说是统计学的创始人。”
(马克思恩格斯全集23卷P302《资本论》)
和配第同期,还有一个英国统计学家叫约翰•格兰特(John Graunt)(1620~1674)。1662年出版《关于死亡率的自然观察和政治观察》。分析了60年多年伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,使人口统计学成为一门相对独立的学科。他的研究清楚地表明了统计学作为国家管理工具的重要作用。
格朗特研究人口发展的规律,观察到出生婴儿中男婴比女婴多十三分之一。但是在现实生活中,出生的男子即使多于女子,由于男子遭遇奇祸或死于航海居多,在婚姻年龄上男女数量大致相同。
他在比较了出生人数和死亡人数后得出结论:伦敦市区的人口出生数超过死亡数,而伦敦郊区农村的情况则相反,死亡数超过出生数。他还根据对出生率和死亡率的分析,对当时服兵役年龄的男子数、育龄妇女人数、伦敦居民家庭数等作出估计。
格兰特最重要的贡献是编制了世界上第一个死亡表(即生命表的基础)。死亡表的编制为经营人寿保险业务奠定了科学的数理基础,是计算人身保险的保险费、责任准备金、退保金的主要依据。
统计学之所以称为近代意义上科学的统计学,就是从引进概率论开始的。引进概率论的统计学家叫凯特勒(Lambert Adolphe Jacques Quetelet,1796~1874)。
凯特勒在19世纪做过一个类似原力、智商这样的数据,是士兵的胸围。他测量了5738名苏格兰士兵的胸围,看他们是不是够强壮。结果发现,士兵胸围的测量值和测量值出现的频数服从正态分布。这条正态分布的曲线,就叫钟形曲线。
凯特勒还进一步运用这个规律,检查出自己国家新兵身高频率曲线与理论正态分布曲线不相吻合的不正常情况,推测这可能是征兵工作中出了问题。调查结果发现,果真有几个征兵机关从中作弊。凯特勒的统计工作实际上是拉普拉斯等人概率论中正态分布曲线、误差法则等理论的运用。
卡尔·皮尔逊(Karl Pearson,1857-1936),他是现代统计科学的创
立者。皮尔逊认为,正态分布只是一种分布形态,他在高尔登优生学统计方法的启示下,在1894年发表了《关于不对称曲线的剖析》,1895年发表了《同类资料的偏斜变异》等论文,得到包括正态分布、矩形分布、J型分布、U型分布等13种曲线及其方程式。他的这一成果,打破了以往次数分布曲线的“唯正态”观念,推进了次数分布曲线理论的发展和应用,为大样本理论奠定了基础。
皮尔逊一直很关注遗传和环境、先天和后天在人类进化中的重要性,他的实验室曾做过一个掀起轩然大波的研究,经济学家马歇尔、凯恩斯、庇古,医生霍斯利、优生学家高尔顿(达尔文的表弟)都卷入其中。那这个研究是什么呢?埃尔德顿和皮尔逊在爱丁堡收集了超过600个家庭的数据,发现父母的饮酒嗜好和后代任何可度量的健康和智力指标完全不相关。