第二千一百八十四章 赚朝廷的钱(2/2)
看着高翰文先是发笑,然后一连串对宋应昌的夸奖,李时珍有些没反应过来。
“你们别打哑谜了,到底是什么,快说说,我也听听。”
这时,高翰文才反应过来,李时珍还被蒙在鼓里。
高翰文先是拿起了第一张图,细细地解释起其用途与假设前提起来。
第一个,自然是要求自然产生的真实数据统计,不是人为编造的数据,并且最好跨三个位数的数量级,样本最好是一千以上。这里的自然,倒不是纯自然,而是数据本身几乎不受直接统计之外的额外加工。
有了这些前提范围,就可以依据相比于首位数是2的数据增长到3,首位数是1的数据更难以增长至2,并以此类推形成规律。当然次位数的数字规律也于此相同但有所放松,直到末尾数应当是0-9机会基本均等。如果有违反大概率就是造假了。
实务中,由于大明很多田税的首位数字很多年都没变过,而且各地首位数字的差异也相当巨大。
因此,也可以用各个指标数据减去其历史最小数,这样就能够得到一个更符合自由变动的数据,进行分析。
第二个文字频率图确实更是惊艳了高翰文。要知道大明注重统计的可没什么人,注重语言文字统计的更是前无古人。自己弟子这也算是开创了一个统计学与语言学的交叉细分领域了。
高翰文只是简单地沿着两张频率柱状图柱尖画了两条曲线。并在旁边分别写下f(x)和g(x),剩下的就交还给宋应昌了。
“这个,你们统计司可以去算算会是什么样子。”
高翰文当然不会直接把对数分布与幂律分布函数直接就写了出来。后续就看统计司能不能发布相关课题研究任务了,然后自己杭州新学经济研究所完全可以来承接这个任务。
得让朝廷这帮满脑空空的儒学官僚看到新学的正经用处来。
宋应昌其实估摸知道老师已经知道答案了。但是当官多年后早也明白,免费的东西没人会重视,还会被阴谋论,该有的流程还是不能少的。统计司目前这帮学个如何操作差分机帮助计数都千难万难的废物,是绝不可能来试探求解这两个函数了。委托自己师门就成了必然的选择。