数据有意思

刚开始做数学模型的时候,我对数据这东西的迷恋程度不亚于那些求神问卦的。一张EXCEL表格上,少则几万,多则百万的数据,全是由那些最基本的数字1—0构成,密密麻麻的堆在那里。那么一筛选,一拟合,就得出了对于未来的推测。

这不是算命,又是什么?

有了计算机后,更是让数据大显身手。机器的好处就是你给它发个指令,哪怕是死循环的句柄,它也会孜孜不倦地算下去,直到得出结果,或者内存耗尽而死机。这是从前算圆周率那帮数学家所不能想象的。

第一次做的模型,是关于农业保险的。听上去很高大上,其实不过是根据过去50年的气象数据推演未来一段时间的天气异常情况,再根据期望值反推赔率。那个数字的设定很微妙,既要让这保险公司不要特别赔钱,又能起到旱涝保收的效果。

建好模型,把算法输入进去,就是电脑的事儿了。这期间我总会坐那里发呆,想起我从前鄙视的天文学家第谷。从前我老觉得他一辈子算是废了,看星星记数据,这么机械的工作硬是搞了四十多年,也没个成果。最后那什么三大定律还是开普勒根据他的数据推出来的。

现在,我只想说,没第谷,就没有那后来的宇宙飞船上天。数据是个内敛的小姑娘,只有真正懂她的人才会知道它的温柔。

和数据打交道多少有点像做饭。炒菜之前要先摘掉那些没用的烂叶子,对付数据第一步当然也是筛选掉那些太离谱的。如果是个新手,他会觉得这事是最轻松的,直到他和数据打了多年交道,他才会发现,这一步很难。——你怎么知道,它的特别是因为失误,抑或反常必有妖?

然后就是选个趁手的家伙。如果是做模型,该想想用什么常规的算法,如果是单纯的风险分析,就是看碟子下菜了。数据长什么样,总有几种传统的分析方式去应对它。或横纵对比,或者求极差中间数等等。

最后就是表达,做出图表来给人家看,然后借着这图表来发表一番言论。当然,大多数时候是先表明态度,再做数据分析。我们只会看我们想看的景物,数据也是。结论在先,数据的出场不过是助威抑或助纣为虐——你放心好了,你的两只眼一定会死命盯着那些合适的数据,丢掉那些成为悖论的。这是人的通病。

有段时间我讨厌数据,就是因为通常情况下,人们是先做结论,再做分析,最后筛选数据。这样的过程,无异于强词夺理。

如果数据说谎,那一定是个弥天的可怕谎言。因为它言之凿凿地给你罗列枯燥的数据,如同一位侦探在用他的理性思维分析推理,你津津有味地听着,不停地点着头。殊不知他其实是在诡辩。人们有种错觉,他们觉得文艺的东西是梦幻的,所以处处可疑。数学科学这些东西却一定是真实的,因为它们有板上钉钉的证据。

数据和历史一样,不过是任人打扮的小姑娘。改改坐标轴,换换对比,删繁就简,正说反说都非常有理。

说到这里,诸位可以明了朋友圈里那些伪科学的由来了。什么不吃肉活千年啊,什么只吃肉不得癌症啊,无非是掐着数据的脖子,让它吐出了一面之词而已。不信你可以去看看,有几个这种所谓的营养学大师敢去把自己的原始数据露给公众看的?他们只会伪造结果,扭曲图表罢了。

数据在我的眼里就像天上的星辰。那些星星在几百万年前就死掉了,我们所看到的光不过是它们曾经的传说。星象学家们却固执地抓着那些轨迹不放,妄想去推断一个可能的未来。推断不是不可以,好好研究下去,宇宙洪荒的前世今生都能够为我们展现,只是他们的方向错了。

过于信赖某种东西,终究会归于迷信。数据可以某种意义上的预测未来,却不能保证所有。你没看到保险公司的条款吗?战争不赔,地震不赔。对于这种突发的事故,数据也只好束手无策。

数据是美的,在那些做模型的深夜。每当我觉得熬不下去,就会点开matlab,做一个多维度的图像出来。看着笛卡尔的爱情心脏线,想象他怎么借助这一张函数图赢得了公主的爱慕。一切处于中间地带的东西都有种微妙的美感,比如那些高阶函数图像,文理相通,天作之合。

那会儿的我梦想是嫁给一个物理学家,还得是研究量子力学的那种。想想两个人面对同一片星空,思维却在两个维度上,该多么有意思啊。

我现在手头也没什么物理学家,只有一堆分析不完的数据。虽然略微遗憾,但它也会给我惊喜。比如今天吧,都上了地铁了,我还在想,那个该死的英属维尔京群岛——你听听这名字,就知道这是个很小很小的国家,怎么会在半年之内进口突飞猛进。思前想后,我推断那是个错误数据,虽然不大可能。

回到家总觉得不对。最后索性去知网上搜这个地方。和我想的不大一样,那里最近没出煤矿,也没油田,它只是个优秀的避税天堂。优秀到成为国际黑帮洗钱的藏污纳垢之地。那论文还说,许多国内著名的公司为了合理避税,都在这里注册,这么一来,许多应该缴税的东西,突然在来料加工上占了大大的便宜。

数据是永远没有谜面的谜语,是汉武帝的李夫人。当返魂香燃起,你只会在帘子后看到她影影绰绰的一个倩影。于是你站在那里,迟疑了。那是真实的存在,还是一个梦呢?

所谓生活中的真相莫过如此。真真假假,也只是凭一个信字而已啊。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,290评论 6 491
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,107评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,872评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,415评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,453评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,784评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,927评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,691评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,137评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,472评论 2 326
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,622评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,289评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,887评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,741评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,977评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,316评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,490评论 2 348

推荐阅读更多精彩内容