最近一直在看传说中的LDA,一个自然语言处理中的数学模型,为了响应 @简叔 每周5写500字的活动,本打算写写关于LDA的学习小结。后来越写越不对劲。要把这个东西用短短的500字说清楚地球上没人能做到。那干脆换个轻松的话题吧——谈谈“轮回”。
本科毕业的时候选了个搜索引擎方面的课题,学了一些自然语言处理方面的基本知识,诸如分词算法、倒排索引这些。研究生刚开始的时候,就打印了这么一篇论文《Latent Dirichlet Allocation》。可是那时候,压根就没看懂。后来跟了导师,方向也就发生转换,主要做社交网络分析方面的工作,也就放弃了对自然语言处理的追求。当然那个时候的视野还不够宽,看不到内在的关联,这也是暂时放开NLP的原因之一。另外的原因是自己对理论计算机科学产生兴趣,主要精力会放在TCS上多一些。所以,在研究生读完后,获得的大多数经验还是理论方面的。
要说之前,我还不是很清楚自己应该要做什么事?这个也学那个也学,在计算机科学的世界走了很多地方,在我走过的那些地方,都试着追踪到最前沿的界限。虽说浪费了很多精力和时间,不过现在看来还是很划算的,因为通过那种放任的学习方式我获得了很多个观察世界的视角和工具。然而,我却没有下定决心来挑一个方向来做。关键是因为我没找到类似一项终极任务的感觉,因为这些问题就是人生种种问题的一个小部分,就算自己费尽精力就揭开了魔石的一面,我不满足。那么就继续走下去了。到现在,有空我也常常捡起一两个有趣的问题,看看现在的人们在研究的路上又比当时进展了多少。
现在的工作,还是把我推向了搜索、机器学习和自然语言理解。在这个螺旋式的发展路线上,我也遇到了很多有趣人,他们分享着自己的认识、经验和激情,我觉得这才是面对生活的一种健康的方式。要坚持下去,就要在心中看到未来的场景。用这样的期待感为自己制造一个不断进步的环境,让自己自觉地学习、练习和成长。
一直坚信的一点是,理论研究和实践应用应该保持着一种平衡性,在一个学科或者一个人身上都是这样子的。若把理论比作经脉,实践应该是五脏六腑,成为理论积淀和成形的容器。这样才足够完满地解决遇到的各种问题。
现在的自己,也越来越清楚要去完成的目标到底是什么。一个个清晰的路标浮现在远方。看完LDA,继续闯关。到了一个新的境地后,世界就是另外一番风景了。到那时,又可以做更有意思的事情了吧。
我们敬爱的宋公方敏一直说:“30岁前尽可能多地学点数学吧。”
我想说的是:根本停不下来。