Sciencescape-基于文献的科学社区

本文写于2015年2月,经历了一年多的时间,ScienceScape做出了很多变化,尤其是在科学计量、文献分析与可视化方面做出了努力,部分应验了我当时的预测。之后我会写一篇关于ScienceScape最新进展的文章,发出此文以作比较。

当今整个互联网社区的市场,facebook、twitter占据了半壁江山,对于后来者,要想赶超这些巨鳄似乎并非易事。因此,更多的人避开正面战场,另辟蹊径,把眼光盯上了细分的垂直社区,如:关注于美妆的美啦美妆、关注于妈妈人群的妈妈圈以及关注生物医学的丁香园。垂直社区汇聚细分人群,做专一生意,同样拥有自己的小天地。目前,也有人关注到了科学领域的垂直社区,那就是sciencescape

  1. sciencescape简介
    sciencescape的创始人Sam Molyneux 在多伦多大学读肿瘤基因组学博士期间,遭遇了一个令所有科学家都头疼的问题——浩如烟海的文献。没有人准确地知道:海量的文献中到底发生了什么。 于是 Molyneux 与他的姐姐 Amy 共同创建了sciencescape。Molyneux 试图提供用户“ Twitter 一样”的体验,用户首先选择感兴趣要关注的分类,之后就可以浏览最新发布的文献信息。到目前为止,sciencescape据说包括超过 5000 万个分类,主要为特殊主题、研究者、期刊、基因等等,该网站通过爬虫抓取和与期刊发行商合作的方式实时获取以上分类信息。另外, Molyneux 还希望在分类中添加地理位置、建筑物、研究所和方法等。
    严格意义上来讲,目前的sciencescape与Twitter存在很大差别,并不算是社区网站。该网站的核心是paper,科学领域中,paper是同行交流的媒介,科学发展的云梯,产出剂量的标准。paper在科学领域的价值毋庸置疑,然而随着科学的发展,产出的文献越来越多。各个细分的领域,每天发表的文献数量成百上千,更不用说整个科学领域,数量更是难以估量。sciencescape试图从海量文献中挖掘出对用户”重要“的文献并且实时推送给用户。这里边有一个关键问题,“重要”的衡量标准是什么?科学领域通用的标准是影响因子,而sciencescape用的标准是特征因子,特质因子类似于google的pagerank算法,基本的原理是一篇文章被更具影响力的期刊引用相比没有影响力的期刊引用会产生更高的影响力。与影响因子相比,特征因子可以更加客观的突出科学领域中文献重要性的规律,也就是被更加权威的期刊引用的文章科学价值是更高的。
  2. 什么文献才是最重要的
    然而,我们不禁产生另一个疑问。使用特征因子计算出“最具影响力”的文章对于每个科学家都是最重要的吗?答案未必,一方面,每个细分领域的期刊的影响力各不相同,领域间很难进行比较;再者,很多文章的科学价值对于不同科学家是存在巨大差异的。那么,如何针对用户的个人需求,个体化的计算专属于每个科学家的影响力因子呢?我自己的RSS订阅的经历可能给我们一些启发:我会订阅很多领域内的核心期刊,虽然这些期刊的影响力很大,但并不是期刊中的所有文章对我个人的重要意义都是一样的,我会通过文章的题目和摘要衡量该研究对我个人的科学价值,进行人工的筛选,这种自动化推送加人工筛选的模式似乎可以更好的辨别出针对于个体用户有价值的文献。sciencescape似乎可以借鉴这种模式,机器学习的算法,加入用户对模型的不断反馈,智能化的预测单个用户的个体化需求,这才是基于大数据的定制投送的真谛所在。
  3. 文献之后要做的工作
    另外,对于sciencescape,还有一个重要的问题需要思考。每个科学家拿到了对他们最重要的paper,之后要做什么?后边的事情似乎更为重要,如何对科学文献进行管理,优化,输出成有效的科研成果。拿到科学文献仅仅是科学研究开始的第一步。当然,sciencescape做不了全产业链的事情,但是如果其累计了足够有质量的用户,将自己发展成为一个科学社区,为其他科学文献管理等下游服务(如:zotero,medley等)提供入口,这应该是一个很好的发展方向。另外,基于大数据的paper的元分析、可视化以及文献在领域发展史中的作用的计量分析服务会为用户提供更加全局性的科学理解力,有必要加入sciencescape现有的体系中去。
  4. 发展多样分类系统
    目前的sciencescape把paper看的太重了,paper后边的人,后边的科学家本身对科学本身的贡献不能忽视。为科学理论和科学实践的贡献,当然是以paper作为载体,但是归根到底还是paper背后的科学家本身,所以基于期刊的分类未尝不可,但是十分有必要增加科学家、实验室和科学学会等分类,以此来全方位的体现科学领域的不同需求和维度。总之,在这条科学社区的道路上,sciencescape的路还很长,主要努力的方向应该是以人为本的科学家社区,科学家是核心,paper是载体,搭建一个科学交流的互联网社交平台。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,036评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,046评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,411评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,622评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,661评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,521评论 1 304
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,288评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,200评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,644评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,837评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,953评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,673评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,281评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,889评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,011评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,119评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,901评论 2 355

推荐阅读更多精彩内容