KDD2015,SEISMIC,用点过程做tweet 流行度预测

SEISMIC: A Self-Exciting Point Process Model for Predicting Tweet Popularity

概述

  • 用自激点过程预测一条tweet的最终转发量
  • 斯坦福的工作
  • 公开了数据和代码:http://snap.stanford.edu/seismic
  • 模型不用训练,也没用过多的特征
  • 根据tweet早期(前一小时)的转发情况,预测最终转发量
  • 实验上只用15%的相对误差
动机
  • 预测一篇文章的最终流行度对于内容的排序和内容的聚合是很重要的
  • Twitter这种信息流式的内容,用户几乎不可能全部跟上,所以可能会错过大量的信息
  • 准确的预测将使Twitter能够更好地对内容进行排名,更快地发现热门帖子
自激点过程
  • 点过程:描述某类事件发生的时刻、地点等的一种随机过程。其中- - - 描述某类事件发生次数随时间变化的过程叫做“计数过程”,比较常见的是泊松过程
  • 自激点过程就是每次时间发生能使得这个事件的发生概率发生变化,例如霍克斯过程,自激点过程常常被用来对“rich get richer”现象建模
  • 在tweet的转发过程中,每一次被转发都可能带动更多的人转发,因为转发能够使得更多人看到,而且一个tweet的传播性也会随着时间而下降。
SEISMIC (Self-Exciting Model of Information Cascades) 模型
  • tweet的传播性随时间变化
  • 能够识别某个时间点信息流的状态:supercritical or subcritical state (超临界或者亚临界状态),就是传播性大于或者小于某个值
  • 超临界状态下的信息流正在经历一个“爆炸”增长的时期, 在这个时候,这个信息的最终流行度无法被准确的预测, 反之就容易预测。
  • 模型无参数,也没有特征工程,也没有考虑社交网络结构
  • 只用到了tweet历史被转发的时间和节点(转发的人)在社交网络里面的度数(这个人的follow 数量)
  • 模型的时间复杂度是线性的,也容易并行化
  • 模型有较强的解释性
实验效果
  • 超过state of the art方法的效果30%(accuracy)
  • 用前一小时的记录预测,15%的相对误差
  • 用前10分钟的记录预测,25%的相对误差
  • 实验还展示了怎么识别将会“病毒式”传播的tweet

相关工作

  • 一般分为基于特征的方法和基于点过程的方法
  • 本工作与其他用霍克斯过程的方法的不同是:本方法的过程的强度(intensity)会依赖于另一个过程强度而变化。
重要参考文献
  • S. Gao, J. Ma, and Z. Chen. Modeling and predicting
    retweeting dynamics on microblogging platforms. In WSDM
    ’15, 2015. 也是点过程做流行度预测

方法实现

  • 一堆公式看得脑壳疼
公式1

公式2

公式3

实验

  • 实验做了挺多做的挺充分的
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,039评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,223评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,916评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,009评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,030评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,011评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,934评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,754评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,202评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,433评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,590评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,321评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,917评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,568评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,738评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,583评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,482评论 2 352

推荐阅读更多精彩内容

  • 原文:Accurately Measuring Model Prediction Error 在机器学习模型的效果...
    jiandanjinxin阅读 2,477评论 0 3
  • 问:地藏菩萨,我从无始劫以来至今,当下所受哪些业报?分别是善的还是恶的? 答:不邪淫/大善,不妄语/大善,不两舌/...
    长小白阅读 228评论 0 0
  • 高效劳累的一天,真真的是像陀螺一样一刻不停闲。晨会、交班,整理参赛病例与领导沟通,第一次正式考核选手,外出给领导亲...
    刘淑正阅读 749评论 4 11
  • 农历九月初一(2018.10.9)周二 雨转晴 昨天老师说今天要考试,嘱咐了几句,还开了句玩笑问彧宝:“要考试了,...
    亦然爱彧阅读 142评论 0 1
  • 我们今天画的是花田里的小村庄。是用水粉画的。 先画五座小房子,三座高的,两座矮的,屋顶是弧形的...
    郝丽君_67b1阅读 111评论 0 0