图排序

1、复杂网络

复杂系统:整体是其各部分的总和以及各部分间的 交互

如何研究网络:图论。

随机图G(n,p),具有 n 个节点、任意两个节点间以概率 p 存在连边的图。

如何研究 复杂网络:统计物理 + 计算科学。传统图论不再适合于复杂网络的研究。

网络中节点连接模式:同配,相似而相连;异配,相异而相连。

社区结构:“内部连接紧密、外部连接稀疏” 的节点集合,高度重叠、相互嵌套。

网络中存在大量三角形,形成 结构平衡,是网络演化的微动力。

小世界模型

  • 随机网络:低聚集性,短直径
  • 规则网络:高聚集性,长直径

偏好连接:BA模型

  • 生长
  • 偏好连接:富者愈富

2、图排序

将节点按照重要度排序:

  • 介数中心度

    通过节点 v 的最短路径的期望个数 例子

  • 距离中心度

    定义:节点 x 到其他节点距离之和的倒数。

    另一种定义:距离倒数的和。克服不连通图面临的问题。

  • 谱中心度

    网络邻接矩阵的主特征值对应的特征向量

  • Katz中心度是泛化的谱中心度

PageRank

直观解释:被很多 重要 页面 指向 的页面是 重要 的页面。

计算方法:任意给定一个初始归一化向量,反复左乘转移概率矩阵,直至收敛。

保证收敛充分条件,措施

  • 各态历经性:任意两个节点,都是双向可达的;非周期的。
  • 不可约简

PageRank收敛特性,例子

  • 收敛速度快。一般100轮之内会收敛。
  • 分块收敛。网络具有局部聚集特性,同一个块内的节点,其PageRank值
    收敛速度相近。
  • 序收敛比值收敛更快

个性化PageRank:随机跳转向量使用任意非负归一化向量代替,实现排序的个性化。例子

HITS

Hub:导出链接

Authority:导入链接

基本假设:

  • 被很多高hub页面指向的页面具有高authority值
  • 指向很多高authority页面的页面具有高hub值
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 链接分析 我们在最开始说过,搜索引擎在查找能够满足用户需求的网页时,主要会考虑两方面的因素,一方面是用户发出的查询...
    我偏笑_NSNirvana阅读 3,333评论 1 12
  • soure code 一:Pagerank:PageRank是Google用于衡量特定网页相对于搜索引擎索引中的其...
    SamDing阅读 1,488评论 0 1
  • 社会网络分析理论: 在社会网络[63]由人类学家Barnes最早提出的概念,他在社会网络的分析基础上统地研究挪威一...
    Arya鑫阅读 3,773评论 1 4
  • 前言 其实读完斯坦福的这本《互联网大规模数据挖掘》,让我感觉到,什么是人工智能?人工智能就是更高层次的数据挖掘。机...
    我偏笑_NSNirvana阅读 12,713评论 1 23
  • 初夏将至 毕业来临 空气里充满了离别的味道 两年前 跟离别的师哥喝到两个人痛哭不已 两年间经历了大大小小的事情...
    王荣乾阅读 474评论 3 7