图的表示
1.开篇问题
如何存储微信微信qq中社交网络的好友关系吗?
2.图的形式
微信好友-双向图
微博关注-单向图
qq亲密度-带权图
3.图的存储
存储两大类:数组形式和链表形式,各有各好处缺点
i.邻接矩阵
底层依赖一个二维数组,有向图,无向图,带权无向图,优点简单直接,基于数组,一获取两点间关系非常高效,二矩阵存储方便矩阵运算如最短路径floyd算法
注:其中无向图对称,存一半就行,避免空间浪费。如果是稀疏图,则更加浪费内存
ii.邻接表存储
类似散列表,每个顶点对应一条链表,查询两个顶点关系就遍历链表,不搞笑,从前面改造散列表经验,链过长,提高查找效率,将链表升级成平衡二叉树如红黑树存储,跳表,散列表,有序动态数组二分查找等等
注:时空互换思想,空间换时间,时间换空间
4.开篇解答
首先,数据结构是为了算法服务,故考虑支持期望操作的数据结构,先看看微博用户期望的操作
i.表示A关注了B,A取消关注B
ii.表示A是B的粉丝
iii.根据用户名称首字母排序,分页获取粉丝列表
iiii.根据用户名称首字母排序,分页获取关注列表
其次,因为社交网络是个稀疏图,采用邻接表存储更好,但邻接表查找从自己出发的关注用户很容易(顺序),查找自己被哪些用户关注了比较难(逆序),故维护两张邻接表,邻接表和逆邻接表。
然后,为方便快速查找对邻接表升级,红黑树,跳表,有序动态数组附带二分查找,散列表?
因为按照用户名称首字母排序(实际就是分区间),跳表实现更方便
最后,小规模数据量几十万基本够用,但对于上千万亿的用户微博,是无法全部存内存的,一哈西算法分片,将邻接表存在不同机器上,二是利用外部存储,硬盘上的数据库里
注:非常重要的启发四条
一数据结构是为了算法而生,需要实现什么算法操作,选择合适的数据结构
二基础的数据结构都是数组和链表,栈队列叔图都是通过链表和数组实现的特殊数据结构,出现这些特定数据结构是因为解决特定场景下时间空间复杂度很高的情况
三描述一种需求模型,可以用多种数据结构组合,选择这些数据结构又是基于时间空间两个维度,想想除了数组和链表,其他队栈树图哪个不是解决局部问题呢,那自己也可以根据需要组合
四内存用链接表,持久存储外存用数据库,超大图涉及图运算用专业图数据库
5.图的其他运用
操作系统的资源分配图,解决死锁问题
深度广度优先搜索
1.开篇问题
给你一个用户,如何找到这个用户的三度好友关系,基于社交网络六度分割理论,这就要用到今天所学深度广度优先搜索
2.搜索算法
搜索算法是指从一个顶点找到另一个顶点的路径过程,简单粗暴的算法有深度优先,广度优先算法,还有启发式搜索算法A*,IDA*
无向有向均可以用深度广度算法实现,我们用邻接表存储,如下表示图的定义和存储方式
public class Graph { // 无向图
private int v; // 顶点的个数
private LinkedList<Integer> adj[]; // 邻接表
public Graph(int v) {
this.v = v;
adj = new LinkedList[v];
for (int i=0; i<v; ++i) {
adj[i] = new LinkedList<>();
}
}
public void addEdge(int s, int t) { // 无向图一条边存两次
adj[s].add(t);
adj[t].add(s);
}
}
3.广度优先算法
广度优先搜索(Breadth-First-Search),我们平常都把简称为 BFS。
public void bfs(int s, int t) {
if (s == t) return;
boolean[] visited = new boolean[v];
visited[s]=true;
Queue<Integer> queue = new LinkedList<>();
queue.add(s);
int[] prev = new int[v];
for (int i = 0; i < v; ++i) {
prev[i] = -1;
}
while (queue.size() != 0) {
int w = queue.poll();
for (int i = 0; i < adj[w].size(); ++i) {
int q = adj[w].get(i);
if (!visited[q]) {
prev[q] = w;
if (q == t) {
print(prev, s, t);
return;
}
visited[q] = true;
queue.add(q);
}
}
}
}
private void print(int[] prev, int s, int t) { // 递归打印 s->t 的路径
if (prev[t] != -1 && t != s) {
print(prev, s, prev[t]);
}
System.out.print(t + " ");
}
注:这段代码不是很好理解,里面有三个重要的辅助变量 visited、queue、prev。只要理解这三个变量,读懂这段代码估计就没什么问题了。
i.visited是用来记录已经被访问的顶点,用来避免顶点被重复访问。
ii.queue是一个队列,用来存储已经被访问、但相连的顶点还没有被访问的顶点。因为广度优先搜索是逐层访问的
iii.prev用来记录搜索路径。当我们从顶点 s 开始,广度优先搜索到顶点 t 后,prev 数组中存储的就是搜索的路径。不过,这个路径是反向存储的。prev[w] 存储的是,顶点 w 是从哪个前驱顶点遍历过来的。
时间复杂度o(v+e)空间复杂度o(v)
4.深度优先算法
深度优先搜索(Depth-First-Search),简称 DFS。
boolean found = false; // 全局变量或者类成员变量
public void dfs(int s, int t) {
found = false;
boolean[] visited = new boolean[v];
int[] prev = new int[v];
for (int i = 0; i < v; ++i) {
prev[i] = -1;
}
recurDfs(s, t, visited, prev);
print(prev, s, t);
}
private void recurDfs(int w, int t, boolean[] visited, int[] prev) {
if (found == true) return;
visited[w] = true;
if (w == t) {
found = true;
return;
}
for (int i = 0; i < adj[w].size(); ++i) {
int q = adj[w].get(i);
if (!visited[q]) {
prev[q] = w;
recurDfs(q, t, visited, prev);
}
}
}
时间复杂度o(e)空间复杂度o(v)
5.开篇解答
三度也就是三层,选用广度遍历,多用一个数组记录起点和路过点的距离
6.课后思考
i.三度如何用深度遍历实现呢
深度优先可以设置深度为3,多设置一个离初试节点距离值,超过就回溯,还得涉及节点更新
ii.迷宫如何抽象成图,迷宫策略如何抽象成算法
迷宫问题,初始化两个顶点,起点和终点,将每个分叉路口作为顶点,顶点之间相连
注:数据结构不难的是原理,而是灵活的将各种生活场景抽象成数据结构和对应算法