Java面试题系列(十一)——数据结构与算法

1. 数据结构定义

  数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率。数据结构往往同高效的检索算法和索引技术有关。

  • 数组:物理存储单元上连续、顺序的存储结构
  • 链表:链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。
  • 队列:队列(queue)是只允许在一端进行插入操作,而在另一端进行删除操作的线性表。
  • 栈:栈(stack)又名堆栈,它是一种运算受限的线性表。限定仅在表尾进行插入和删除操作的线性表。这一端被称为栈顶,相对地,把另一端称为栈底。
  • 堆:堆通常是一个可以被看做一棵完全二叉树的数组对象。将根结点最大的堆叫做最大堆或大根堆,根结点最小的堆叫做最小堆或小根堆。建堆时间复杂度O(n),堆总是满足下列性质:堆总是一棵完全二叉树;堆中某个结点的值总是不大于或不小于其父结点的值;
  • 散列表:(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构

2. 堆的创建、插入、删除、堆排序

  • 堆的插入:在已经建成的最小堆的后面插入元素,堆的结构可能被破坏,再向上调整使其满足性质。
  • 堆的删除:删除时每次删除堆顶元素,删除方法:
    1)将堆中最后一个元素代替堆顶元素。
    2)将堆中元素个数减少一个,相当于将堆中最后一个元素删除。
    3)此时堆的结构可能被破坏,在向下调整使其满足性质。
  • 堆排序:
    1)将堆顶元素与第size-1个元素交换。
    2)hp->size–
    3)将其余的元素调整为最小堆
    4)重复1、2、3步hp->size-1次。

3. 跳表

  跳表,是基于链表实现的一种类似“二分”的算法。它可以快速的实现增,删,改,查操作。这种链表加多级索引的结构,就叫做跳表。跳表的查询时间复杂度可以达到O(logn)。跳表也可以实现高效的动态更新,定位到要插入或者删除数据的位置需要的时间复杂度为O(logn).
  在插入的时候,我们需要考虑将要插入的数据也插入到索引中去。在这里使用的策略是通过随机函数生成一个随机数K,然后将要插入的数据同时插入到k级以下的每级索引中。https://www.greatytc.com/p/43039adeb122

image.png

4. 排序算法

见网址(https://www.cnblogs.com/onepixel/articles/7674659.html

image.png

  • 不同条件下,排序方法的选择
    • 若n较小(如n≤50),可采用直接插入或直接选择排序。当记录规模较小时,直接插入排序较好;否则因为直接选择移动的记录数少于直接插人,应选直接选择排序为宜。
    • 若文件初始状态基本有序(指正序),则应选用直接插入、冒泡或随机的快速排序为宜;
    • 若n较大,则应采用时间复杂度为O(nlgn)的排序方法:快速排序、堆排序或归并排序。
      a) 快速排序是目前基于比较的内部排序中被认为是最好的方法,当待排序的关键字是随机分布时,快速排序的平均时间最短;
      b) 堆排序所需的辅助空间少于快速排序,并且不会出现快速排序可能出现的最坏情况。这两种排序都是不稳定的。
      c) 若要求排序稳定,则可选用归并排序。
    • TopK或优先队列通常用堆排序来实现

5. Bitmap位图算法

https://blog.csdn.net/lucky52529/article/details/90172264
  位图是指内存中连续的二进制位,用于对大量的整型数据做去重和查询。Bit-map就是用一个bit位来标记某个元素对应的Value,而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。

  • bitmap应用
    1)可进行数据的快速查找,判重,删除,一般来说数据范围是int的10倍以下。
    2)去重数据而达到压缩数据
    位图只是可以映射数字类型的数据,变成字符串以及其他文件好像就不再那么得心应手了,这时就要使用布隆过滤器

6. 布隆过滤器

  bloom算法类似一个位图,用来判断某个元素(key)是否在某个集合中。和一般的位图不同的是,这个算法无需存储key的值,对于每个key,只需要k个比特位,每个存储一个标志,用来判断key是否在集合中。

  • 应用场景:比如网络爬虫抓取时url去重,邮件提供商反垃圾黑名单Email地址去重,之所以需要k个比特位是因为我们大多数情况下处理的是字符串,那么不同的字符串就有可能映射到同一个位置,产生冲突。
  • 优点:不需要存储key,节省空间
  • 缺点:算法判断key在集合中时,有一定的概率key其实不在集合中,已经映射的数据无法删除

7. (Tire)字典树

  • 定义:又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
  • 3个基本性质:
    • 根节点不包含字符,除根节点外每一个节点都只包含一个字符;
    • 从根节点到某一节点路径上经过的字符连接起来,为该节点对应的字符串;
    • 每个节点的所有子节点包含的字符都不相同。

8. 海量数据找出前K大的数

  top K类问题,通常比较好的方案是分治+Trie树/hash+小顶堆(就是上面提到的最小堆),即先将数据集按照Hash方法分解成多个小数据集,然后使用Trie树活着Hash统计每个小数据集中的query词频,之后用小顶堆求出每个数据集中出现频率最高的前K个数,最后在所有top K中求出最终的top K。

9. 五大查找方式

image.png

10. BFS、DFS优缺点

  • 深搜优缺点
    • 优点
      • 能找出所有解决方案
      • 优先搜索一棵子树,然后是另一棵,所以和广搜对比,有着内存需要相对较少的优点
    • 缺点
      • 要多次遍历,搜索所有可能路径,标识做了之后还要取消。
      • 在深度很大的情况下效率不高
  • 广搜优缺点
    • 优点
      • 对于解决最短或最少问题特别有效,而且寻找深度小
      • 每个结点只访问一遍,结点总是以最短路径被访问,所以第二次路径确定不会比第一次短
    • 缺点
      • 内存耗费量大(需要开大量的数组单元用来存储状态)

11. 动态规划

  • 核心思想:将大问题分为小问题进行解决,从而一步步获得最优解的处理算法,与分治算法不同的是适合于动态规划求解的问题,经分解得到的子问题往往不是相互独立的。
  • 求解方式:填表
  • 思想:w[i]为第i个商品的重量,v[i]代表第i个商品的价值,v[i][j]表示在前i个物品中能够装入容量为j的背包中的最大价值
a)  v[i][0]=v[0][j]=0;//使得i和j刚好和第几个商品对应
b)  当w[i]>j时:v[i][j]=v[i-1][j];//当准备加入新增的商品的容量w[i]大于当前背包的容量j时就直接使用上一单元格的装入策略
c)  当w[i]<=j时:v[i][j]=max{v[i-1][j], v[i]+v[i-1][j-w[i]]};
//上一个单元格的装入的最大值v[i-1][j]
//v[i]当前商品的价值
//v[i-1][j-w[i]]装入i-1个商品剩余空间j-w[i]的最大值
1.  //根据前面得到公式来动态规划处理
2.  for(int i = 1; i < v.length; i++) {//不处理第一行i是从1开始的
3.      for(int j=1; j < v[0].length; j++){//不处理第一列,j是从1开始的
4.        //公式
5.        if(w[i-1]> j){//因为我们程序i是从1开始的,因此原来公式中的w[i]修改成w[i-1]
6.          v[][j]=v[i-1][j];
7.        }else{
8.          //说明:
9.          //因为我们的i从1开始的,因此公式需要调整成
10.         //v[i][j]=Math.max(v[i-1][j],val[i-1]+v[i-1][j-w[i-1]]);
11.         v[][j]=Math.max(v[i-1][j], val[i]+v[i-1][j-w[i-1]]);
12.       }
13.     }
14. }

12. 什么样的题适合用动态规划?

  • 最值型动态规划,比如求最大,最小值是多少
  • 计数型动态规划,比如换硬币,有多少种换法
  • 坐标型动态规划,比如在m*n矩阵求最值型,计数型,一般是二维矩阵
  • 区间型动态规划,比如在区间中求最值


    image.png

13. 暴力匹配算法

1.  public static int ViolenceMatch(String str1, String str2) {
2.          char[] s1 = str1.toCharArray();
3.          char[] s2 = str2.toCharArray();
4.   
5.          int i = 0;
6.          int j = 0;
7.   
8.          while (i < s1.length && j < s2.length) {
9.              if (s1[i] == s2[j]) {
10.                 i++;
11.                 j++;
12.             } else {
13.                 i = i - (j - 1);
14.                 j = 0;
15.             }
16.         }
17.  
18.         if (j == s2.length) {
19.             return i - j;
20.         }
21.  
22.         return -1;
23.  }

14. KMP算法

  1. 建立部分匹配表


    image.png

移动位数 = 已匹配的字符数 – 对应的部分匹配值

1.  public static int[] KmpMatchTable(String str) {
2.          int[] matchTable = new int[str.length()];
3.          matchTable[0] = 0;
4.          for (int i = 1, j = 0; i < str.length(); i++) {
5.              //不等时重新获取前一个的值,kmp算法核心
6.              while (j > 0 && str.charAt(i) != str.charAt(j)) {
7.                  j = matchTable[j - 1];
8.              }
9.              //部分匹配则值+1
10.             if (str.charAt(i) == str.charAt(j)) {
11.                 j++;
12.             }
13.             matchTable[i] = j;
14.         }
15.         return matchTable;
16. }
  1. KMP搜索
1.  public static int KMPMatch(String str1, String str2) {
2.          int[] matchTable=KmpMatchTable(str2);
3.   
4.          for (int i = 0,j=0; i < str1.length(); i++) {
5.              //处理不等情况
6.              while(j>0&&str1.charAt(i)!=str2.charAt(j)){
7.                  j = matchTable[j-1];
8.              }
9.   
10.             if (str1.charAt(i)==str2.charAt(j)){
11.                 j++;
12.             }
13.             if (j==str2.length()){
14.                 return i-j+1;
15.             }
16.         }
17.  
18.         return -1;
19. }

15. 贪心算法

16. 普利姆算法(prim)

  • 求最小生成树
  • 普里姆算法介绍
    • 普利姆(Prim)算法求最小生成树,也就是在包含n个顶点的连通图中,找出只有(n-1)条边包含所有n个顶点的连通子图,也就是所谓的极小连通子图
    • 普利姆的算法如下:
      (1) 设G=(V,E)是连通网,T=(U,D)是最小生成树,V,U是顶点集合,E,D是边的集合
      (2) 若从顶点u开始构造最小生成树,则从集合V中取出顶点u放入集合U中,标记顶点v的visited[u]=1
      (3) 若集合U中顶点ui与集合V-U中的顶点vj之间存在边,则寻找这些边中权值最小的边,但不能构成回路,将顶点vj加入集合U中,将边(ui,vj)加入集合D中,标记visited[vj]=1
      (4) 重复步骤②,直到U与V相等,即所有顶点都被标记为访问过,此时D中有n-1条边
      (5) 提示:单独看步骤很难理解,我们通过代码来讲解,比较好理解.


      image.png

17. 二叉树的中序遍历

1.  List<Integer> list = new ArrayList<>();
2.      public TreeNode increasingBST(TreeNode root) {
3.          if(null==root)return null;
4.          Deque<TreeNode> queue = new ArrayDeque<>();
5.          while(root!=null||!queue.isEmpty()){
6.              while(root!=null){
7.                  queue.add(root);
8.                  root = root.left;
9.              }
10.             root = queue.pollLast();
11.             list.add(root.val);
12.             root=root.right;
13.         }
14.         return list;
15. }

18. 二叉树层序遍历

1.  public List<List<Integer>> levelOrder(TreeNode root) {
2.      List<List<Integer>> res = new ArrayList<>();
3.      Queue<TreeNode> queue = new ArrayDeque<>();
4.      if (root != null) {
5.          queue.add(root);
6.      }
7.      while (!queue.isEmpty()) {
8.          int n = queue.size();//记录节点个数
9.          List<Integer> level = new ArrayList<>();
10.         //遍历每个节点的左右子节点
11.         for (int i = 0; i < n; i++) { 
12.             TreeNode node = queue.poll();
13.             level.add(node.val);
14.             if (node.left != null) {
15.                 queue.add(node.left);
16.             }
17.             if (node.right != null) {
18.                 queue.add(node.right);
19.             }
20.         }
21.         res.add(level);
22.     }
23.  
24.     return res;
25. }

19. 二叉树之字形打印

1.  public List<List<Integer>> zigzagLevelOrder(TreeNode root) {
2.          List<List<Integer>> res = new ArrayList<>();
3.          if (root == null)
4.              return res;
5.          //创建队列,保存节点
6.          Queue<TreeNode> queue = new LinkedList<>();
7.          queue.add(root);//先把节点加入到队列中
8.          boolean leftToRight = true;//第一步先从左边开始打印
9.          while (!queue.isEmpty()) {
10.             //统计这一层有多少个节点
11.             int count = queue.size();
12.             //记录每层节点的值
13.             List<Integer> level = new ArrayList<>();
14.             //遍历这一层的所有节点,把他们全部从队列中移出来,顺便
15.             //把他们的值加入到集合level中,接着再把他们的子节点(如果有)
16.             //加入到队列中
17.             for (int i = 0; i < count; i++) {
18.                 //poll移除队列头部元素(队列在头部移除,尾部添加)
19.                 TreeNode node = queue.poll();
20.                 //判断是从左往右打印还是从右往左打印。
21.                 if (leftToRight) {
22.                     //如果从左边打印,直接把访问的节点值加入到列表level的末尾
23.                     level.add(node.val);
24.                 } else {
25.                     //如果是从右边开始打印,每次要把访问的节点值加入到列表的最前面
26.                     level.add(0, node.val);
27.                 }
28.                 //左右子节点如果不为空会被加入到队列中
29.                 if (node.left != null)
30.                     queue.add(node.left);
31.                 if (node.right != null)
32.                     queue.add(node.right);
33.             }
34.             //把这一层的节点值加入到集合res中
35.             res.add(level);
36.             //改变下次访问的方向
37.             leftToRight = !leftToRight;
38.         }
39.         return res;
40.     }

20. 判断A是否是B的子树

1.  public class Solution {
2.     //分为两个函数,一个用于遍历节点当做子树的根节点,
3.      public boolean hasSubtree(TreeNode root1,TreeNode root2) {
4.          if(root1==null||root2==null) return false;
5.          //直接判断isSubTree(root1,root2),并且采取||的方式确定结果。
6.          return isSubTree(root1,root2)||hasSubtree(root1.left,root2)
7.                  ||hasSubtree(root1.right,root2);
8.      }
9.      //另一个用于判断是否是子树(必须要root2先空)
10.     public boolean isSubTree(TreeNode root1,TreeNode root2){
11.         if(root2==null) return true;
12.         if(root1==null) return false;
13.         if(root1.val==root2.val){
14.             return isSubTree(root1.left,root2.left)&&
15.             isSubTree(root1.right,root2.right);
16.         }else{
17.             return false;
18.         }
19.     }
20. }

21. 最小硬币数

  • 动态规划算法题:给定不同面额的硬币数组coins和总额amounts,求能够组成总额的最小硬币数。如coins=[1,2,5],amounts=11,那么最少硬币数为5+5+1=3.
1.  public static int CoinsChange(int[] coins, int amount, int coinSize) {
2.          if (null == coins || amount == 0) return -1;
3.   
4.          int[] temp = new int[amount + 1];
5.          for (int i = 0; i <= amount; i++) {
6.              temp[i] = amount + 1;
7.          }
8.          temp[0] = 0;
9.          for (int i = 1; i <= amount; i++) {
10.             for (int j = 0; j < coinSize; j++) {
11.                 if (i >= coins[j]) {
12.                     temp[i] = Math.min(temp[i], 1 + temp[i - coins[j]]);
13.                 }
14.             }
15.         }
16.         return temp[amount] > amount ? -1 : temp[amount];
17.     }
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,142评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,298评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,068评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,081评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,099评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,071评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,990评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,832评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,274评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,488评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,649评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,378评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,979评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,625评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,643评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,545评论 2 352

推荐阅读更多精彩内容

  • 1.把二元查找树转变成排序的双向链表 题目: 输入一棵二元查找树,将该二元查找树转换成一个排序的双向链表。 要求不...
    曲终人散Li阅读 3,308评论 0 19
  • 表情是什么,我认为表情就是表现出来的情绪。表情可以传达很多信息。高兴了当然就笑了,难过就哭了。两者是相互影响密不可...
    Persistenc_6aea阅读 124,870评论 2 7
  • 16宿命:用概率思维提高你的胜算 以前的我是风险厌恶者,不喜欢去冒险,但是人生放弃了冒险,也就放弃了无数的可能。 ...
    yichen大刀阅读 6,046评论 0 4