一、网页爬虫: 1、工作原理: 通过解析已经爬取页面中的网页链接,然后再爬取这些链接对应的网页。 2、去重原因: 由于同一个网页链接有可...
一、有权图的最短路径: 1、概念: 所谓的有权图的最短路径也就是图中的每条边都有一个权重,最短路径就是经过的边的权重和最小。 2、思路: ...
一、拓扑排序: 1、拓扑排序本身是基于有向无环图的一个算法。 2、拓扑排序的实现算法: Kahn算法 DFS算法 二、Kahn算法: 1、思路:...
一、如何量化两个字符串的相似度? 1、编辑距离(Edit Distance): <1>、概念: 编辑距离指的就是,将一个字符串转化成另一个...
一、理论: 1、一个模型三个特征: <1>、“一个模型”: 它指的是动态规划适合解决的问题的模型。一般是用动态规划来解决最优问题。而解决问题...
一、0-1背包问题: 假设背包的最大承载重量是9。我们有5个不同的物品,每个物品的重量分别是2, 2, 4, 6, 3。 1、采用回溯算法:...
一、回溯算法: 1、核心思想: 采用试错的思想,尝试分步的去解决一个问题。在分步解决问题的过程中,当通过尝试发现有的分步答案不能得到有效的正...
一、分治算法: 1、核心思想: 分而治之 ,也就是将原问题划分成n个规模较小,并且结构与原问题相似的子问题,递归地解决这些子问题,然后再合并...
一、贪心算法: 1、概念: 每一步选择中都采取在当前状态下最好或最优(即最有利)的选择,从而希望导致结果是最好或最优的算法。 2、贪心算法解...
文集作者