算法之旅(八)算法核心思想之一 分治算法

一、分治算法的三个主要步骤

  1. 分解(Divide):将原问题分解成规模较小且相互独立的子问题。
  2. 解决(Conquer):递归地求解各个子问题。
  3. 合并(Combine):将各个子问题的解合并成原问题的解。

二、分治算法的核心思想

分治算法是一种重要的算法设计范式,其核心思想是将一个复杂的问题分解为若干个规模较小且相互独立的子问题,递归地解决这些子问题,然后再合并其结果,得到原问题的解。

  • 减少问题规模:通过分解,将大问题转化为小问题,降低了解决问题的复杂度。
  • 利用递归思想:子问题的结构与原问题相似,可以递归地解决。
  • 提高效率:如果子问题足够小,求解起来会更简单高效。

三、分治算法的常见应用场景

分治算法的应用场景有很多,我以三种不同的数据结构为例,分别演示下分治算法的应用

  1. 排序算法 - 归并排序(数组)
  2. 树的算法 - 二叉树的最大深度(树)
  3. 矩阵运算 - 矩阵乘法的Strassen算法(矩阵)

示例一:归并排序(Merge Sort) - 数组

1. 问题描述

对一个无序的数组进行排序,使其按照从小到大的顺序排列。

2. 分治思想应用

  • 分解(Divide):将数组从中间分成两半,形成两个子数组。
  • 解决(Conquer):递归地对这两个子数组进行归并排序。
  • 合并(Combine):将已排序的子数组合并,得到完整的排序数组。

3. 代码示例

public class MergeSortExample {
    // 归并排序主函数
    public static void mergeSort(int[] array) {
        if (array.length <= 1) {
            return; // 递归终止条件
        }
        // 分解
        int mid = array.length / 2;
        int[] left = new int[mid];
        int[] right = new int[array.length - mid];

        // 拷贝数组元素
        System.arraycopy(array, 0, left, 0, mid);
        System.arraycopy(array, mid, right, 0, array.length - mid);

        // 递归解决
        mergeSort(left);
        mergeSort(right);

        // 合并
        merge(array, left, right);
    }

    // 合并两个已排序的数组
    private static void merge(int[] result, int[] left, int[] right) {
        int i = 0; // 左数组索引
        int j = 0; // 右数组索引
        int k = 0; // 合并后数组索引

        while (i < left.length && j < right.length) {
            if (left[i] <= right[j]) {
                result[k++] = left[i++];
            } else {
                result[k++] = right[j++];
            }
        }
        // 处理剩余元素
        while (i < left.length) {
            result[k++] = left[i++];
        }
        while (j < right.length) {
            result[k++] = right[j++];
        }
    }

    // 测试代码
    public static void main(String[] args) {
        int[] array = {38, 27, 43, 3, 9, 82, 10};
        System.out.println("原始数组:" + Arrays.toString(array));

        mergeSort(array);

        System.out.println("排序后数组:" + Arrays.toString(array));
    }
}

输出结果:

原始数组:[38, 27, 43, 3, 9, 82, 10]
排序后数组:[3, 9, 10, 27, 38, 43, 82]

4. 算法复杂度

  • 时间复杂度:O(n log n)
    • 每次分解将数组长度减半,递归深度为 log n。
    • 合并过程需要 O(n) 时间。
  • 空间复杂度:O(n)
    • 需要额外的数组来存储分解的子数组和合并的结果。

5. 思路说明

  • 递归分解:不断将数组对半分,直到子数组长度为 1。
  • 递归合并:从最小的子数组开始,两两合并成有序数组。
  • 优势:适用于大规模数据的排序,性能稳定。

示例二:二叉树的最大深度(Binary Tree Maximum Depth) -

1. 问题描述

计算给定二叉树的最大深度,即从根节点到叶子节点的最长路径上的节点数。

2. 分治思想应用

  • 分解(Divide):将问题分解为求左子树和右子树的最大深度。
  • 解决(Conquer):递归地求解左子树和右子树的最大深度。
  • 合并(Combine):取左右子树深度的最大值,加 1(当前节点),得到整个树的最大深度。

3. 代码示例

public class MaxDepthBinaryTree {
    // 定义二叉树节点
    static class TreeNode {
        int val;
        TreeNode left;
        TreeNode right;
        TreeNode(int val) { this.val = val; }
    }

    // 计算二叉树的最大深度
    public static int maxDepth(TreeNode root) {
        if (root == null) {
            return 0; // 递归终止条件
        }
        // 递归计算左子树和右子树的深度
        int leftDepth = maxDepth(root.left);
        int rightDepth = maxDepth(root.right);

        // 合并:取最大值,加上当前节点
        return Math.max(leftDepth, rightDepth) + 1;
    }

    // 测试代码
    public static void main(String[] args) {
        /*
         * 构建二叉树:
         *         1
         *        / \
         *       2   3
         *      / \
         *     4   5
         */
        TreeNode root = new TreeNode(1);
        root.left = new TreeNode(2); 
        root.right = new TreeNode(3); 
        root.left.left = new TreeNode(4); 
        root.left.right = new TreeNode(5); 

        int depth = maxDepth(root);
        System.out.println("二叉树的最大深度是:" + depth); // 输出 3
    }
}

输出结果:

二叉树的最大深度是:3

4. 算法复杂度

  • 时间复杂度:O(n)
    • 每个节点都被访问一次。
  • 空间复杂度:O(h)
    • 递归调用栈的深度为树的高度 h。

5. 思路说明

  • 递归遍历:通过递归遍历每个节点,分别计算左子树和右子树的深度。
  • 比较合并:在回溯时,取左右子树深度的最大值,并加上当前节点。
  • 优势:代码简洁,利用递归自然地遍历树结构。

示例三:矩阵乘法的Strassen算法 - 矩阵

1. 问题描述

传统的矩阵乘法对于两个 n x n 的矩阵,时间复杂度为 O(n³)。Strassen 算法使用分治思想,将时间复杂度降低到约 O(n².81)。

2. 分治思想应用

  • 分解(Divide):将矩阵分成 8 个 n/2 x n/2 的子矩阵。
  • 解决(Conquer):递归地计算 7 个乘积(而不是传统的 8 个)。
  • 合并(Combine):通过加减运算组合这 7 个乘积,得到最终结果。

3. 代码示例

public class StrassenMatrixMultiplication {
    // 矩阵加法
    private static int[][] add(int[][] A, int[][] B) {
        int n = A.length;
        int[][] result = new int[n][n];
        for(int i = 0; i < n; i++)
            for(int j = 0; j < n; j++)
                result[i][j] = A[i][j] + B[i][j];
        return result;
    }

    // 矩阵减法
    private static int[][] subtract(int[][] A, int[][] B) {
        int n = A.length;
        int[][] result = new int[n][n];
        for(int i = 0; i < n; i++)
            for(int j = 0; j < n; j++)
                result[i][j] = A[i][j] - B[i][j];
        return result;
    }

    // Strassen算法实现
    public static int[][] strassen(int[][] A, int[][] B) {
        int n = A.length;
        int[][] result = new int[n][n];

        // 基本情况
        if (n == 1) {
            result[0][0] = A[0][0] * B[0][0];
        } else {
            int newSize = n / 2;
            // 初始化子矩阵
            int[][] A11 = new int[newSize][newSize];
            int[][] A12 = new int[newSize][newSize];
            int[][] A21 = new int[newSize][newSize];
            int[][] A22 = new int[newSize][newSize];

            int[][] B11 = new int[newSize][newSize];
            int[][] B12 = new int[newSize][newSize];
            int[][] B21 = new int[newSize][newSize];
            int[][] B22 = new int[newSize][newSize];

            // 分解矩阵
            for (int i = 0; i < newSize; i++) {
                for (int j = 0; j < newSize; j++) {
                    A11[i][j] = A[i][j]; // 左上
                    A12[i][j] = A[i][j + newSize]; // 右上
                    A21[i][j] = A[i + newSize][j]; // 左下
                    A22[i][j] = A[i + newSize][j + newSize]; // 右下

                    B11[i][j] = B[i][j]; // 左上
                    B12[i][j] = B[i][j + newSize]; // 右上
                    B21[i][j] = B[i + newSize][j]; // 左下
                    B22[i][j] = B[i + newSize][j + newSize]; // 右下
                }
            }

            // 计算 M1 到 M7
            int[][] M1 = strassen(add(A11, A22), add(B11, B22));
            int[][] M2 = strassen(add(A21, A22), B11);
            int[][] M3 = strassen(A11, subtract(B12, B22));
            int[][] M4 = strassen(A22, subtract(B21, B11));
            int[][] M5 = strassen(add(A11, A12), B22);
            int[][] M6 = strassen(subtract(A21, A11), add(B11, B12));
            int[][] M7 = strassen(subtract(A12, A22), add(B21, B22));

            // 合并子矩阵
            int[][] C11 = add(subtract(add(M1, M4), M5), M7);
            int[][] C12 = add(M3, M5);
            int[][] C21 = add(M2, M4);
            int[][] C22 = add(subtract(add(M1, M3), M2), M6);

            // 组合结果
            for (int i = 0; i < newSize; i++) {
                for (int j = 0; j < newSize; j++) {
                    result[i][j] = C11[i][j];
                    result[i][j + newSize] = C12[i][j];
                    result[i + newSize][j] = C21[i][j];
                    result[i + newSize][j + newSize] = C22[i][j];
                }
            }
        }
        return result;
    }

    // 测试代码
    public static void main(String[] args) {
        int n = 2; // 矩阵大小必须是2的幂
        int[][] A = { {1, 2}, {3, 4} };
        int[][] B = { {5, 6}, {7, 8} };

        int[][] result = strassen(A, B);

        // 输出结果
        System.out.println("矩阵A和B的乘积:");
        for (int[] row : result) {
            System.out.println(Arrays.toString(row));
        }
    }
}

输出结果:

矩阵A和B的乘积:
[19, 22]
[43, 50]

4. 算法复杂度

  • 时间复杂度:约为 O(n^2.81)
    • 比传统的 O(n³) 更快,但由于常数因素较大,实际应用中需要权衡。
  • 空间复杂度:O(n^2)
    • 需要额外空间存储子矩阵。

5. 思路说明

  • 递归分解:将矩阵分割成更小的子矩阵,直到规模足够小。
  • 减少乘法次数:通过巧妙的计算,只需进行 7 次递归乘法,而不是传统的 8 次。
  • 合并结果:通过矩阵的加减运算,组合子矩阵得到最终结果。
  • 适用性:适用于大型矩阵的乘法运算,但需要矩阵大小为 2 的幂次方。

高级技术栈实践-实时流计算之一flink的应用

Flink 通过并行处理和分布式计算来高效地处理大规模数据集。
以下是一些关键应用场景:

  1. 数据聚合:在进行数据聚合(如求和、平均值等)时,可以将数据分成多个子集,分别计算各自的聚合值,最后合并结果。

  2. 批处理:在处理大规模批量数据时,Flink 能够将数据分块处理,每个块可以独立地执行计算,最终合并输出结果。

  3. 实时流处理:在实时数据流处理中,Flink 可以将输入流分解为多个流进行并行处理,以提高处理效率。

通过使用分治策略,可以显著提升数据处理性能,特别是在处理复杂的数据转换和分析任务时。

这个技术栈主要应用于大数据的实时流计算中,对于实时流计算还有很多实现方式,flink只是其中一种实现方式。

前面我可能提到了中间件kafka本身的可靠性投递并不难,但一旦结合像flink这种实时计算,或者其他的综合数据流处理技术栈结合。数据的可靠性投递、兜底方案也会跟着技术栈组合使用改变,来实现闭环。


四、总结

分治算法的核心在于将复杂问题分解为更小的子问题,利用递归解决,并将结果合并。

  • 优点
    • 可以显著降低算法的时间复杂度,提高效率。
    • 适用于许多递归性质的问题。
  • 缺点
    • 可能增加空间复杂度,需要额外的存储空间。
    • 递归调用可能导致调用栈溢出,需要注意递归深度。

应用场景

  • 排序算法:如归并排序、快速排序。
  • 搜索算法:如二分查找。
  • 数学计算:如大整数乘法、矩阵运算。
  • 图形处理:如快速傅里叶变换(FFT)。

选择合适的数据结构和算法,可以有效地解决复杂的问题。
理解分治算法的思想,对于算法设计和优化具有重要意义。
简单来说就是拆解复杂问题,细化问题再在每一层细化问题使用最优解决方案。
结合解耦的思想,可以逐步解决问题。
应用于各个高级框架。属于高级技术框架的底层思想。


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,290评论 6 491
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,107评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,872评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,415评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,453评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,784评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,927评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,691评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,137评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,472评论 2 326
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,622评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,289评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,887评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,741评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,977评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,316评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,490评论 2 348

推荐阅读更多精彩内容