build

2025-12-12 01:18:48 +08:00 · 2023-02-06 23:10:10 +08:00
parent 44c1d6eca0
commit 64f251f933
48 changed files with 22233 additions and 0 deletions
--- a/build/chapter_computational_complexity/performance_evaluation.md
+++ b/build/chapter_computational_complexity/performance_evaluation.md
@@ -0,0 +1,43 @@
+---
+comments: true
+---
+
+# 2.1. 算法效率评估
+
+## 2.1.1. 算法评价维度
+
+在开始学习算法之前，我们首先要想清楚算法的设计目标是什么，或者说，如何来评判算法的好与坏。整体上看，我们设计算法时追求两个层面的目标。
+
+1. **找到问题解法**。算法需要能够在规定的输入范围下，可靠地求得问题的正确解。
+2. **寻求最优解法**。同一个问题可能存在多种解法，而我们希望算法效率尽可能的高。
+
+换言之，在可以解决问题的前提下，算法效率则是主要评价维度，包括：
+
+- **时间效率**，即算法的运行速度的快慢。
+- **空间效率**，即算法占用的内存空间大小。
+
+数据结构与算法追求“运行速度快、占用内存少”，而如何去评价算法效率则是非常重要的问题，因为只有知道如何评价算法，才能去做算法之间的对比分析，以及优化算法设计。
+
+## 2.1.2. 效率评估方法
+
+### 实际测试
+
+假设我们现在有算法 A 和 算法 B ，都能够解决同一问题，现在需要对比两个算法之间的效率。我们能够想到的最直接的方式，就是找一台计算机，把两个算法都完整跑一遍，并监控记录运行时间和内存占用情况。这种评估方式能够反映真实情况，但是也存在很大的硬伤。
+
+**难以排除测试环境的干扰因素**。硬件配置会影响到算法的性能表现。例如，在某台计算机中，算法 A 比算法 B 运行时间更短；但换到另一台配置不同的计算机中，可能会得到相反的测试结果。这意味着我们需要在各种机器上展开测试，而这是不现实的。
+
+**展开完整测试非常耗费资源**。随着输入数据量的大小变化，算法会呈现出不同的效率表现。比如，有可能输入数据量较小时，算法 A 运行时间短于算法 B ，而在输入数据量较大时，测试结果截然相反。因此，若想要达到具有说服力的对比结果，那么需要输入各种体量数据，这样的测试需要占用大量计算资源。
+
+### 理论估算
+
+既然实际测试具有很大的局限性，那么我们是否可以仅通过一些计算，就获知算法的效率水平呢？答案是肯定的，我们将此估算方法称为「复杂度分析 Complexity Analysis」或「渐近复杂度分析 Asymptotic Complexity Analysis」。
+
+**复杂度分析评估随着输入数据量的增长，算法的运行时间和占用空间的增长趋势**。根据时间和空间两方面，复杂度可分为「时间复杂度 Time Complexity」和「空间复杂度 Space Complexity」。
+
+**复杂度分析克服了实际测试方法的弊端**。一是独立于测试环境，分析结果适用于所有运行平台。二是可以体现不同数据量下的算法效率，尤其是可以反映大数据量下的算法性能。
+
+## 2.1.3. 复杂度分析重要性
+
+复杂度分析给出一把评价算法效率的“标尺”，告诉我们执行某个算法需要多少时间和空间资源，也让我们可以开展不同算法之间的效率对比。
+
+计算复杂度是个数学概念，对于初学者可能比较抽象，学习难度相对较高。从这个角度出发，其并不适合作为第一章内容。但是，当我们讨论某个数据结构或者算法的特点时，难以避免需要分析它的运行速度和空间使用情况。**因此，在展开学习数据结构与算法之前，建议读者先对计算复杂度建立起初步的了解，并且能够完成简单案例的复杂度分析**。
--- a/build/chapter_computational_complexity/space_complexity.md
+++ b/build/chapter_computational_complexity/space_complexity.md
--- a/build/chapter_computational_complexity/space_time_tradeoff.md
+++ b/build/chapter_computational_complexity/space_time_tradeoff.md
@@ -0,0 +1,386 @@
+---
+comments: true
+---
+
+# 2.4. 权衡时间与空间
+
+理想情况下，我们希望算法的时间复杂度和空间复杂度都能够达到最优，而实际上，同时优化时间复杂度和空间复杂度是非常困难的。
+
+**降低时间复杂度，往往是以提升空间复杂度为代价的，反之亦然**。我们把牺牲内存空间来提升算法运行速度的思路称为「以空间换时间」；反之，称之为「以时间换空间」。选择哪种思路取决于我们更看重哪个方面。
+
+大多数情况下，时间都是比空间更宝贵的，只要空间复杂度不要太离谱、能接受就行，**因此以空间换时间最为常用**。
+
+## 2.4.1. 示例题目 *
+
+以 LeetCode 全站第一题 [两数之和](https://leetcode.cn/problems/two-sum/) 为例。
+
+!!! question "两数之和"
+
+    给定一个整数数组 `nums` 和一个整数目标值 `target` ，请你在该数组中找出“和”为目标值 `target` 的那两个整数，并返回它们的数组下标。
+    
+    你可以假设每种输入只会对应一个答案。但是，数组中同一个元素在答案里不能重复出现。
+    
+    你可以按任意顺序返回答案。
+
+「暴力枚举」和「辅助哈希表」分别为 **空间最优** 和 **时间最优** 的两种解法。本着时间比空间更宝贵的原则，后者是本题的最佳解法。
+
+### 方法一：暴力枚举
+
+时间复杂度 $O(N^2)$ ，空间复杂度 $O(1)$ ，属于「时间换空间」。
+
+虽然仅使用常数大小的额外空间，但运行速度过慢。
+
+=== "Java"
+
+    ```java title="leetcode_two_sum.java"
+    class SolutionBruteForce {
+        public int[] twoSum(int[] nums, int target) {
+            int size = nums.length;
+            // 两层循环，时间复杂度 O(n^2)
+            for (int i = 0; i < size - 1; i++) {
+                for (int j = i + 1; j < size; j++) {
+                    if (nums[i] + nums[j] == target)
+                        return new int[] { i, j };
+                }
+            }
+            return new int[0];
+        }
+    }
+    ```
+
+=== "C++"
+
+    ```cpp title="leetcode_two_sum.cpp"
+    class SolutionBruteForce {
+    public:
+        vector<int> twoSum(vector<int>& nums, int target) {
+            int size = nums.size();
+            // 两层循环，时间复杂度 O(n^2)
+            for (int i = 0; i < size - 1; i++) {
+                for (int j = i + 1; j < size; j++) {
+                    if (nums[i] + nums[j] == target)
+                        return { i, j };
+                }
+            }
+            return {};
+        }
+    };
+    ```
+
+=== "Python"
+
+    ```python title="leetcode_two_sum.py"
+    """ 方法一：暴力枚举 """
+    class SolutionBruteForce:
+        def twoSum(self, nums: List[int], target: int) -> List[int]:
+            # 两层循环，时间复杂度 O(n^2)
+            for i in range(len(nums) - 1):
+                for j in range(i + 1, len(nums)):
+                    if nums[i] + nums[j] == target:
+                        return i, j
+            return []
+    ```
+
+=== "Go"
+
+    ```go title="leetcode_two_sum.go"
+    func twoSumBruteForce(nums []int, target int) []int {
+        size := len(nums)
+        // 两层循环，时间复杂度 O(n^2)
+        for i := 0; i < size-1; i++ {
+            for j := i + 1; i < size; j++ {
+                if nums[i]+nums[j] == target {
+                    return []int{i, j}
+                }
+            }
+        }
+        return nil
+    }
+    ```
+
+=== "JavaScript"
+
+    ```js title="leetcode_two_sum.js"
+    function twoSumBruteForce(nums, target) {
+        const n = nums.length;
+        // 两层循环，时间复杂度 O(n^2)
+        for (let i = 0; i < n; i++) {
+            for (let j = i + 1; j < n; j++) {
+                if (nums[i] + nums[j] === target) {
+                    return [i, j];
+                }
+            }
+        }
+        return [];
+    }
+    ```
+
+=== "TypeScript"
+
+    ```typescript title="leetcode_two_sum.ts"
+    function twoSumBruteForce(nums: number[], target: number): number[] {
+        const n = nums.length;
+        // 两层循环，时间复杂度 O(n^2)
+        for (let i = 0; i < n; i++) {
+            for (let j = i + 1; j < n; j++) {
+                if (nums[i] + nums[j] === target) {
+                    return [i, j];
+                }
+            }
+        }
+        return [];
+    };
+    ```
+
+=== "C"
+
+    ```c title="leetcode_two_sum.c"
+
+    ```
+
+=== "C#"
+
+    ```csharp title="leetcode_two_sum.cs"
+    class SolutionBruteForce
+    {
+        public int[] twoSum(int[] nums, int target)
+        {
+            int size = nums.Length;
+            // 两层循环，时间复杂度 O(n^2)
+            for (int i = 0; i < size - 1; i++)
+            {
+                for (int j = i + 1; j < size; j++)
+                {
+                    if (nums[i] + nums[j] == target)
+                        return new int[] { i, j };
+                }
+            }
+            return new int[0];
+        }
+    }
+    ```
+
+=== "Swift"
+
+    ```swift title="leetcode_two_sum.swift"
+    func twoSumBruteForce(nums: [Int], target: Int) -> [Int] {
+        // 两层循环，时间复杂度 O(n^2)
+        for i in nums.indices.dropLast() {
+            for j in nums.indices.dropFirst(i + 1) {
+                if nums[i] + nums[j] == target {
+                    return [i, j]
+                }
+            }
+        }
+        return [0]
+    }
+    ```
+
+=== "Zig"
+
+    ```zig title="leetcode_two_sum.zig"
+    const SolutionBruteForce = struct {
+        pub fn twoSum(self: *SolutionBruteForce, nums: []i32, target: i32) [2]i32 {
+            _ = self;
+            var size: usize = nums.len;
+            var i: usize = 0;
+            // 两层循环，时间复杂度 O(n^2)
+            while (i < size - 1) : (i += 1) {
+                var j = i + 1;
+                while (j < size) : (j += 1) {
+                    if (nums[i] + nums[j] == target) {
+                        return [_]i32{@intCast(i32, i), @intCast(i32, j)};
+                    }
+                }
+            }
+            return undefined;
+        }
+    };
+    ```
+
+### 方法二：辅助哈希表
+
+时间复杂度 $O(N)$ ，空间复杂度 $O(N)$ ，属于「空间换时间」。
+
+借助辅助哈希表 dic ，通过保存数组元素与索引的映射来提升算法运行速度。
+
+=== "Java"
+
+    ```java title="leetcode_two_sum.java"
+    class SolutionHashMap {
+        public int[] twoSum(int[] nums, int target) {
+            int size = nums.length;
+            // 辅助哈希表，空间复杂度 O(n)
+            Map<Integer, Integer> dic = new HashMap<>();
+            // 单层循环，时间复杂度 O(n)
+            for (int i = 0; i < size; i++) {
+                if (dic.containsKey(target - nums[i])) {
+                    return new int[] { dic.get(target - nums[i]), i };
+                }
+                dic.put(nums[i], i);
+            }
+            return new int[0];
+        }
+    }
+    ```
+
+=== "C++"
+
+    ```cpp title="leetcode_two_sum.cpp"
+    class SolutionHashMap {
+    public:
+        vector<int> twoSum(vector<int>& nums, int target) {
+            int size = nums.size();
+            // 辅助哈希表，空间复杂度 O(n)
+            unordered_map<int, int> dic;
+            // 单层循环，时间复杂度 O(n)
+            for (int i = 0; i < size; i++) {
+                if (dic.find(target - nums[i]) != dic.end()) {
+                    return { dic[target - nums[i]], i };
+                }
+                dic.emplace(nums[i], i);
+            }
+            return {};
+        }
+    };
+    ```
+
+=== "Python"
+
+    ```python title="leetcode_two_sum.py"
+    """ 方法二：辅助哈希表 """
+    class SolutionHashMap:
+        def twoSum(self, nums: List[int], target: int) -> List[int]:
+            # 辅助哈希表，空间复杂度 O(n)
+            dic = {}
+            # 单层循环，时间复杂度 O(n)
+            for i in range(len(nums)):
+                if target - nums[i] in dic:
+                    return dic[target - nums[i]], i
+                dic[nums[i]] = i
+            return []
+    ```
+
+=== "Go"
+
+    ```go title="leetcode_two_sum.go"
+    func twoSumHashTable(nums []int, target int) []int {
+        // 辅助哈希表，空间复杂度 O(n)
+        hashTable := map[int]int{}
+        // 单层循环，时间复杂度 O(n)
+        for idx, val := range nums {
+            if preIdx, ok := hashTable[target-val]; ok {
+                return []int{preIdx, idx}
+            }
+            hashTable[val] = idx
+        }
+        return nil
+    }
+    ```
+
+=== "JavaScript"
+
+    ```js title="leetcode_two_sum.js"
+    function twoSumHashTable(nums, target) {
+        // 辅助哈希表，空间复杂度 O(n)
+        let m = {};
+        // 单层循环，时间复杂度 O(n)
+        for (let i = 0; i < nums.length; i++) {
+            if (m[nums[i]] !== undefined) {
+                return [m[nums[i]], i];
+            } else {
+                m[target - nums[i]] = i;
+            }
+        }
+        return [];
+    }
+    ```
+
+=== "TypeScript"
+
+    ```typescript title="leetcode_two_sum.ts"
+    function twoSumHashTable(nums: number[], target: number): number[] {
+        // 辅助哈希表，空间复杂度 O(n)
+        let m: Map<number, number> = new Map();
+        // 单层循环，时间复杂度 O(n)
+        for (let i = 0; i < nums.length; i++) {
+            let index = m.get(nums[i]);
+            if (index !== undefined) {
+                return [index, i];
+            } else {
+                m.set(target - nums[i], i);
+            }
+        }
+        return [];
+    };
+    ```
+
+=== "C"
+
+    ```c title="leetcode_two_sum.c"
+
+    ```
+
+=== "C#"
+
+    ```csharp title="leetcode_two_sum.cs"
+    class SolutionHashMap
+    {
+        public int[] twoSum(int[] nums, int target)
+        {
+            int size = nums.Length;
+            // 辅助哈希表，空间复杂度 O(n)
+            Dictionary<int, int> dic = new();
+            // 单层循环，时间复杂度 O(n)
+            for (int i = 0; i < size; i++)
+            {
+                if (dic.ContainsKey(target - nums[i]))
+                {
+                    return new int[] { dic[target - nums[i]], i };
+                }
+                dic.Add(nums[i], i);
+            }
+            return new int[0];
+        }
+    }
+    ```
+
+=== "Swift"
+
+    ```swift title="leetcode_two_sum.swift"
+    func twoSumHashTable(nums: [Int], target: Int) -> [Int] {
+        // 辅助哈希表，空间复杂度 O(n)
+        var dic: [Int: Int] = [:]
+        // 单层循环，时间复杂度 O(n)
+        for i in nums.indices {
+            if let j = dic[target - nums[i]] {
+                return [j, i]
+            }
+            dic[nums[i]] = i
+        }
+        return [0]
+    }
+    ```
+
+=== "Zig"
+
+    ```zig title="leetcode_two_sum.zig"
+    const SolutionHashMap = struct {
+        pub fn twoSum(self: *SolutionHashMap, nums: []i32, target: i32) ![2]i32 {
+            _ = self;
+            var size: usize = nums.len;
+            // 辅助哈希表，空间复杂度 O(n)
+            var dic = std.AutoHashMap(i32, i32).init(std.heap.page_allocator);
+            defer dic.deinit();
+            var i: usize = 0;
+            // 单层循环，时间复杂度 O(n)
+            while (i < size) : (i += 1) {
+                if (dic.contains(target - nums[i])) {
+                    return [_]i32{dic.get(target - nums[i]).?, @intCast(i32, i)};
+                }
+                try dic.put(nums[i], @intCast(i32, i));
+            }
+            return undefined;
+        }
+    };
+    ```
--- a/build/chapter_computational_complexity/summary.md
+++ b/build/chapter_computational_complexity/summary.md
@@ -0,0 +1,28 @@
+---
+comments: true
+---
+
+# 2.5. 小结
+
+### 算法效率评估
+
+- 「时间效率」和「空间效率」是算法性能的两个重要的评价维度。
+- 我们可以通过「实际测试」来评估算法效率，但难以排除测试环境的干扰，并且非常耗费计算资源。
+- 「复杂度分析」克服了实际测试的弊端，分析结果适用于所有运行平台，并且可以体现不同数据大小下的算法效率。
+
+### 时间复杂度
+
+- 「时间复杂度」统计算法运行时间随着数据量变大时的增长趋势，可以有效评估算法效率，但在某些情况下可能失效，比如在输入数据量较小或时间复杂度相同时，无法精确对比算法效率的优劣性。
+- 「最差时间复杂度」使用大 $O$ 符号表示，即函数渐近上界，其反映当 $n$ 趋于正无穷时，$T(n)$ 处于何种增长级别。
+- 推算时间复杂度分为两步，首先统计计算操作数量，再判断渐近上界。
+- 常见时间复杂度从小到大排列有 $O(1)$ , $O(\log n)$ , $O(n)$ , $O(n \log n)$ , $O(n^2)$ , $O(2^n)$ , $O(n!)$ 。
+- 某些算法的时间复杂度不是恒定的，而是与输入数据的分布有关。时间复杂度分为「最差时间复杂度」和「最佳时间复杂度」，后者几乎不用，因为输入数据需要满足苛刻的条件才能达到最佳情况。
+- 「平均时间复杂度」可以反映在随机数据输入下的算法效率，最贴合实际使用情况下的算法性能。计算平均时间复杂度需要统计输入数据的分布，以及综合后的数学期望。
+
+### 空间复杂度
+
+- 与时间复杂度的定义类似，「空间复杂度」统计算法占用空间随着数据量变大时的增长趋势。
+
+- 算法运行中相关内存空间可分为输入空间、暂存空间、输出空间。通常情况下，输入空间不计入空间复杂度计算。暂存空间可分为指令空间、数据空间、栈帧空间，其中栈帧空间一般在递归函数中才会影响到空间复杂度。
+- 我们一般只关心「最差空间复杂度」，即统计算法在「最差输入数据」和「最差运行时间点」下的空间复杂度。
+- 常见空间复杂度从小到大排列有 $O(1)$ , $O(\log n)$ , $O(n)$ , $O(n^2)$ , $O(2^n)$ 。
--- a/build/chapter_computational_complexity/time_complexity.md
+++ b/build/chapter_computational_complexity/time_complexity.md