算法面试
扥盖房
背景
大家好,我是石头哥。
开篇前希望做一个调查,不知道大家都习惯什么时候阅读公众号,目前我的发文时间 并不规律,希望借此统计下大家的阅读习惯,尽量统一时间发送文章,以下统计可多选。
今天要分享的这篇文章,是 14 种针对常见算法的解题套路,经常出现在各大公司的笔试面试中的题目,仔细阅读并学习,你一定会有收获的。(值得收藏)
另外,文末送一份本人觉得还不错的刷题指南。
作者:Fahim ul Haq,机器之心编译,参与:Panda
解题套路
咱们在面试程序员岗位时往往需要经历一个编程面试过程,雇主会借此考验面试者的技术实力。
然而,这些技术问题有时候却和我们的实际工作并无太大关系,也由此可能给我们的编程面试准备阶段带来很大的压力。
曾在 Facebook 和微软工作过的 Educative.io 创始人 Fahim ul Haq 近日发文总结了编程面试所遇到的问题的 14 种最常见的模式,也许能帮你看清各种编程面试问题「背后的真相」。
对很多开发者来说,编程工作的面试准备很容易让人焦虑。面试要涉及的东西实在太多,其中很多还往往与开发者的日常工作无关,只会额外增添压力。
这种现状导致了一个后果:现在的开发者往往需要花费数周时间在 LeetCode 等网站上了解综合数百个问题。
与我谈过的开发者在面试前的一个常见焦虑问题是:我是否已经解决过足够多的实际问题?我本可以做到更多吗?
这就是我想要帮助开发者了解每个问题背后的底层模式的原因——这样他们就不必担忧解决数百个问题以及被 LeetCode 整得疲惫不堪了。
如果你理解面试的通用模式,你就可以将其用作模板, 从而解决各种层级的稍有不同的问题。
这里我将列出最常见的 14 种模式,它们可被用于解决任何编程面试问题。
另外我还会说明如何识别每种模式,并会为每种模式提供一些问题示例。
这些内容都只是蜻蜓点水 —— 我强烈建议你看看课程《Grokking the Coding Interview: Patterns for Coding Questions》,里面提供了全面的解释、示例和编程实践。
下面的模式说明假设你已经知悉了数据结构。如果你还不了解,那需要补充一下知识点哦。
我们今天将说明以下 14 种模式:
- 1.滑动窗口
- 2.二指针或迭代器
- 3.快速和慢速指针或迭代器
- 4.合并区间
- 5.循环排序
- 6.原地反转链表
- 7.树的宽度优先搜索(Tree BFS)
- 8.树的深度优先搜索(Tree DFS)
- 9.Two Heaps
- 10.子集
- 11.经过修改的二叉搜索
- 12.前 K 个元素
- 13.K 路合并
- 14.拓扑排序
大家一起学习学习吧!
1.滑动窗口
滑动窗口模式是用于在给定数组或链表的特定窗口大小上执行所需的操作,比如寻找包含所有 1 的最长子数组。
从第一个元素开始滑动窗口并逐个元素地向右滑,并根据你所求解的问题调整窗口的长度。
在某些情况下窗口大小会保持恒定,在其它情况下窗口大小会增大或减小。
下面是一些你可以用来确定给定问题可能需要滑动窗口的方法:
- 问题的输入是一种线性数据结构,比如链表、数组或字符串
- 你被要求查找最长/最短的子字符串、子数组或所需的值
你可以使用滑动窗口模式处理的常见问题:
- 大小为 K 的子数组的最大和(简单)
- 带有 K 个不同字符的最长子字符串(中等)
- 寻找字符相同但排序不一样的字符串(困难)
2.二指针或迭代器
二指针(Two Pointers)是这样一种模式:
两个指针以一前一后的模式在数据结构中迭代,直到一个或两个指针达到某种特定条件。
二指针通常在排序数组或链表中搜索配对时很有用:比如当你必须将一个数组的每个元素与其它元素做比较时。
二指针是很有用的,因为如果只有一个指针,你必须继续在数组中循环回来才能找到答案。
这种使用单个迭代器进行来回在时间和空间复杂度上都很低效——这个概念被称为「渐进分析(asymptotic analysis)」。
尽管使用 1 个指针进行暴力搜索或简单普通的解决方案也有效果,但这会沿 O(n²) 线得到一些东西。在很多情况中,二指针有助于你寻找有更好空间或运行时间复杂度的解决方案。
用于识别使用二指针的时机的方法:
- 可用于你要处理排序数组(或链接列表)并需要查找满足某些约束的一组元素的问题
- 数组中的元素集是配对、三元组甚至子数组
下面是一些满足二指针模式的问题:
- 求一个排序数组的平方(简单)
- 求总和为零的三元组(中等)
- 比较包含回退(backspace)的字符串(中等)
3.快速和慢速指针
快速和慢速指针方法也被称为 Hare & Tortoise 算法,该算法会使用两个在数组(或序列/链表)中以不同速度移动的指针。该方法在处理循环链表或数组时非常有用。
通过以不同的速度进行移动(比如在一个循环链表中),该算法证明这两个指针注定会相遇。只要这两个指针在同一个循环中,快速指针就会追赶上慢速指针。
如何判别使用快速和慢速模式的时机?
- 处理链表或数组中的循环的问题
- 当你需要知道特定元素的位置或链表的总长度时
何时应该优先选择这种方法,而不是上面提到的二指针方法?
- 有些情况不适合使用二指针方法,比如在不能反向移动的单链接链表中。使用快速和慢速模式的一个案例是当你想要确定一个链表是否为回文(palindrome)时。
下面是一些满足快速和慢速指针模式的问题:
- 链表循环(简单)
- 回文链表(中等)
- 环形数组中的循环(困难)
4.合并区间
合并区间模式是一种处理重叠区间的有效技术。
在很多涉及区间的问题中,你既需要找到重叠的区间,也需要在这些区间重叠时合并它们。该模式的工作方式为:
给定两个区间(a 和 b),这两个区间有 6 种不同的互相关联的方式:
理解并识别这六种情况有助于你求解范围广泛的问题,从插入区间到优化区间合并等。
那么如何确定何时该使用合并区间模式呢?
- 如果你被要求得到一个仅含互斥区间的列表
- 如果你听到了术语「重叠区间(overlapping intervals)」
合并区间模式的问题:
- 区间交叉(中等)
- 最大 CPU 负载(困难)
5. 循环排序
这一模式描述了一种有趣的方法,处理的是涉及包含给定范围内数值的数组的问题。
循环排序模式一次会在数组上迭代一个数值,如果所迭代的当前数值不在正确的索引处,就将其与其正确索引处的数值交换。
你可以尝试替换其正确索引处的数值,但这会带来 O(n^2) 的复杂度,这不是最优的,因此要用循环排序模 式。
如何识别这种模式?
- 涉及数值在给定范围内的排序数组的问题
- 如果问题要求你在一个排序/旋转的数组中找到缺失值/重复值/最小值
循环排序模式的问题:
- 找到缺失值(简单)
- 找到最小的缺失的正数值(中等)
6. 原地反转链表
在很多问题中,你可能会被要求反转一个链表中一组节点之间的链接。
通常而言,你需要原地完成这一任务,即使用已有的节点对象且不占用额外的内存。这就是这个模式的用武之地。
该模式会从一个指向链表头的变量(current)开始一次反转一个节点,然后一个变量(previous)将指向已经处理过的前一个节点。
以锁步的方式,在移动到下一个节点之前将其指向前一个节点,可实现对当前节点的反转。
另外,也将更新变量「previous」,使其总是指向已经处理过的前一个节点。
如何识别使用该模式的时机:
- 如果你被要求在不使用额外内存的前提下反转一个链表
原地反转链表模式的问题:
- 反转一个子列表(中等)
- 反转每个 K 个元素的子列表(中等)
7. 宽度优先搜索(BFS)
该模式基于宽度优先搜索(BFS)技术,可遍历一个树并使用一个队列来跟踪一个层级的所有节点,之后再跳转到下一个层级。
任何涉及到以逐层级方式遍历树的问题都可以使用这种方法有效解决。
Tree BFS 模式的工作方式是:将根节点推至队列,然后连续迭代知道队列为空。在每次迭代中,我们移除队列头部的节点并「访问」该节点。在移除了队列中的每个节点之后,我们还将其所有子节点插入到队列中。
如何识别 Tree BFS 模式:
- 如果你被要求以逐层级方式遍历(或按层级顺序遍历)一个树
Tree BFS 模式的问题:
- 二叉树层级顺序遍历(简单)
- 之字型遍历(Zigzag Traversal)(中等)
8.深度优先搜索(DFS)
Tree DFS 是基于深度优先搜索(DFS)技术来遍历树。
你可以使用递归(或该迭代方法的技术栈)来在遍历期间保持对所有之前的(父)节点的跟踪。
Tree DFS 模式的工作方式是从树的根部开始,如果这个节点不是一个叶节点,则需要做两件事:
- 1.决定现在是处理当前的节点(pre-order),或是在处理两个子节点之间(in-order),还是在处理两个子节点之后(post-order)
- 2.为当前节点的两个子节点执行两次递归调用以处理它们
如何识别 Tree DFS 模式:
- 如果你被要求用 in-order、pre-order 或 post-order DFS 来遍历一个树
- 如果问题需要搜索其中节点更接近叶节点的东西
Tree DFS 模式的问题:
- 路径数量之和(中等)
- 一个和的所有路径(中等)
9.Two Heaps
在很多问题中,我们要将给定的一组元素分为两部分。
为了求解这个问题,我们感兴趣的是了解一部分的最小元素以及另一部分的最大元素。这一模式是求解这类问题的一种有效方法。
该模式要使用两个堆(heap):一个用于寻找最小元素的 Min Heap 和一个用于寻找最大元素的 Max Heap。
该模式的工作方式是:
先将前一半的数值存储到 Max Heap,这是由于你要寻找前一半中的最大数值。然后再将另一半存储到 Min Heap,因为你要寻找第二半的最小数值。在任何时候,当前数值列表的中间值都可以根据这两个 heap 的顶部元素计算得到。
这个题目,其实在我曾经参加校招的时候,面试雅虎北研就遇到过,幸亏当初我有看到过类似的解法,最终成功解答。
识别 Two Heaps 模式的方法:
- 在优先级队列、调度等场景中有用
- 如果问题说你需要找到一个集合的最小/最大/中间元素
- 有时候可用于具有二叉树数据结构的问题
Two Heaps 模式的问题:
- 查找一个数值流的中间值(中等)
10.子集
很多编程面试问题都涉及到处理给定元素集合的排列和组合。
子集(Subsets)模式描述了一种用于有效处理所有这些问题的宽度优先搜索(BFS)方法。
该模式看起来是这样:
给定一个集合 [1, 5, 3]
- 1. 从一个空集开始:[[]]
- 2.向所有已有子集添加第一个数 (1),从而创造新的子集:[[], [1]]
- 3.向所有已有子集添加第二个数 (5):[[], [1], [5], [1,5]]
- 4.向所有已有子集添加第三个数 (3):[[], [1], [5], [1,5], [3], [1,3], [5,3], [1,5,3]]
下面是这种子集模式的一种视觉表示:
如何识别子集模式:
- 你需要找到给定集合的组合或排列的问题
子集模式的问题:
- 带有重复项的子集(简单)
- 通过改变大小写的字符串排列(中等)
11.经过修改的二叉搜索
只要给定了排序数组、链表或矩阵,并要求寻找一个特定元素,你可以使用的最佳算法就是二叉搜索。