作为非英语国家的人,在学习的时候总会遇到很多前人留下的翻译,一个体会就是在学习的时候要努力把这些词汇翻译成自己能够理解的语言,因为如果不能深刻的理解一个概念,就很有效的用它进行思考。在此基础上如果仍然感到理解困难,则可以尝试去查找对应的英文原文,很可能它会直截了当的告诉你当初的命名者对于这个术语如此命名的初衷和思考在哪里。
先举一个不那么常见但很有代表性的例子,如果你接触过机器学习的模型评估方面的内容,很可能见过一个奇妙的术语:鲁棒性,你可能想不到这个土到土星的翻译,对应的英文单词居然是 Robust,这个单词常见的翻译是“健壮”,因此在模型评估的语境中更现代化的翻译应该是“稳健性”。这个“鲁棒”不是一根棒子,也跟鲁班没有关系,而是一个特定时期下英文水平集体欠佳时的习惯性音译。
接下来我们看一个线性代数的例子:在很多线性代数教材中,一上来就会介绍一个概念叫“行列式”,这个翻译乍看起来没有任何问题,因为它表面上看起来就是把一张行列状的数表放在两条竖线里,进而教材还会直接给你一个异常奇怪的计算方法,好像你只要记住这个计算规则就可以了!如果你也足够的好奇,并和我一样相信欣赏数学之美的关键在于理解而不是记忆,决定不糊里糊涂的接受这个概念,就会发现这个行列式的英文单词是 Determinant,源于 Determine 这个词,后者翻译为“决定”,这是否暗示我们的“行列式”是被某个东西决定的呢?如果你有这个直觉,那么值得为自己骄傲!因为行列式的值实际上就是使用相应的矩阵进行线性变换后对于标准基下的单位面积的一个缩放比例,因此行列式就是被对应的矩阵所“决定”的。
刚刚提到线性代数中的基 basis,我们日常接触到的大多数的矩阵和向量如不特殊指明,其数值表示都来自于其在标准基 naive basis 下的坐标,这个 naive 的英文原意为“未经改变的,初始的”,也就意味着我们默认将以形如 [1, 0, ... , 0], ... , [0, 0, ... , 1] 这样的一个方阵来作为标准,用它来衡量其他的一切矩阵和向量的坐标,其他的基都是通过矩阵对于这个标准基施加线性变换而得来的,也就是经过改变的基。进一步地,对应上面的标准基构成的矩阵还有一个英文单词,叫做 identity matrix,也即它就是一切其他矩阵的身份识别矩阵。
和基相关的另一个概念是“张成的空间”,用以描述一组基的所有线性组合构成的向量集合。我在最初学习的时候看到书上这个翻译就非常难以理解,后来查看原版书籍才恍然大悟,其对应的英文单词就是 span 这个词,其更为常用的翻译为“范围”,而张成的空间也就是以一组向量为出发点,对其穷尽所有可能的线性组合所能覆盖到的向量的范围。对应 span 的一个更为具体的例子是机械手的各个关节的转动和移动最终使得执行机构的工作空间在某个范围内,对应这个范围就是 span。
继续线性代数的例子,在了解了基是可变的这一事实的基础上,我们会遇到相似矩阵,两个互为相似矩阵的关系的其实质是同一个线性变换在不同基下的坐标表示。在线性代数中所见到的相似矩阵的定义:P-1AP = B ,这其中默认隐含 A 与 B 的坐标是基于标准基的。式中矩阵 P 对应的英文单词是 Permutation,翻译为“置换”,实际上 P 就是在不同基之间执行切换的置换矩阵,并且实现基的置换的方法就是通过 P 左乘想要置换基的矩阵和向量即可,这实际是矩阵左乘实现线性变换的一个特殊实例。
相似矩阵的另一个应用是本征分解 Eigendecomposition,其含义是对于任何实对称矩阵来说本征值都是实数,且都可以通过本征分解展开成 A = QΛQT= QΛQ-1,其中 Q 为标准正交矩阵,做这个矩阵分解的目的是作为一个相似关系,我们用矩阵 A 施加线性变换的结果和采用这个更简洁的对角阵的结果是一样的,所以如果我们有更加简洁的形式便于操作,何乐而不为呢?这里我想说的是对于这个公式中的 Q,因为其是一个标准正交矩阵,对应的英文单词是 Orthognormal matrix,但这里为何符号用的是 Q 而不是 O 呢?我一直查了很久最终才从别人那里获知矩阵 Q 对应的英文单词是 Quadrature,同样翻译为正交,对应 QR 分解里的 Q 也是这个单词。在知道了这个翻译之后,对于记忆这两个矩阵分解对分解后的矩阵的形式要求是不是就容易了呢?
再举一个微积分中的例子,我不知道有多少人在接触“导数”这个词的时候立即就对其有直觉的理解,实际上其英文单词为 derivative,常翻译为“衍生的”,而导数就是从原函数衍生出来的不是吗?相对应的,在描述自变量或因变量的一个微小变动时我们又回见到一个术语叫做“差分”,其对应的英文单词其实就是 difference,实际上就是“差异”而已,在理解了这些概念之后,其对应的运算也就一清二楚了。
在统计学中,被研究的对象的所有可能的结果的集合称为总体 Population,之所以采用这个词是因为正是人口普查 census 催生了现代统计学的很多研究结果,所以总体这个英文单词最常用的翻译是“人口”。同样地,统计中“均值”这个指标是如此重要以至于它已经融入到我们的日常表达中,我们常说某个事情的平均水平是某个值,就代表如果从样本集中获取一个样本,可以预期其取值应该在平均水平附近,因此在统计学中均值也被称为期望 Expectation。在统计中将样本点做频数统计后,频数最高的那个数就称为众数 Mode,这个数值反映了一种取值的倾向性,对应的在英文中用的是 Mode,而这个英文单词比较令人熟知的翻译是“趋势”。
不只是数学,在编程学习中的文本查询和处理中会遇到“正则表达式”这个让很多人听而生畏的词,对应的英文单词是 Regular Expression,实际上它的目的就是通过一些标准化的符号来概括性的表达一些常用的文字表述,并以此辅助字符串的查询和匹配,因此并不是一个很难的数学公式或者其他形式,这个词我自己的翻译版本就是“常用表达方式”或者“常规表达方式”。
与此类似的是在机器学习中,为了增强模型的泛化能力而减少方差,会使用一种听起来非常拗口技术叫做“正则化”,对应的英文单词为 regularization,这个技术是在模型预测结果的成本函数中不仅考虑误差的绝对值大小,还将模型的复杂度作为一个评价指标,进而利用“范数”这个工具对参数的获取过程施加一定的影响而使得最终的模型参数更加的“规范和寻常”,不容易受到输入中的异常因素的影响而反应过激,所以我个人头脑中的翻译是“规范化”。
上面这些单词只是日常遇到的很多例子中的几个,实际上的例子比这个要多很多。如果你是一个对自己负责的学习者,对于新的概念稍微多做几分思考,对于学习绝对会大有裨益。你当然可以不喜欢我自己的翻译,更重要的是:你要有自己理解和翻译。那些创造这些概念的先贤们也一定经历了很多苦思才选定了相应的单词,而我们不能因为一些不恰当的翻译而丢掉那些贤者们赐予我们的智慧。所以如果可能,尽量去阅读原版的英文教材,你会看到另外一个世界。
Happy Learning!