Skip to main content

翻译错误类型:MQM和ISO 5060分类完整指南

elena-volkova2025/1/105 min read
翻译错误错误分类mqm质量评估lqaiso-5060

做翻译质量评估,第一件事就是搞清楚翻译错误有哪些类型。不管你是QA经理、译员还是本地化工程师,能准确识别和分类错误,才能保证评估标准统一、反馈有针对性、质量真正能提升。

这篇指南覆盖了基于MQM(多维质量指标)和ISO 5060:2024标准的完整错误分类体系。这两套框架是目前全球用得最广的。

为什么要搞标准化的错误分类

你可能觉得"错了就是错了,有什么好分类的"。但实际操作中,没有统一标准会出问题:

好处具体表现
一致性不同评估员按同一套标准打分
可操作译员确切知道该改什么
可量化质量分数有实际意义
培训从错误模式里发现技能短板
自动化AI工具能针对特定错误类型做检测

没有标准的话,审核员A说"这有问题",审核员B可能觉得"这算可接受的变体"。分类体系就是用来消除这种模糊的。

MQM错误分类体系

**多维质量指标(MQM)**框架现在已经写进了ISO 5060:2024标准,把错误按层级分类。顶层一共7大类:

MQM错误层级 ├── 准确性 (Accuracy) ├── 流畅性 (Fluency) ├── 术语 (Terminology) ├── 风格 (Style) ├── 区域规范 (Locale Convention) ├── 真实性 (Verity) └── 设计 (Design) 

一个一个来看。

1. 准确性错误 (Accuracy)

准确性错误是指翻译没能忠实传达原文的意思。这类错误通常最严重——信息传错了,后果可能不只是"读着别扭"。

1.1 误译 (Mistranslation)

翻译传达了跟原文不同的意思。

例子:

原文 (EN): "The product is not available in your region." 译文 (ZH): "该产品在您的地区可用。" 错误: "not available" → "可用" (意思反了) 严重程度: 重大 

误译有几个层次:

  • 完全误译:意思彻底搞反或搞错
  • 部分误译:一部分意思跑偏了
  • 细微误译:有微妙的含义差异

1.2 遗漏 (Omission)

原文里有的信息,翻译里没了。

例子:

原文 (EN): "Click Save to confirm your changes and exit." 译文 (ZH): "点击保存以确认您的更改。" 错误: "and exit" 漏掉了 严重程度: 轻微(如果UI不受影响)或重大(如果是关键指令) 

1.3 添加 (Addition)

翻译里多出了原文没有的内容。

例子:

原文 (EN): "Enter your password." 译文 (ZH): "请输入您的安全密码。" 错误: "安全"是加上去的——原文里没这个词 严重程度: 轻微(除非改变了意思或产生法律风险) 

1.4 未翻译 (Untranslated)

原文直接留在了译文里。

例子:

原文 (EN): "Welcome to the Dashboard" 译文 (ZH): "Welcome to the 仪表板" 错误: "Welcome to the" 没翻 严重程度: 重大 

1.5 过度翻译 (Over-Translation)

应该保留原文的地方反而翻了。

例子:

原文 (EN): "Click the OK button." 译文 (ZH): "点击确定按钮。" 错误: "OK" 在很多UI场景下应该保留 严重程度: 轻微 

2. 流畅性错误 (Fluency)

流畅性错误看的是目标语言本身读起来通不通顺、自不自然,跟原文无关。翻译可能意思完全正确,但读起来别扭,那就是流畅性的问题。

2.1 语法

目标语言的语法出了错。

例子:

译文 (ZH): "数据正在被处理中。" 错误: "被处理中" 语法冗余,应该是 "正在处理" 严重程度: 轻微 

常见的语法问题包括:主谓搭配、时态一致性、量词使用、代词指代、介词搭配。

2.2 拼写

错别字。

例子:

译文 (ZH): "您的帐户已更新。" 错误: 规范写法是"账户"不是"帐户" 严重程度: 轻微 

2.3 标点

标点符号用错了。

例子:

译文 (ZH): "点击这里,继续操作" 错误: 该用中文逗号","不是英文逗号"," 严重程度: 轻微 

2.4 排版

字符显示、间距、格式方面的问题。

例子:

译文 (ZH): "版权所有 © 2025." 错误: 中文句号应该是"。"不是英文句号"." 严重程度: 轻微 

还包括:引号类型不对、间距有问题、字符编码错误、大小写混乱。

2.5 无法理解 (Unintelligible)

语言错误严重到读不懂。

例子:

译文 (ZH): "系统为访问拒绝已被有。" 错误: 完全混乱——大概率是MT出了故障 严重程度: 严重 

3. 术语错误 (Terminology)

术语错误是领域专有词汇或标准化术语用得不对。

3.1 错误术语

概念对应的术语选错了。

例子:

原文 (EN): "RAM (Random Access Memory)" 译文 (ZH): "随机存取存储器(随机访问内存)" 错误: 括号内应使用标准缩写或保留英文 严重程度: 轻微到重大(看领域) 

3.2 术语不一致

同一个术语在同一篇文档里翻法不同。

例子:

第12段: "Dashboard" → "仪表板" 第45段: "Dashboard" → "控制面板" 错误: 核心UI术语前后不一致 严重程度: 轻微 

这种问题特别烦人——用户会以为这是两个不同的东西。

3.3 未批准术语

用了项目术语表里没批准的术语。

例子:

术语表规定: "Server" → "服务器" 译文用了: "伺服器" 错误: 用了台湾地区的叫法,但项目要求简体中文术语 严重程度: 轻微(除非客户明确要求) 

4. 风格错误 (Style)

风格错误是翻译在语域、语气或文风上跟要求不符。

4.1 语域

正式程度不对。

例子:

风格指南要求: 使用正式的"您" 译文 (ZH): "你可以在这里更改密码。" 错误: 用了"你"而不是"您" 严重程度: 重大(品牌调性出了问题) 

4.2 不地道

语法没毛病但听着不像中文。

例子:

原文 (EN): "It's raining cats and dogs." 译文 (ZH): "正在下猫和狗。" 错误: 英文习语直译——应该用"倾盆大雨"之类的中文表达 严重程度: 轻微 

这种"翻译腔"在新手译员和MT输出里很常见。

4.3 风格不一致

同一篇文档里风格忽高忽低。

例子:

第一段: 正儿八经的技术写作 第二段: 突然变成聊天的语气 错误: 文档内风格不统一 严重程度: 轻微 

5. 区域规范错误 (Locale Convention)

区域规范错误是内容没有正确适配目标地区的习惯。

5.1 日期/时间格式

例子:

原文 (US): "12/25/2025" 译文 (ZH): "12/25/2025" 错误: 中文应该写 "2025年12月25日" 严重程度: 轻微到重大(可能造成混淆——12月25日还是25月12日?) 

5.2 数字格式

例子:

原文 (US): "1,234.56" 译文 (ZH): "1,234.56" 错误: 中文环境下可以接受,但大数字要考虑用 "1234.56" 或 "1,234.56" 严重程度: 轻微 

5.3 货币

例子:

原文 (US): "$99.99" 译文 (ZH): "$99.99" 错误: 该考虑改成 "¥99.99" 或至少标明是美元 严重程度: 重大(直接影响用户的购买判断) 

5.4 度量单位

例子:

原文 (US): "10 miles" 译文 (ZH): "10英里" 错误: 对中国读者来说应该转换成 "16公里" 严重程度: 看上下文——旅游指南里是重大,文学翻译里可能是轻微 

5.5 地址/电话格式

例子:

原文 (US): "(555) 123-4567" 译文 (ZH): "(555) 123-4567" 错误: 应该用国际格式 +1 555 123-4567 或适配本地风格 严重程度: 轻微 

6. 真实性错误 (Verity)

真实性错误是事实信息不对,跟原文翻得准不准没关系。

6.1 事实错误

译文里有客观错误的信息。

例子:

译文 (ZH): "珠穆朗玛峰,世界最高峰,海拔8,849米..." 如果原文高度就是错的:即便翻译跟原文一致,也该标记 严重程度: 重大到严重(看影响面) 

6.2 法律/合规

内容违反了目标市场的法律或监管要求。

例子:

译文 (ZH): "本产品可以治愈癌症。" 错误: 在中国这种医疗声明可能违反广告法 严重程度: 严重 

7. 设计错误 (Design)

设计错误是翻译在最终产品里造成了视觉或功能问题。

7.1 截断

文本被截断了。

例子:

UI按钮: [保存更...] 错误: "保存更改" 被截掉了——按钮太小 严重程度: 重大 

7.2 重叠

文本跟其他元素叠在一起。

例子:

标签文本延伸到了旁边的字段或图片上 错误: 没考虑到翻译后文本变长 严重程度: 重大 

7.3 编码

字符编码出问题导致乱码。

例子:

显示: "咖啡厅" 显示为 "咖啡厅" 错误: UTF-8编码问题 严重程度: 重大 

严重程度怎么定

每个错误都要标一个严重程度,决定它对质量分数的影响有多大。

严重 (Severity 1)

必须马上改的错误:

  • 安全风险(药物剂量翻错)
  • 法律责任(合规条款有误)
  • 含义完全反了
  • 冒犯性或文化不当的内容
  • 导致系统出问题的错误

**扣分:**25分(ISO 5060默认值)

重大 (Severity 2)

明显影响质量的错误:

  • 意思变了,影响读者理解
  • 关键信息缺失
  • 明显的流畅性问题
  • 品牌调性出了偏差
  • 功能受影响

**扣分:**5分(ISO 5060默认值)

轻微 (Severity 3)

影响有限的小问题:

  • 小的流畅性瑕疵
  • 轻微的风格偏差
  • 不太关键的术语不一致
  • 不显眼位置的格式问题

**扣分:**1分(ISO 5060默认值)

质量分数怎么算

用MQM的评分方式:

质量分数 = 100 - (扣分总数 / 字数 × 100) 

算个例子:

  • 文档:1,000字
  • 发现错误:1个严重、2个重大、5个轻微
  • 扣分:(1 × 25) + (2 × 5) + (5 × 1) = 40分
  • 分数:100 - (40 / 1000 × 100) = 100 - 4 = 96

分数对照表

质量级别分数范围什么意思
优秀98-100可以直接发布
良好95-97小改一下就行
可接受90-94需要认真编辑
较差低于90要大改或重译

不同内容类型的常见错误模式

这部分挺有意思——不同类型的内容,出问题的地方完全不一样。

营销内容

  1. 风格/语域 (37%)
  2. 术语不一致 (24%)
  3. 不地道表达 (19%)
  4. 区域规范 (12%)
  5. 准确性 (8%)

营销内容最大的坑不是翻错,而是翻出来没感觉。

技术文档

  1. 术语 (42%)
  2. 准确性 - 遗漏 (21%)
  3. 不一致 (18%)
  4. 流畅性 - 语法 (11%)
  5. 区域规范 (8%)

技术文档里术语问题占了四成多,这就是为什么术语库对技术翻译特别重要。

法律内容

  1. 准确性 - 误译 (35%)
  2. 术语 (30%)
  3. 遗漏 (20%)
  4. 真实性 - 合规 (10%)
  5. 风格 (5%)

法律翻译里准确性排第一,翻错一个词可能就是一场官司。

软件UI

  1. 截断/设计 (28%)
  2. 术语不一致 (25%)
  3. 区域规范 (22%)
  4. 未翻译字符串 (15%)
  5. 准确性 (10%)

UI翻译最常见的问题竟然是截断——翻译后文字变长,按钮放不下了。

错误分类的实操建议

1. 用标准框架,别自己发明

采用MQM或ISO 5060的分类法,别自创一套。好处是:

  • 行业通用,报告别人看得懂
  • 项目之间可以横向比较
  • 跟工具兼容

2. 根据项目自定义严重程度

MQM的类别是通用的,但严重程度要根据你的项目来定:

project_guidelines:critical_conditions:-安全警告中的任何错误-法律声明误译-品牌名称错误major_conditions:-功能描述中意思变了-行动号召文本漏了minor_conditions:-风格偏好偏差-非关键位置的格式问题

3. 评估员要校准

正式开工前先做校准:

  • 几个评估员评同一份内容
  • 比较结果,讨论分歧
  • 根据讨论结果更新指南
  • 把校准决定记下来,以后用

4. 建一个错误示例库

错误类型原文译文正确翻译严重程度
误译"Disable feature""启用功能""禁用功能"重大
遗漏"Click Save and Exit""点击保存""点击保存并退出"轻微

有了例子,新评估员上手更快,老评估员判断也更一致。

5. 类别数量要适度

MQM有100多个子类型,但大多数项目用20到30个就够了。我建议这样开始:

  • 7个顶级类别先用上
  • 加上你的内容类型里最常见的10到15个子类别
  • 碰到新的错误模式再按需扩展

AI检测错误能做到什么程度

现在的AI LQA工具对不同错误类型的检测准确率差别很大:

错误类型AI检测准确率(2025)
拼写99%+
语法95%+
术语(有术语表)90%+
格式/区域95%+
误译85-90%
风格75-85%
遗漏85-90%
不地道70-80%

拼写和语法这种规则明确的,AI已经做得非常好了。但"不地道"这种需要语感的判断,AI还差点火候。最靠谱的用法是:AI做初筛,人工做验证。如果你有领域术语表和风格指南,AI的表现会好很多。

FAQ

最常见的翻译错误类型是什么?

看内容类型。技术内容里,术语错误最常见(40%以上)。营销内容里,风格和语域问题占大头(35%以上)。法律内容里,准确性错误是头号问题(35%以上)。流畅性错误(语法、拼写、标点)在所有内容类型里都有,但通常算轻微。

LQA该用多少个错误类别?

从MQM的7个顶级类别开始,然后根据你的内容类型扩展到15到25个子类别。太少会丢失有用信息,太多会让评估员之间判断不一致。ISO 5060推荐的也是这个思路。

重大错误和轻微错误怎么区分?

重大错误会让读者停下来——困惑、误解、或者获得错误信息。轻微错误虽然能注意到,但不妨碍理解——有错误但意思还是传达到了。严重错误则是可能带来安全、法律或严重功能风险的,得立刻改。

同一个错误在不同项目里可以有不同的严重程度吗?

可以,而且这很正常。术语不一致在内部文档里可能只是轻微问题,但在面向客户的产品UI里就变成了重大问题。项目指南里应该根据内容的重要性、受众和风险来具体定义严重程度标准。所以校准和文档化真的很重要。

一个错误同时属于多个类别怎么办?

选影响最根本的那个类别。比如把"您"(正式)翻成"你"(非正式),可以算风格(语域不对)也可以算准确性(正式场景下含义有差异)。如果原文明确要求正式称呼,那就归到风格/语域——因为这才是根本原因。每个错误只计一次,避免扣分翻倍。

准备在你的工作流程里用上标准化的错误分类?试用KTTC,体验AI驱动的LQA,支持完整的MQM错误分类和ISO 5060标准。

We use cookies to improve your experience. Learn more in our Cookie Policy.