翻译记忆
电脑程序软件的数据库
翻译记忆(亦称翻译内存、翻译记忆库,translation memory,缩写为TM)是电脑程序软件的数据库,用来辅助人工翻译。有些使用翻译记忆库的软件也常被称为 TMM (Translation Memory Managers)。
原理介绍
翻译记忆(TM)的原理其实非常简单。由于专业翻译领域所涉及的翻译资料数量巨大,而范围相对狭窄,集中于某个或某几个专业,如政治、经济军事航天计算机通讯等专业都有自己的专业翻译公司或部门。这就必然带来翻译资料的不同程度的重复。据统计,在不同行业和部门,这种资料的重复率达到20%~70%不等。这就意味着译者至少有20%以上的工作是无谓的重复劳动。翻译记忆技术就是从这里着手,首先致力于消除译者的重复劳动,从而提高工作效率。
翻译记忆库多见于电脑辅助翻译工具、文字编辑程序、专用术语管理系统(Terminology Management Systems)、多语辞典、甚至是纯机器翻译的输出之中。
一个翻译记忆单元包含了来源语言的文字区段以及其翻译。这些区段可以是文字区块、章节、一句或是数句文句、或是词语。个别的字词被视为专用术语来处理,一般而言不在翻译记忆的领域之中(即使翻译记忆库依旧可以包含单一字词为其翻译记忆单元)。研究显示市场上已有很多公司所建立的多语言文件使用了翻译记忆库的技术来辅助。
翻译记忆库
译者首先提供一段来源文字(亦即要拿来被翻译的文字)给翻译记忆库,程式会先分析这段文字,试着在数据库里找寻既有的翻译区段是否与过去曾经翻译过的文字相符。如果找到相符的旧有翻译(legacy translation pairs),则会呈现出来给译者检阅。译者可以选择接受旧有的翻译、拒绝、或是加以修改。若加以修改,则修改的版本也会被记录并存进数据库里。
某些翻译记忆库系统只会搜寻 100% 相符的文字,也就是说这只会将新的来源文字与数据库内做精确的比对,只有完全相符的资料才会被提出。也有其他的系统会使用模糊比对原理来找寻相似的区段,并且会用特别的标记呈现给译者使其易于辨认。有一点很重要的是一般的翻译记忆系统只会从其数据库里搜寻来源语言。
完全无相似(no match)的文字区段将必须由译者手动的翻译。这些新翻译的文字区段会被存进数据库里,则未来的翻译将有可能因为来源文字重复出现而可以马上被采用。
翻译记忆库在文章字词重复相当高的情况之下将可运作的相当好,例如一些技术文件或是手册。翻译记忆库对于翻译一个从过去既有文件逐步增修的状况来说也很有帮助。一般而言,翻译记忆库在文学或是创意文件里不会被考虑采用,主要是因为这些类型的文章其重复性相当低。然而,也有人认为这些重复性极低的文字仍就值得加以蒐集,例如在用语索引(concordance)的搜寻时便可派上用场。其他蒐集翻译记忆库的帮助也可在品质验证和校阅时有所帮助(利用翻译记忆库,可以很简单的将来源语言与目标语言汇出,使其每行一对,并且以 tab 分隔来源与目标,便于确认有无未翻文字,或是使译者便于校阅)。
当翻译记忆库被持续的使用在适当的文字上一段时间之后,其将可为译者省下不少的工作量。
主要优势
翻译记忆针对技术文件或是具有特定词汇的文章来说是最合适的。其优势包含:
1、确保文件完整的被翻译(翻译记忆不接受记忆区段里的目标语言无资料)
2、确保翻译文件的一致性,包含通用定义、语法或措词、以及专用术语。这针对多个译者同时在翻译一个专案或文件时相当重要。
3、使译者不须自行处理众多不同档案格式的档案,仅需面对翻译记忆库软件提供的界面或是单一的档案格式便可进行翻译。 4、加速整体翻译的速度,即翻译记忆库已“记忆”先前已翻译过的素材,译者针对重复的文字仅需翻译一次。
5、降低长时间的翻译专案的开销;以使用手册为例,警告讯息这类大量重复的文字仅需被翻译一次,便重复被使用。
6、针对大型文件的专案而言,即使在首次翻译时翻译记忆库的使用效益并不明显,但当进行该专案的衍生专案(例如文件的修订版)时,翻译记忆库的使用便可大幅节省翻译的时间与金钱。
主要障碍
使用翻译记忆所面临主要的困难与缺点包含如下:
“翻译记忆”的概念是基于:文句过去的翻译可以被“回收再利用”。然而,翻译的其中一个原则是,译者必须翻译文字所要表达的信息(即意译),而不是翻译片段的句子。(常见翻译记忆的使用皆是以一句作为一个翻译单元(Translation Unit)或翻译区间(Translation Segment),使得翻译具有前后文关系的文件时容易变成是单独翻译多个句子后再加以组合)。
翻译记忆软件并不是很容易的可以套用至既有的翻译或是本土化(Localization)的流程之中。为了要使翻译记忆的使用能够有更大的效益,翻译流程必须被重新规划。
翻译记忆软件并不支持所有的文件格式,可用的文件过滤器不见得支持所有的档案类型。
使用翻译记忆软件有其学习曲线必须克服,此外,软件本身尚须被客制化以发挥最大效益。
若部份的翻译流程,被外包给不在公司的自由译员(Freelance Translator),这些译者必须拥有特定的软件,可以开启由翻译记忆软件所产生的档案格式,才能进行翻译。
具备完整功能的翻译记忆软件价格不菲,其可视为一项值得考虑的投资。当然,有些程序开发者也制作免费或相当低价的所谓的译者版给单一的译者,使其可以开启由完整版所建立的档案以进行翻译。
要将使用者过去的翻译导入翻译记忆库里,以及相关的教育训练等所带来的开销,也变成一种值得考虑的投资。
维护翻译记忆库,在多数的例子里,仍旧需要不少人工的步骤,而不当的维护将导致 TM 相符度的显著降低,其可用性与品质也相对受到影响。
如同前述,翻译记忆软件不见得适用于字词或文句很少有重复的文件类型,或是在历次修订版中不会包含部份更新的状况。技术文件通常最适合使用翻译记忆,然而市场行销或是创意文句并不适合。
翻译记忆库里所储存的记录并不保证正确;如果某一特定区段的翻译并不正确,则这不正确的翻译将会在下一次相同或近似的来源文字里再次被回收使用,这导致问题将会持续存在。
TMM功能编辑
以下说明翻译记忆的主要功能
离线功能
线上功能
辅助翻译软件
SDL Trados是世界上最流行的计算机辅助翻译(CAT) 软件,在全球拥有13万多客户,全球500强企业有超过90%的公司都在使用SDL Trados来为日常的本地化翻译工作服务,SDL Trados为他们克服了在不同国家地区的文化、语言障碍,从而为他们的全球化铺平了发展道路。因为SDL Trados用户通常能够将完成工作的速度提高50%左右(具体数值依不同文档,项目会有变化),更准确地评估时间和成本,显著减少翻译错误,编写更为一致的翻译(对技术、法律和医学翻译来说,这一点尤其重要)。
SDL Trados Translation Memory(以下简称TM)能够建立以前翻译内容的语言数据库,并确定可重复使用的内容。在使用本软件工作时,它将自动提出建议的可重复使用内容,因此相同的句子无需再次进行翻译。无需进行新的翻译(从字面上,“SDL Trados 加快了新产品的全球发布”),SDL Trados 能够应用人工智能,提出建议的最匹配翻译,以便重复使用。即使不存在完全匹配,SDL Trados 也能使翻译人员再次避免不必要的重复工作。
SDL Trados TM 可以使某位翻译人员处理新内容,其他翻译人员处理不完全匹配的新文本。SDL Trados TM Server可以共享在线翻译记忆库并利用其他翻译人员的工作成果。同时可以利用熟知的Microsoft Word 界面和工具与数以千计装备有SDL Trados 的翻译人员、翻译公司和企业一同工作。
您使用SDL Trados的时间越长,您的库存储内容就越多,因此效率就会越高。一段时间之后,SDL Trados TM将稳定减少新进工作中一定量的抓取需要翻译的内容。这将显著提高翻译速度和准确性。
SDL Trados TM 可在网络的内部和外部环境协同使用。所以在世界的每一个客户用户都可以借助全部的术语库进行工作。翻译可以在线的获取所有的翻译资源,无论SDL Trados用户是通过互联网还是实时分享中央术语库的资源。
辅助翻译系统
Transmate辅助翻译软件系统,包括Transmate辅助翻译软件单机板、Transmate辅助翻译软件网络板、Transmate辅助翻译项目管理软件以及Transmate辅助翻译软件教学实验室。Transmate可供各地语言专家组成的翻译团队同时进行一个稿件或一个项目下的多个稿件实施翻译、校对工作
Transmate系统采用先进的翻译记忆技术,自动记忆用户的翻译结果,相同的句子、片段只需翻译一次。翻译过程中,系统通过独创的搜索引擎技术,瞬间查找记忆库,对需要翻译的内容进行快速分析、对比,对于相同的句子无需翻译第二遍。历史素材的重复利用,不但提高了翻译效率,而且达到了翻译结果的准确和统一,同时还降低了成本、节省时间。 相似的句子、片段系统自动给出翻译建议和参考译例,用户只需稍加修改即可完成翻译过程,甚至可选择自动匹配替换,直接得到翻译结果,避免重复性劳动,提高工作效率.
用户所翻译过的所有文字(包括原文和译文)均会保存到记忆库之中,当翻译工作继续进行的时候,Transmate将会自动地根据模糊匹配的原理将记忆库中的资料与当前的翻译工作内容相比较,自动提示最佳翻译匹配,并保证翻译中的一致性。
参考资料
Transmate翻译软件网络版.Transmate官方网站.
最新修订时间:2023-11-29 10:00
目录
概述
原理介绍
参考资料