打开网易新闻 查看更多图片

贾艳芳老师,湖南大学与英国杜伦大学联合培养博士,湖南师范大学外国语学院讲师。主要研究领域为:翻译认知过程、人机交互翻译、翻译技术;主讲课程:《翻译技术导论》、《计算机辅助翻译理论与实践》、《英汉汉英笔译实践》等;SSCI、A&HCI、EI及CSSCI检索期刊发表文章10余篇,主持国家社科基金一般项目1项、湖南省社科基金等5项。

01「 这个领域让我眼前一亮」

| 专访记者付娟:贾老师,您好。我是翻译技术教育与研究公众号平台的专访记者付娟,很荣幸能有这个机会与您进行对话。我了解到,在您的博士学习期间,您围绕“翻译认知过程”和“人机交互翻译”做了大量深入的研究。能否分享一下,是什么激发了您对这两个研究方向的深厚兴趣?又是什么驱动力使您深入挖掘这个领域?

贾艳芳老师:我做人机交互翻译前期主要集中在译后编辑的认知过程方面。当初,我在博士研究方向的选择上感到有些迷茫,我对传统翻译研究、翻译产品的开发、以及教学方面的课题等这些领域并没有很感兴趣。之后我积极参加了国内外各种翻译相关的会议,也接触到了一些涉及翻译技术的会议。这时,我注意到在过去的十年,特别是在我开始博士研究的2016年左右,机器翻译和计算机辅助翻译工具的应用已经非常广泛,这激发了我对技术应用方面的浓厚兴趣。

随后,我开始阅读与翻译认知加工过程相关的文献。这些文献研究了我们在翻译过程中的思维和加工方式,以及翻译过程中各种因素的影响,例如原文内容和使用的翻译工具等等。与仅仅研究译文质量不同,这些文献更注重研究我们的认知加工过程。这个领域让我眼前一亮,一是因为它涉及到了实际应用领域,即翻译技术的实际需求;二是它的焦点不仅仅在于译文,更多地关注了我们的思维过程。研究认知加工过程需要借助一些新颖的工具,例如眼动仪和键盘记录软件,而不是传统的方法,如请专家评估译文质量,这也进一步激发了我的兴趣。总结来看主要是三点,最初对这个领域产生兴趣是基于积极地参加了一些相关会议;二是观察到技术的应用已经成为主流;第三是相较于传统的译文质量研究,我自身对认知过程的研究更感兴趣。

02「 三种译后编辑研究类型」

| 专访记者付娟:贾老师,您在翻译技术领域积累了丰富的研究和探索经验,尤其是在机器翻译译后编辑(MTPE)的研究上,您在国内外核心期刊发表了多篇论文。能否分享一下您对MTPE在全球范围内研究进展的看法?

贾艳芳老师:从整体上看这个领域的研究文章可以分为三大类,第一类,也是译后编辑研究领域数量最多的文章,着重探讨译后编辑相对于传统人工翻译在速度和质量方面是否具备明显的优势。因为最初采用译后编辑这一模式的动机在于,希望在保持高质量的前提下提高翻译速度,这也是翻译行业的共同期望。各国、各高校都投入了研究,试图了解机器翻译与译后编辑相比,是否可以实现显著的速度提升,以及其质量如何。这一类研究居多,这其中还会涉及不同的语言对,例如英汉翻译与其他语言对的研究,但结果千差万别,这主要是因为每个研究采用的机器翻译和原文不同。

第二类主要聚焦于译者对于这种新模式的态度,这些研究发现,职业译者普遍对译后编辑持消极态度,认为这种模式降低了译者的价值感。传统翻译被视为一项创造性工作,而译后编辑则更像是对机器翻译错误的重复修正。学生译者相对更容易接受这一模式。

还有一个原因,也算得上第三种类型的研究,译后编辑往往会借助一些软件和平台实现操作,尽管我们通常使用Word文档进行译后编辑,但职业译者通常在计算机辅助翻译软件平台上进行。这带来了一些影响因素,包括软件的可用性、不断的更新以及译者需要学习和购买软件,这些因素可能给译者带来心理和经济压力。归纳起来我觉得大概可以总结为这三类:与传统人工翻译的比较,译者对译后编辑的态度,以及对不同软件和平台的可用性和译者体验的研究。

03「 影响因素本质上并未改变」

| 专访记者付娟:我注意到您2022年在Across Languages and Cultures第23期发表了一篇题为The interaction effect between source text complexity and machine translation quality on the task difficulty of NMT post-editing from English to Chinese: A multi-method study的论文,文章研究探讨了源文本复杂性和机器翻译质量之间的相互作用对神经机器翻译(英译汉)译后编辑任务难度的影响。那么您认为相较于基于统计的机器翻译,神经机器翻译对于译后编辑有哪些影响呢?

贾艳芳老师:这篇文章是在我进行了一系列关于译后编辑的小研究之后,发现了一些问题后展开的研究。关于你提到的基于统计的机器翻译和基于神经网络的机器翻译,它们之间的主要区别在于,由于神经机器翻译的质量现在已经非常高,因此导致一些错误可能隐藏在流畅的译文中,很难被察觉。然而,我认为与基于统计的机器翻译相比,它对译后编辑的影响并没有发生根本性的改变。影响因素仍然包括以下几个方面:首先是机器翻译的质量,其次是原文的复杂性,还有刚刚提到的相关软件。如果软件不易使用,译者也会感到译后编辑任务更加困难,所以根本性的影响因素并没有发生变化。只是神经机器翻译的译文具有自己的特点,其错误类型与基于统计的机器翻译不同,但我认为影响因素本质上并未发生根本性的变化。

04「 我主要考虑的是材料因素」

| 专访记者付娟:您在文中指出,探究影响译后编辑任务难度的因素及其测量方法对于测试译后编辑难度、设计译后编辑培训任务等是非常重要的,请问在研究过程中您主要考虑了哪些影响译后编辑任务难度的因素,以及使用了哪些测量方法呢?

贾艳芳老师:这篇文章当中我主要考虑到的就是材料因素,即源文本的复杂度和机器翻译的质量。没有考察我刚才提到的另外一种因素——软件平台的因素,主要原因是在前期2019年我进行了一系列涉及译后编辑的研究,其中包括文本类型、基于统计的机器翻译和基于神经网络的机器翻译等不同因素的研究。在这些小规模研究中,我发现了一个非常有趣的现象。

通过文献回顾,我发现大多数研究都集中在机器翻译的质量上,即机器翻译的质量如何影响译后编辑的速度和质量。然而,尽管这种类型的研究数量众多,但在研究设计中,很少明确测量所使用的机器翻译的质量,并且缺乏标准的测量方法,我认为这是一个挺严重的问题。但这个问题可能没有第二个问题严重,因为通常情况下,当我们讨论译后编辑研究时,首先考虑的是机器翻译的质量,而忽略了源文本这一因素。但在进行一些前测实验时,我发现源文本实际上具有一定的影响力。我当时思考:即使机器翻译的质量相同,如果源文本的复杂度有很大差异,那么我相信译后编辑的难度应该会有所不同

因此,基于对前人文献的回顾,我认为这是一个研究领域的空白,并且认为这是一个非常有意义的研究点。所以在这篇小研究中,我特别控制了源文本的复杂度,选择了4篇文本,其中两篇具有较高复杂度,两篇具有较低复杂度,它们之间存在显著差异。然后,我将它们分别输入到几个机器翻译引擎中,得到机器翻译结果,找出了最高质量和最低质量的翻译,同样也存在显著差异。这样,我设计了一个2×2的实验模型,共涉及4种译后编辑任务。因此,这篇文章主要考虑了材料因素,即源文本因素和机器翻译因素。我使用的测量方法旨在探究源文本复杂度和机器翻译质量相互作用后对译者主观感知难度、译后编辑整体速度、停顿和眼动过程以及最终译文质量产生的差异影响。

05「 有一些有趣的发现」

|专访记者付娟:您在文章中分别展开讨论了源文本复杂性和机器翻译质量对译后编辑任务难度的影响,那么您认为源文本复杂性和机器翻译质量在神经机器翻译译后编辑任务中有何交互作用呢?

贾艳芳老师:研究的实验结果表明,在实验设计的控制下,源文本的复杂度和机器翻译的质量确实对译后编辑的任务难度产生了相互作用。正如我们预期的那样,机器翻译质量越高,译后编辑的任务难度越低,这反映在译后编辑的速度、主观难度感知以及眼动的认知加工过程上。相反,机器翻译质量越低,译后编辑的任务难度越高,这一点也在之前的技术研究方法中得到了验证。

另一个有趣的发现是机器翻译的作用受到源文本复杂度的影响。具体来说,当机器翻译质量很高时,源文本的复杂度对译后编辑的任务难度影响并不显著,但当机器翻译质量较低时,源文本的影响就显得更加明显。这是因为当机器翻译质量较低时,如果源文本复杂度很高,译者需要不断回读原文,译后编辑过程中涉及到更多的纠错和人工翻译工作,因此耗时较长,整体感知难度也更大。因此,当机器翻译质量较低时,源文本的影响显得非常明显,源文本的复杂度越高,译后编辑的整体任务难度就会明显升高,这就是一些具体的交互作用。

06「 一定要严格控制变量」

|专访记者付娟:您认为这一发现对国内外学界中关于机器翻译译后编辑的研究有何启示?它可能会对翻译市场,甚至是整个语言服务行业产生什么样的影响?

贾艳芳老师:我觉得对做研究的直接启示就是在设计实验时一定要严格控制变量,并且对实验说明要非常清晰明了。比方说你使用的机器翻译质量是什么样的?你是用什么标准测量的?源文本的复杂度有多高?考虑到了这些因素才能设计一个具体的译后编辑任务。因此,未来在进行译后编辑研究时,需要特别清晰地说明这些因素。这样,其他学者在进行译后编辑研究时,才能与你的文章进行有效的比较。否则,可能会出现情况,即尽管几篇文献都在研究机器翻译,但它们使用的机器翻译质量和源文本复杂度并不相同,因此无论是在难度、速度还是认知过程方面,这些译后编辑任务都无法进行有意义的比较。

不过,我也要指出,这篇文章本身是一项探索性研究。我只对源文本的复杂度进行了测量,主要关注可读性、句法、流畅度以及请专家译者评估的预期翻译难度等因素,这是我所定义的复杂度。然而,在未来的研究中,我们还可以深入研究源文本中可能影响复杂度或难度的具体特征,以及如何测量或定义源文本的复杂度。此外,我们也可以探讨哪些变量能够更全面地测量源文本的因素。我认为这是可以进一步研究的方向,上述的启示只是我们迈出的第一步。

此外,对于翻译行业和课堂教学,同样也适用相似的原则。在布置译后编辑任务时,需要考虑给学生设置什么难度的任务。是选择一个相对简单的源文本,配以高质量的机器翻译,还是选择一个难度较高的源文本,搭配较差的机器翻译?这样的任务设置可以更科学,因为我们可以更好地预测译后编辑任务的难度。有时候,即使机器翻译质量较高,如果源文本非常复杂,译后编辑任务的难度也会较大。相反,有时候源文本相对简单,但机器翻译质量较差,译后编辑的难度仍然较大。因此,这两个因素无论是在任务布置还是在翻译市场定价方面,都应该被充分考虑和明确说明,这样才能更加科学和合理地进行研究和业务实践。

07「 ChatGPT很不一样」

|专访记者付娟:我也了解到,您最近对ChatGPT和翻译搜索技术表现出了浓厚的兴趣。您能分享一下,这些技术的学习和应用将如何为您未来的教学实践与研究提供新的方法、新的视角和新的思路吗?

贾艳芳老师:利用ChatGPT进行翻译和常规的译后编辑实际上是截然不同的过程,加上搜索的环节,如果将它们结合在一起来看,你会发现常规的译后编辑也需要进行翻译搜索,而信息搜索的能力直接影响你是否能够有效地改正机器翻译的错误,这对于人工翻译也同样适用。信息搜索的能力决定了你是否能够快速找到相关的背景知识,以生成高质量的翻译。但是ChatGPT很不一样,不管是进行翻译还是译后编辑,它都是以一种人机对话的形式进行的。你需要在对话框中与它互动,因为它是一个标准的智能对话机器人。因此,它与传统搜索方法非常不同,这也引发了我浓厚的兴趣。在我们的课堂上,我们还鼓励学生使用ChatGPT,例如,他们可以向它下达指令,要求它使用某种机器翻译,然后与它进行交互对话,以让它自行检测机器翻译中是否存在错误,还可以询问英文原文的背景信息。然而,这些过程非常依赖于你提供的提示(prompts),以及你的指令是否有效,是否足够具体。如果你能够最大程度地提供有针对性的译后编辑或人工翻译指令,ChatGPT将能够提供丰富的反馈。

因此,相对于传统的译后编辑或人工翻译中的信息搜索,这两者所使用的技能和方法都非常不同。当然,将ChatGPT应用于翻译领域仍然是一个崭新的研究方向。因此,我认为我们可以进行一系列实证研究,深入探讨ChatGPT在翻译领域的应用,包括翻译实践和译后编辑实践等方面。我们可以详细研究译者对其接受度的情况,以及如何通过与ChatGPT的交互对话来更有效地完成人工翻译或译后编辑工作。我认为这些都值得进一步探索和研究。

专访记者:付娟

推送编辑:付娟