用导图读论文|计算机翻译辅助技术在同传中的应用及对同传生态系统的影响
随着技术的发展,翻译活动中语音识别、机器翻译等翻译辅助技术的使用变得普遍,然而,在技术辅助的同传、技术对同传活动参与各方的影响方面,学界研究较少。本研究依据笔者的实践经验、现场观察、访谈、搭档译员的反馈,探讨技术辅助的同传的现状及对参与同传活动的各方带来的影响,以期为同传生态系统的重构、翻译行业的发展提供参考。
随着信息技术和人工智能的发展,语音识别、基于神经网络的机器翻译、在线翻译等技术在翻译中广泛应用,翻译界和人工智能界对其进行了广泛研究。既往国内研究主要关注机器翻译和翻译记忆,特别是其在笔译中的应用过程和结果(吕立松、穆雷, 2007:35-43)。近年来,国内学者(王华树、 张静,2015:25-32;郭 静,2017:80-83)提出计算机辅助口译(Computer Aided Interpretation, CAI)的新概念,报告了部分工具和软件的使用方法(王晓,2015)、语音识别技术在交替传译中的运用、模拟交替传译场景下语音识别准确度及对口译学生传译质量的影响(郑川乐,2014;沈旦,2014;朱志强,2015;李函奕,2016)、基于语音识别技术的同声传译教学模式(李霄垅、王梦婕,2018:12-18)。
然而,对这些技术在同声传译(后简称 “同传”)中的运用现状、存在问题及对“同传生态系统”的影响研究阙如。翻译生态学理论(许建中,2009)认为,译者和翻译作品乃至参与翻译活动的各个主体,都处在生态选择和适应的过程之中,适者生存法则同样适用于翻译界。技术的进入会给现有同传生态系统带来何种影响?如何客观看待和应对技术的引入?这些问题亟待回答。
笔者具有 13 年同传实践经验,同时在高校担任医学口笔译教师。在2017、2018年,笔者完成了两场综合使用各种技术辅助的医学国际会议同传,会后,对同传工作组织方和听众进行了非结构式访谈,并邀请搭档译员撰写了实践反馈。本文是笔者对技术辅助同传实践的总结与反思及其对同传生态系统影响的思考,希望可以为译员、同传受众、讲者、技术提供方、会议主办方、翻译公司及翻译技术研发企业带来一些启发。
本部分分译前准备和现场翻译两个阶段介绍计算机辅助翻译技术(后简称“技术”) 在同传中的应用及存在的主要问题。
在现场翻译活动开始前,可进行技术辅助的多模态译前准备。使用的技术包括在线翻译、机器翻译、语音生成等,使用的工具包括有道翻译、百度翻译、SDL Studio 17、 Microsoft Edge 浏览器等。
国际会议讲者中,部分讲者口音较重, 如非英语母语讲者及印度、新加坡等英语母语国家讲者,往往听辨困难。而讲者幻灯片往往涵盖了讲话主要内容,译前利用在线翻译和机器翻译软件对幻灯片进行自动翻译, 可提高准备的效率、深度和广度。
在使用 SDL Studio 17 自动翻译过程中, 可选择使用谷歌翻译、百度翻译、搜狗翻译 等多个自动翻译引擎进行自动翻译,并可选择在线或本地翻译记忆库,保存翻译结果以备今后调用。此外,还可在 SDL Studio 17中,快速添加多语对照新术语,术语整理完毕后,可将自动生成的按字母顺序排列的术语表导出,方便背诵和查找。
笔者参与的医学会议同传涉及大量医学知识和术语,短时间学习记忆难度较大,为此,笔者按讲者信息及讲话主题,查阅了相关学术论文,并在“多模态口译译前准备” 理念指导下,观看了国内外视频网站上相关主题演讲、课堂教学录像和手术录像,对知识点、词汇、表达、句型进行了系统性总结。
笔者还使用了Microsoft Edge浏览器和百度翻译自带的朗读功能,将部分中、英文 文字输入浏览器,看文字,听朗读,以激活大脑中存储的相关主题内容的音、形、意三模态信号。笔者发现,包括术语在内的大部分单词发音都十分清晰,经《湘雅英汉医学词典》和《中山医学词典》验证,大部分单词发音都十分规范。此外,也可在有道词典在线查找术语译法及发音。
在语音识别技术提供厂商的要求下,笔者为会议制作了双语对照词汇表,并发送给厂商,由厂商录入识别系统后台。据厂商介绍,这样可以提高现场识别准确率。此外, 厂商在会前模拟正式会议音响效果及背景噪音,测试了该系统现场术语语音识别准确度,以确保正式会议中,不因现场声学因素影响识别效果。
在多模态译前准备中,笔者发现了影响准备效果的一些问题,具体包括:一、由于SDL Studio 17对pdf文档的识别精准度欠佳,造成不少的机器翻译错误;二、SDL Studio 17 导出的术语表或译员自制术语表过于冗长,需将术语按知识谱系进行人工编辑,以便译前熟记;据笔者所知,目前尚无软件可辅助此种术语表编辑;三、有道翻译、百度翻译和Microsoft Edge浏览器机器生成的部分术语,读音不太自然;四、由于技术原因,部分国外视频网站无法访问。
在现场,首先,笔者仍按传统同传工作方式翻译:译入语由同传设备耳机传给译员, 译者译语通过译员工作台话筒传出。而后,语音识别技术,将译者的译语识别为文字, 并投射在会场前端中央屏幕上。语音识别技术公司在现场安排人员负责人工校正或删除识别错误严重的汉语词语、句子。会议现场所有的人,可选择使用耳机或观看字幕获知讲话大意。语音识别转写出的文字可保存并用于会议记录、新闻报道、翻译质量评价和控制等用途。
值得注意的是,在笔者参与同传的第二场(2018 年)会议上,语音识别技术提供公司主动提议将源语言转写成文字投射到译员 工作间唯一的显示屏上,供译员参考。但笔者发现,由于医学语言术语、行话过多,转写效果欠佳;再者同传工作间与会议厅有墙壁相隔,无法直接观察到现场,唯一的显示屏如果用于转写显示,就不能用于现场播放幻灯片显示。利弊权衡后,笔者和搭档一 致同意并要求将显示屏用于播放现场幻灯片。在现场翻译过程中,笔者和搭档还使用了谷歌翻译、有道翻译等在线翻译引擎,翻译临时收到的讲者幻灯中陌生词汇、短语、句子、段落,以备参考。笔者发现,大部分医学术语译法及自动发音都很准确。
在现场翻译中,笔者发现,技术的介入也带来了一些新的问题,可从语音识别系统角度和人的因素这两个角度加以总结分析:
1)双语或多语混合识别效果欠佳。在中文发言中碰到英文单词时,讯飞听见系统和苹果手机语音识别系统,都需讲者按字母拼写单词才可识别,这给医学等技术语料的语音识别带来了困难。原因在于,不少医学解剖、疾病、疾病分期、疗法等术语用发现者或提出者姓名命名,医学界可直接按英文发音规律念出,而非使用中文术语或逐个字母拼出,譬如,Kegel exercise(中文译名:凯格尔运动,是一种盆底肌训练)、Cowper’s glands(中文译名:尿道球腺或库珀 [ 氏 ] 腺)。近年来,随着海外留学归国人员增多, 学术报告中夹杂英文更加常见。
2)If、however、although 等词引起的条件状语、让步状语从句识别效果欠佳。原因在于,这些词引起的从句,既可放置于主句前,又可放置于主句后,给识别及自动标点符号添加带来了困难。例如,由三个片段构成的两个句子:(1)I would like to talk about that(2)if I have more time.(3)I’ll talk about that in detail. 语音识别时,既可将(1)、(2)识别为一句,又可将(2)、(3) 识别为一句。笔者已向多家语音识别公司反映此问题,希望通过语音识别算法优化得到解决。
3) 其他问题 :(1) 译员及讲者语言标准程度影响识别效果,语音、语调、语法、用词偏误的语料和难念的医学词汇(如anastomosis、anesthetize) 等识别效果较差;(2)汉语识别结果好于英语识别结果:可能是由于识别系统所依托语料库两种语言规模不平衡,或译员英语存在更多的语音、语法、 用词错误,具体原因有待进一步研究;(3)同传译语比一般发言破碎度更高,语法、句型、 用词较为特殊,识别难度比一般发言更大,识别效果有待提高;(4)背景噪音较大,如同传间及会议现场意外产生的噪音,会影响识别效果。
技术辅助的同传,改变了译员传统工作环境和条件,有助于译员提高译前准备效率, 改善翻译质量,减轻翻译现场压力,与此同时,也改变了译员、听众、讲者、技术提供方、会议主办方等各方原本所共同依赖的同传生态系统。笔者认为学界应该从以下几个方面思考,在越来越多的技术,特别是语音识别技术进入同传后,如何重构技术辅助时代的同传生态系统。
在技术辅助翻译背景下,技术运用能力,应当成为同传译员素养的重要构成要素,译员及翻译培训机构应加以重视。技术,特别是语音识别技术对译员来说是一把双刃剑。
一方面,各种技术有助于译员提高翻译质量和译前准备效率。比如,语音识别可转写译员产出的译语,方便译员在译后自我评估总结、分析提升。2018年末,笔者受邀参加科大讯飞公司同传译员恳谈会。在会上,讯飞公司展示了其研发的译员辅助软件。这款软件不仅可以识别出语音发言,还能将其中的数字和专有名词用特别的方式突出显示,并提供术语的参考译文。如果这款软件不断完善,有望减轻同传的工作记忆负担,甚至可以减轻交传译员的工作记忆负担和笔记负担。
另一方面,语音识别加同传的模式给译员带来了极大的心理压力。传统同传工作过程中,译语只会以声音形式短暂保留在听众大脑中,如果译员不慎出现疏漏,也不至于特别明显。在同传加语音转写字幕的新模式下,翻译中的疏漏会长时间(几分钟)显示在屏幕上,这无疑对译员带来了更多心理压力,译员需要具备更好的抗压能力。此外,在语音识别引入后,发音不够标准的译员,由于译语识别效果较差,可能会被市场淘汰。机器翻译技术的不断进步,也将一批原本翻译质量较差的译员推向失业的边缘。
近年来,随着技术进步,译员,特别是口译员的知识保护问题引起了各方的高度关注。译员的多种知识产权作品,都有可能遭遇侵权和滥用。譬如,译员翻译出的译语被软件识别后,可能继续被主办方用于添加字幕、撰写报告、发布新闻等其他目的,被技术提供公司作为语料,优化语音识别、机器翻译引擎等,这些都属于对译员知识产品的二次使用。再如,译员在翻译准备时制作的词汇表,分享给语音识别技术公司及主办方,用于提高现场语音识别质量及日后语音识别乃至机器翻译的质量。笔者认为,译员应当在接受翻译任务时,与各方约定好翻译产品的知识产权事宜,需要付费的项目和产品,应在协议中明确。
此外,低质量的翻译根本原因不一定总是在于译员水平较差,有时译员以外的因素,如讲者发音、口语、讲话逻辑上的问题,乃至现场技术和物理环境,都会影响到翻译效果。但不幸的是,只掌握一门语言的听众(及付费方),甚至部分双语听众,都无法或无暇顾及并准确分析翻译质量较差的原因。在传统同传模式下,这个问题一直存在;在语音识别模式下,译员不仅将继续担当无辜的“替罪羊”,由于转写技术尚有待提高,译员的疏漏可能会被放大,而显得更加突出。如何判定译员责任的大小,会变得更加复杂。译员对自身应该严加要求,也要善于利用技术手段采集证据,为自己正名。
同传加语音识别转写字幕的方式,为受众提供了除通过同传接收机收听译语以外的另一种选择,有听觉障碍或不善于使用同传接收机的参会者可利用字幕获取讲话信息。但是,值得注意的是,同传加语音识别转写字幕的方式有可能增加受众的认知负担。传统的同传模式下,受众通过视觉观看幻灯片,观察讲者的表情、动作、体态等副语言信号,通过听觉(耳机收听译语)来获取讲者讲话信息。在新的模式下,如果没有同传接收器(笔者见证过此种情形),参会者将同时观看讲者幻灯片、阅读投屏文字,导致视觉信号通道认知负担增加,可能会影响对讲者的理解。
语音识别辅助同传这种新的模式有助于帮助讲者生成发言稿,以便后期加工编辑,以文本方式传播,或供讲者或主办方会后进行总结反思。但需要注意,部分英语讲者,不仅在语音层面与典型的标准母语口语者有极大的差异,甚至在用词、短语、语法、句型、篇章结构上也有较大的差异,他们产出的语料机器识别有难度,现场翻译和识别效果也较差。此外,采用同传译员译语投屏显示这种“信息递送”模式,可能导致讲者无法吸引听众注意力。语音转写技术提供商的一位工作人员向笔者描述了一个典型的场景:一位“重量级”发言人站在偌大的会议厅的左端作报告,而现场语音转写屏幕设在会议厅右端,在会议进行中,听众不约而同地关注右端屏幕,而讲者“备受冷落”,与听众的非言语沟通受阻。
在新型的同传模式下,技术提供方主要包括同传设备租赁方、语音识别技术提供方、翻译软件和在线翻译服务提供商。在技术辅助同传的时代,技术提供方也将面临新的机遇和挑战。
同传设备租赁方盈利主要渠道是设备租赁,为此,笔者询问了传统同传设备租赁公司、语音识别、机器翻译服务公司的服务报价。传统的同传设备公司表示:按目前北京地区的市场价,一部同传主机租金是2000元/套/天,接收器20元/个/天。国内某知名语音识别和机器翻译服务公司表示:会议语音识别12,000元一场,一天收费24,000元;如果无需同传译员现场翻译,则在语音识别的同时做机器翻译;如果配备一位同传译员,18,500元一场;如果外宾发言较多,需要配备两位译员,23,500元一场。可见,语音识别技术的引入可能对传统设备租赁公司带来盈利挑战。此外,语音识别技术提供方有可能依靠提供识别技术获利,并通过识别技术服务提供过程中搜集的词汇表、录音等语料建立和完善语料库,改善其机器翻译质量。
可以预见,随着计算机辅助翻译技术在同传中的广泛使用,Trados和Dejavu等翻译软件提供商、有道词典等手机App提供商、在线翻译服务提供商会拥有更加广泛的客户群体和更大的盈利潜力。
在技术辅助的同传时代,会议主办方会因技术受益,获得更好的成本效益,但同时也会面临很多抉择,可能有得有失。
在目前的技术条件下,主办方有三种选择:(1)传统方式;(2)同传译员+语音识别的人机混合方式;(3)语音识别+机器翻译+文字投屏方式。按照目前价格来看,小规模会议同传,还是传统模式比较便宜。未来则难以预测,技术进步的脚步实在太快,同传译员适应技术的主观能动性也不可小觑。
至于得失,一方面,主办方可以在会议同传结束后,对现场的转写文字进行编辑、加工,或依据转写稿判断同传质量。与以往无转写相比,有了转写文字辅助,主办方更容易判断翻译质量好坏。当然,基于转写文本的评估,需要结合现场讲者讲话的逻辑性、条理性、语速、口音等因素,以及现场听众的反馈调查。另一方面,在会议筹办过程中,主办方与译员的沟通协调工作可能会因技术的引入而增加。此外,会议主办方需要根据参会者人数来确定采取何种模式开展同传工作。
技术辅助翻译的出现,对同传乃至对整个翻译界,既是机遇,又是挑战,最终将重构翻译的生态系统。技术对口译,乃至整个翻译生态系统的影响,是人工智能技术对人类社会影响的一个缩影。“解剖麻雀”有利于了解全局,本文乃抛砖引玉,未来研究可以继续深入。
- 标签:影视翻译论文
- 编辑:夏学礼
- 相关文章
-
用导图读论文|计算机翻译辅助技术在同传中的应用及对同传生态系统的影响
随着技术的发展,翻译活动中语音识别、机器翻译等翻译辅助技术的使用变得普遍,然而,在技术辅助的同传、技术对同传活动参与各方的…
- 1080P全高清影院推荐爱普生CH-TW750投影仪
- 桂林电子科技大学北海校区(桂林电子科技大学北海校区官网)
- 桂林银行个人网上银行(桂林银行个人网上银行的登录密码是支付密码吗)
- 桂林阳朔(桂林阳朔离哪个高铁站最近)
- 桂林景点门票(桂林景区免门票)
- 桂林人事考试中心(桂林医学考试中心官网)
- 桂林人事考试中心(桂林考试中心地址)
- 桂林人事考试中心(桂林医学考试中心)
- 广西桂林旅游景点(桂林景点门票价格表)
- 《寄生虫》成奥斯卡92年来首部非英语最佳影片 国外总统发文庆贺