機(jī)器翻譯能幫你多少?行業(yè)數(shù)據(jù)趨勢(shì)
日期:2017-08-31 / 人氣: / 來(lái)源:http://www.pmcwfrk.cn/ 作者:譯聲翻譯公司
云翻譯平臺(tái)的一個(gè)優(yōu)點(diǎn)是數(shù)據(jù)集中。這就意味著可以俯瞰某些語(yǔ)言行業(yè)數(shù)據(jù)趨勢(shì),如機(jī)器翻譯 ( MT ) 的用法及有效性。目前,“大數(shù)據(jù)”只是剛剛滲透進(jìn)入翻譯工具中,開(kāi)發(fā)人員仍在學(xué)習(xí)如何使用它。我相信,未來(lái)所有的云工具都將會(huì)基于用戶統(tǒng)計(jì)信息開(kāi)發(fā)分析和預(yù)測(cè)功能,類似于自由職業(yè)市場(chǎng)Upwork那樣在特定領(lǐng)域中,遴選出頂尖 10% 的自由職業(yè)者。然而,現(xiàn)在我們已經(jīng)可以做的是發(fā)現(xiàn)有用趨勢(shì),證實(shí)假設(shè),破除迷信。
作為一名研究人員,我很高興在本年初將數(shù)據(jù)工具引入到了 Memsource 中。以下是一些我們努力收集的此行業(yè)數(shù)據(jù)集合中值得注意的信息。
機(jī)器翻譯杠桿:只有 5-20% 的機(jī)器翻譯結(jié)果是可以直接使用的
為了第一個(gè)研究,我和同事決定觀測(cè)機(jī)器翻譯,以評(píng)估它能在多大程度上幫助專業(yè)譯者。行業(yè)研究機(jī)構(gòu)調(diào)查指出,多達(dá) 30% 的翻譯公司使用機(jī)器翻譯。這點(diǎn)不難理解:目前稅前利潤(rùn)如此之低,企業(yè)希望努力節(jié)省每一分成本,提升利益能力。同時(shí),在很多翻譯對(duì)話論壇中,譯者集體抵制機(jī)器翻譯的怒火足以融化鍵盤。
我瀏覽了收集到的數(shù)據(jù),看它們是否可以為雙方各自的主張?zhí)峁┲С帧?/p>
分析顯示,只有5-20%的原生機(jī)器翻譯結(jié)果好得無(wú)需任何更改即可使用。多達(dá)40%的機(jī)器翻譯結(jié)果,在經(jīng)過(guò)編輯后可以使用,在80%的翻譯語(yǔ)段中,機(jī)器翻譯可以自動(dòng)填充數(shù)據(jù)。
在上面的圖表中(點(diǎn)擊圖片放大),匹配率表示譯文和機(jī)器翻譯引擎所給建議之間的相似性:
- 匹配率 100%:專業(yè)人工翻譯與機(jī)器翻譯所給建議完全相同的語(yǔ)段
- 匹配率 85-95%:機(jī)器翻譯結(jié)果在編輯后足以采用。
- 匹配率 50-75%:機(jī)器翻譯對(duì)于單個(gè)字詞的自動(dòng)填充很有用,但不適用于整個(gè)語(yǔ)段
- 匹配率 0 表示:語(yǔ)段與人工翻譯結(jié)果的相關(guān)性只有 0-49%
請(qǐng)注意:只能跟蹤用戶首次啟用機(jī)器翻譯的項(xiàng)目,然后進(jìn)行譯后編輯之后再分析。這意味著,這里的樣本約有 3800 萬(wàn)單詞。
機(jī)器翻譯在翻譯法語(yǔ)、英語(yǔ)、西班牙語(yǔ)、葡萄牙語(yǔ)時(shí)可更好地發(fā)揮作用
數(shù)據(jù)結(jié)果表明,法語(yǔ),葡萄牙語(yǔ),西班牙語(yǔ)和英語(yǔ)機(jī)器翻譯引擎具有最高的潛在機(jī)器翻譯利用率。英譯法的翻譯質(zhì)量尤其突出,其中超過(guò) 20% 的翻譯是完全匹配機(jī)器翻譯所給建議,幾乎90%的語(yǔ)段與機(jī)器翻譯結(jié)果有一定相似性。
相比之下,俄語(yǔ),波蘭語(yǔ)和韓語(yǔ)的利用率很低,模糊匹配低于 40%,甚至 20%,完全匹配只有 5%。
這種差異的出現(xiàn)可能和語(yǔ)言的類型分類有關(guān)。法語(yǔ),葡萄牙語(yǔ),西班牙語(yǔ)和英語(yǔ)是分析型語(yǔ)言,就是說(shuō)這些語(yǔ)言依賴于詞序以及例如“是”或“將”這樣的輔助詞來(lái)傳達(dá)意思。另一方面,俄語(yǔ),波蘭語(yǔ)和韓語(yǔ)是綜合型的,就是說(shuō)這些語(yǔ)言更多地使用屈折變化。機(jī)器翻譯仍然致力于處理那些細(xì)微差別。
32% 的項(xiàng)目使用機(jī)器翻譯
正如在其他CAT工具中一樣,在 Memsource 中,用戶可以添加機(jī)器翻譯引擎,以便在逐段瀏覽文本時(shí)快速獲得參考譯文。這個(gè)過(guò)程稱為“交互式機(jī)器翻譯譯后編輯”,這與傳統(tǒng)譯后編輯的區(qū)別在于譯者不必每段都使用機(jī)器翻譯。如果機(jī)器翻譯錯(cuò)誤較多,他們就重新翻譯。
在機(jī)器翻譯引擎的選擇上,譯者通常使用通用引擎,比如谷歌翻譯或微軟翻譯。因此,本研究首先針對(duì)此類引擎的翻譯效果,而非對(duì)特定術(shù)語(yǔ)和主題領(lǐng)域進(jìn)行微調(diào)的定制引擎的翻譯效果。
如上所述,不是每個(gè)人都喜愛(ài)機(jī)器翻譯。譯者和語(yǔ)言服務(wù)公司認(rèn)為,機(jī)器翻譯有時(shí)會(huì)降低翻譯質(zhì)量或干擾譯者的注意力和自制力,這樣不利于譯者追求完美的譯文。Memsource 中只有約32%的項(xiàng)目啟用了機(jī)器翻譯。這個(gè)數(shù)字之所以有這么高,也是因?yàn)闄C(jī)器翻譯的“開(kāi)啟”選項(xiàng)被設(shè)置為默認(rèn)值。
報(bào)道顯示,大約兩年前,48% 的項(xiàng)目應(yīng)用了機(jī)器翻譯。從那時(shí)起,我們系統(tǒng)的平均翻譯量已經(jīng)從每月 1 億字增長(zhǎng)到 6-8 億字,而機(jī)器翻譯項(xiàng)目的份額卻下降了。我預(yù)測(cè),這意味著我們的譯者用戶群越來(lái)越能代表整個(gè)翻譯行業(yè)。Memsource 曾是幾個(gè)專業(yè)技術(shù)公司主導(dǎo)的翻譯工具,如今用戶遍布翻譯領(lǐng)域。這有助于說(shuō)明百分比下降的原因。
接下來(lái)會(huì)如何?
MT 使用量會(huì)增加嗎?這是毫無(wú)疑問(wèn)的。如今的在線對(duì)話需要快速翻譯。與高質(zhì)量相比,客戶需要的是更快的周轉(zhuǎn)時(shí)間。用 Facebook 的著名口號(hào)來(lái)說(shuō),就是“比完美更重要的是完成”。
與此同時(shí),機(jī)器翻譯的準(zhǔn)確度在不斷提高,然而仍然沒(méi)有達(dá)到人類的水準(zhǔn),但它正在朝此方向進(jìn)步。因此,也就有了更多關(guān)于啟用機(jī)器翻譯的爭(zhēng)論。
以上內(nèi)容是收集的數(shù)據(jù)中的一些發(fā)現(xiàn)。我們期待在未來(lái)幾個(gè)月能分享更多!
推薦內(nèi)容 Recommended
- 醫(yī)療器械說(shuō)明書(shū)翻譯公司_專業(yè)醫(yī)療09-28
- 荷蘭語(yǔ)翻譯_荷蘭語(yǔ)翻譯公司_荷蘭語(yǔ)09-28
- 立陶宛語(yǔ)翻譯_立陶宛文翻譯_立陶宛09-28
- 日譯中_日文翻譯成中文_日中翻譯09-28
- 公司名稱翻譯_專業(yè)公司名稱翻譯公09-28
- 出口單證翻譯_報(bào)關(guān)單證翻譯_外貿(mào)單09-28
- 出生證明翻譯公司_出生證明翻譯09-28
- 出國(guó)留學(xué)成績(jī)單翻譯_高中成績(jī)單翻09-28
- 公證委托書(shū)翻譯公司_專業(yè)公證委托09-28
- 員工手冊(cè)翻譯公司_企業(yè)員工手冊(cè)翻09-28
相關(guān)內(nèi)容 Related
- 英國(guó)個(gè)人旅游簽證、探親訪友和商09-13
- 英國(guó)留學(xué)簽證流程及步驟09-13
- 英國(guó)簽證材料的英文版還需要蓋章09-13
- 為什么標(biāo)點(diǎn)符號(hào)也要算翻譯字?jǐn)?shù)?09-12
- 為什么數(shù)字、字母也要算翻譯字?jǐn)?shù)09-12
- 翻譯筆譯資料字?jǐn)?shù)是如何統(tǒng)計(jì)的09-12
- 【退休證翻譯_退休證明英文翻譯】09-12
- 英語(yǔ)標(biāo)點(diǎn)符號(hào)的標(biāo)準(zhǔn)用法09-11
- 【親屬移民材料翻譯,加拿大美國(guó)09-11
- 國(guó)外大學(xué)錄取通知書(shū)offer翻譯09-11