如何評(píng)價(jià)Google神經(jīng)機(jī)器翻譯(GNMT)系統(tǒng)?
日期:2017-09-20 / 人氣: / 來(lái)源:http://www.pmcwfrk.cn/ 作者:譯聲翻譯公司
翻譯有純?nèi)斯しg,還有借助電腦的機(jī)器輔助翻譯(CAT,computer assisted/aided translation),還有傳統(tǒng)的機(jī)器翻譯(MT,machine translation)。
傳統(tǒng)的機(jī)器翻譯據(jù)說(shuō)源于上世紀(jì)五六十年代的美國(guó),為了破解蘇聯(lián)的大量俄語(yǔ)文件而研制。它的原理是詞匯間的一一對(duì)應(yīng),可以想見(jiàn),產(chǎn)出的譯文肯定是不通的,或許只能大體看出原文在探討的主題。這樣的翻譯模式或者思路,在翻譯天氣預(yù)報(bào)這種語(yǔ)匯固定的文本上有一定用處。據(jù)說(shuō)加拿大魁北克地區(qū)曾用這種方式播報(bào)雙語(yǔ)天氣預(yù)報(bào)。
機(jī)器輔助翻譯是指利用Trados或者wordfast這種工具,它的核心原理在于translation memory,即翻譯記憶語(yǔ)料庫(kù)。軟件工具把之前翻譯過(guò)的或者集中導(dǎo)入的雙語(yǔ)語(yǔ)料儲(chǔ)存起來(lái),遇到相似程度高的原文時(shí),自動(dòng)調(diào)出之前的譯文,譯者在其基礎(chǔ)上修改,完成最終的譯文。其翻譯單位為句子。
以上介紹的基于語(yǔ)匯一一對(duì)應(yīng)的機(jī)器翻譯和基于翻譯記憶數(shù)據(jù)庫(kù)的CAT,其實(shí)代表了實(shí)現(xiàn)人工智能的兩個(gè)思路。我自己只是搞翻譯的,對(duì)于人工智能不太懂,但機(jī)器/電腦翻譯屬于人工智能的范疇。人工智能的關(guān)鍵在于教會(huì)機(jī)器你想讓它認(rèn)知的東西,對(duì)于如何教,有兩個(gè)思路。
舉一個(gè)我在TED演講中聽(tīng)過(guò)的一個(gè)例子。
演講者從事的是圖像識(shí)別軟件的開(kāi)發(fā)。一開(kāi)始采取的套路是通過(guò)描述畫(huà)面來(lái)教會(huì)機(jī)器識(shí)別事物。比如給“貓”設(shè)置“圓臉、尖耳朵、長(zhǎng)尾巴”等參數(shù),但是效果很差,機(jī)器識(shí)別了站立著的貓,就識(shí)別不了坐著的貓。
后來(lái)研發(fā)者換了一個(gè)思路,模擬人類(lèi)孩童是如何認(rèn)識(shí)貓的——見(jiàn)的多了,就知道這樣的是貓了(孩子并不會(huì)去分析原來(lái)圓臉、尖耳朵、長(zhǎng)尾巴的才是貓)。于是將大量貓咪的圖片存入機(jī)器,并告訴它這是“貓”,后來(lái)機(jī)器遇到類(lèi)似的圖片,就能識(shí)別出是貓。已有數(shù)據(jù)庫(kù)越大,機(jī)器識(shí)別得就越準(zhǔn)確。
個(gè)人認(rèn)為質(zhì)量較高的機(jī)器/電腦翻譯的實(shí)現(xiàn),也要采取這后一種思路,即基于大量雙語(yǔ)語(yǔ)料的記憶和學(xué)習(xí)——讓機(jī)器記住什么樣的話(huà)是什么意思,而不是將語(yǔ)句分解為單個(gè)詞匯再去找它們?cè)诹硪粋€(gè)語(yǔ)言中的對(duì)應(yīng)。
根源還是語(yǔ)言的復(fù)雜性,無(wú)論是哪兩種語(yǔ)言之間,都不像二進(jìn)制和十進(jìn)制之間那樣可以實(shí)現(xiàn)一一對(duì)應(yīng),所以第一種思路的發(fā)展前途已經(jīng)很局限。而第二個(gè)思路或許就是以后的方向,互聯(lián)網(wǎng)實(shí)現(xiàn)的大量語(yǔ)料共享也為它的發(fā)展提供了可能。
------------------------------------
關(guān)于如何看待機(jī)器/線上翻譯的進(jìn)步:
雖然我自己是個(gè)翻譯匠,而且厭惡把線上翻譯隨便改改交差的譯員,但是對(duì)機(jī)器/電腦/線上翻譯本身心存親切——它畢竟不是人,不要笑話(huà)它。
它對(duì)于譯者也有用處,對(duì)于某些語(yǔ)匯(不是整句整段),它給的譯文由于基于大量現(xiàn)有語(yǔ)料,往往確實(shí)是業(yè)內(nèi)人士用的比較多的說(shuō)法。
所以大家不要看到機(jī)器翻譯產(chǎn)生可笑譯文就拿來(lái)調(diào)侃,該被調(diào)侃的是那些敢用這些譯文的人。
而且,沒(méi)有必要恐慌自己會(huì)被取代(前提是你的水平遠(yuǎn)高于機(jī)器);機(jī)器差的還比較遠(yuǎn)——如果你知道語(yǔ)言可以美到、精到、妙到什么程度,如果你明白很多時(shí)候它就是人的靈光一現(xiàn)的、獨(dú)一無(wú)二的、偶然的產(chǎn)物,就不會(huì)懷疑這一點(diǎn)。
推薦內(nèi)容 Recommended
- 醫(yī)療器械說(shuō)明書(shū)翻譯公司_專(zhuān)業(yè)醫(yī)療09-28
- 荷蘭語(yǔ)翻譯_荷蘭語(yǔ)翻譯公司_荷蘭語(yǔ)09-28
- 立陶宛語(yǔ)翻譯_立陶宛文翻譯_立陶宛09-28
- 日譯中_日文翻譯成中文_日中翻譯09-28
- 公司名稱(chēng)翻譯_專(zhuān)業(yè)公司名稱(chēng)翻譯公09-28
- 出口單證翻譯_報(bào)關(guān)單證翻譯_外貿(mào)單09-28
- 出生證明翻譯公司_出生證明翻譯09-28
- 出國(guó)留學(xué)成績(jī)單翻譯_高中成績(jī)單翻09-28
- 公證委托書(shū)翻譯公司_專(zhuān)業(yè)公證委托09-28
- 員工手冊(cè)翻譯公司_企業(yè)員工手冊(cè)翻09-28
相關(guān)內(nèi)容 Related
- 英國(guó)個(gè)人旅游簽證、探親訪友和商09-13
- 英國(guó)留學(xué)簽證流程及步驟09-13
- 英國(guó)簽證材料的英文版還需要蓋章09-13
- 為什么標(biāo)點(diǎn)符號(hào)也要算翻譯字?jǐn)?shù)?09-12
- 為什么數(shù)字、字母也要算翻譯字?jǐn)?shù)09-12
- 翻譯筆譯資料字?jǐn)?shù)是如何統(tǒng)計(jì)的09-12
- 【退休證翻譯_退休證明英文翻譯】09-12
- 英語(yǔ)標(biāo)點(diǎn)符號(hào)的標(biāo)準(zhǔn)用法09-11
- 【親屬移民材料翻譯,加拿大美國(guó)09-11
- 國(guó)外大學(xué)錄取通知書(shū)offer翻譯09-11