野外吮她的花蒂,国产精品久久久久久久久久久久午衣片,欧美猛少妇色xxxxx猛叫,YYY6080韩国三级理论

淺談機(jī)器翻譯的幾種方法

日期:2019-05-21 23:20:50 / 人氣: / 來(lái)源:網(wǎng)絡(luò)轉(zhuǎn)載侵權(quán)刪

  在計(jì)算機(jī)科學(xué)中,機(jī)器翻譯是人工智能的研究領(lǐng)域。

  機(jī)器翻譯( Machine Translation ) , 是使用電子計(jì)算機(jī)把一種自然語(yǔ)言(源語(yǔ)言, Source Language )翻譯成另外一種自然語(yǔ)言(目標(biāo)語(yǔ)言, Target Language )的一種學(xué)科。

  這新學(xué)科同時(shí)也是一門(mén)新技術(shù),它涉及到語(yǔ)言學(xué),計(jì)算機(jī)科學(xué),數(shù)學(xué)等許多部門(mén),是非常典型的多邊緣交叉學(xué)科。

  人們一直在尋求更好的解決機(jī)器翻譯問(wèn)題的方法,目前機(jī)器翻譯方法主要有基于規(guī)則的機(jī)器翻譯,基于語(yǔ)料庫(kù)的機(jī)器翻譯和混合式機(jī)器翻譯方法。

  一、基于規(guī)則的機(jī)器翻譯方法

  基于分析和轉(zhuǎn)換的機(jī)器翻譯方法

  人作翻譯時(shí),把一個(gè)源語(yǔ)言句子譯成目標(biāo)語(yǔ)言句子,設(shè)計(jì)到四個(gè)基本操作:目標(biāo)語(yǔ)言單詞的檢索、調(diào)序、刪詞、增詞;機(jī)器翻譯系統(tǒng)的過(guò)程包括檢索、分析、轉(zhuǎn)換和生成主要四個(gè)階段,這被稱(chēng)為基于分析和轉(zhuǎn)換的機(jī)器翻譯系統(tǒng),也被認(rèn)為是模擬人類(lèi)翻譯活動(dòng)最恰當(dāng)?shù)臋C(jī)制。

  該方法有三個(gè)階段,為分析—轉(zhuǎn)換—生成。一般情況下,分析以句法為主、語(yǔ)義為輔,正確的句法結(jié)構(gòu)轉(zhuǎn)換加正確的詞匯譯文可以從源語(yǔ)言向目標(biāo)語(yǔ)言傳遞完整的正確信息。以句法結(jié)構(gòu)轉(zhuǎn)換附加一定的語(yǔ)義信息,?能夠構(gòu)成轉(zhuǎn)換的基本層次[3]。標(biāo)準(zhǔn)機(jī)器翻譯系統(tǒng)中句子和短語(yǔ)層次的結(jié)構(gòu)轉(zhuǎn)換是核心,產(chǎn)生式方式的轉(zhuǎn)換規(guī)則形式為:

  S是源語(yǔ)言的某個(gè)待翻譯單位(句子、短語(yǔ)等等),S1~Si是S中的下一級(jí)組成單位對(duì)于S,如果滿(mǎn)足條件,則目標(biāo)語(yǔ)言中有T1~Tj譯文構(gòu)成了相應(yīng)的等價(jià)物T。

  上述方法稱(chēng)為基于句法的轉(zhuǎn)換方法,因?yàn)镾1+S2+···Si一般來(lái)說(shuō)就是源語(yǔ)言的的句法結(jié)構(gòu)表示:也可以稱(chēng)為直接轉(zhuǎn)換方法,因?yàn)閷?duì)于每個(gè)源語(yǔ)言的翻譯組塊,都馬上給出一個(gè)目標(biāo)語(yǔ)言組塊與之對(duì)應(yīng)應(yīng)該說(shuō),?這種轉(zhuǎn)換方法符合人的直覺(jué)認(rèn)識(shí)也能夠?qū)崿F(xiàn)。

  基于中間語(yǔ)言的機(jī)器翻譯方法

  基于中間語(yǔ)言的翻譯方法是對(duì)源語(yǔ)言進(jìn)行分析以后產(chǎn)生一種稱(chēng)為中間語(yǔ)言的表示形式,然后直接由這種中間語(yǔ)言的表示形式生成目標(biāo)語(yǔ)言。所謂中間語(yǔ)言就是自然語(yǔ)言的計(jì)算機(jī)表示形式的系統(tǒng)化,它試圖創(chuàng)造出一種獨(dú)立于各種自然語(yǔ)言,同時(shí)又能表示各種自然語(yǔ)言的人工語(yǔ)言。

  基于中間語(yǔ)言的機(jī)器翻譯方法的優(yōu)勢(shì)是無(wú)需一種語(yǔ)言到另一種語(yǔ)言的一一轉(zhuǎn)換,對(duì)于多語(yǔ)種的翻譯系統(tǒng)可以節(jié)約大量的轉(zhuǎn)換知識(shí)的手工獲取工作量,假如有N種語(yǔ)對(duì)需要相互翻譯,只要有2N個(gè)分析和生成模塊就夠了。其中一半是源語(yǔ)言分析模塊,輸入為原文,輸出以1L表示:另一半是目標(biāo)語(yǔ)言生成模塊,輸入為1L表示,輸出為目標(biāo)語(yǔ)言譯文。然而,中間語(yǔ)言的機(jī)器翻譯方法也常遭到懷疑。因?yàn)槭欠衲軌驑?gòu)造出表示各種不同的自然語(yǔ)言語(yǔ)法、語(yǔ)義的中間語(yǔ)言至少目前還是未知數(shù)。此外,中間語(yǔ)言能不能把各種語(yǔ)言的所有特征保留下來(lái),又能很好生成對(duì)應(yīng)的各種語(yǔ)言也是問(wèn)題。所以,構(gòu)造中間語(yǔ)言是一個(gè)巨大、復(fù)雜的工程,還包含許多理論研究,迄今為止的探索還沒(méi)有好的答案。

  基于轉(zhuǎn)換的方法采取了一系列轉(zhuǎn)換生成層次,各種分析多(如詞法、句法、語(yǔ)義和語(yǔ)境等),而且在分析的過(guò)程中,會(huì)出現(xiàn)許多歧義結(jié)構(gòu),顯然,如果沒(méi)有好的算法效率就會(huì)低;此外,對(duì)于那些不符合語(yǔ)法規(guī)則的句子,這種方法難于給出正確的翻譯結(jié)果。

  二、基于語(yǔ)料庫(kù)的機(jī)器翻譯方法

  基于統(tǒng)計(jì)的機(jī)器翻譯方法

  基于統(tǒng)計(jì)的機(jī)器翻譯方法,一般不要任何語(yǔ)言學(xué)知識(shí),它的基本原理是實(shí)現(xiàn)源語(yǔ)言詞匯到目標(biāo)語(yǔ)言詞匯的映射。其思路受到語(yǔ)音識(shí)別研究的啟發(fā),因而應(yīng)用了類(lèi)似的方法來(lái)實(shí)現(xiàn)。研究者用大規(guī)模的雙語(yǔ)語(yǔ)料庫(kù)作為基礎(chǔ),對(duì)源語(yǔ)言和目標(biāo)語(yǔ)言詞匯的對(duì)應(yīng)關(guān)系進(jìn)行統(tǒng)計(jì),根據(jù)統(tǒng)計(jì)規(guī)律輸出譯文。這種方法沒(méi)有使用語(yǔ)言知識(shí),主要特征是概率基于統(tǒng)計(jì)的機(jī)器翻譯方法,一般不要任何語(yǔ)言學(xué)知識(shí),它的基本原理是實(shí)現(xiàn)源語(yǔ)言詞匯到目標(biāo)語(yǔ)言詞匯的映射。其思路受到語(yǔ)音識(shí)別研究的啟發(fā),因而應(yīng)用了類(lèi)似的方法來(lái)實(shí)現(xiàn)。研究者用大規(guī)模的雙語(yǔ)語(yǔ)料庫(kù)作為基礎(chǔ),對(duì)源語(yǔ)言和目標(biāo)語(yǔ)言詞匯的對(duì)應(yīng)關(guān)系進(jìn)行統(tǒng)計(jì),根據(jù)統(tǒng)計(jì)規(guī)律輸出譯文。這種方法沒(méi)有使用語(yǔ)言知識(shí),主要特征是概率統(tǒng)計(jì)與隨機(jī)過(guò)程的方法成為了分析和生成過(guò)程的唯一方法。它的主要內(nèi)容是雙語(yǔ)句對(duì)的對(duì)齊,通過(guò)詞匯同現(xiàn)的可能性來(lái)計(jì)算一種語(yǔ)言的一個(gè)詞映射到另一種語(yǔ)言的一個(gè)詞(或兩個(gè)、零個(gè)詞)的概率。應(yīng)該說(shuō),基于統(tǒng)計(jì)的機(jī)器翻譯方法的出現(xiàn)改變了機(jī)器翻譯研究的面貌,從而開(kāi)始了機(jī)器翻譯研究的新階段。

  統(tǒng)計(jì)方法最先在語(yǔ)音識(shí)別領(lǐng)域取得了成功,機(jī)器翻譯的噪聲通道模型可以視作最早的機(jī)器翻譯思想,其思路可以這樣理解:

  假設(shè)說(shuō)話(huà)者已經(jīng)用目標(biāo)語(yǔ)想好了一句話(huà)T,但是說(shuō)出的卻是源語(yǔ)言句子S。這樣一個(gè)過(guò)程可以看成為編碼過(guò)程。而統(tǒng)計(jì)的機(jī)器翻譯就是要從S回推T,可以看成解碼過(guò)程。這樣,統(tǒng)計(jì)的機(jī)器翻譯任務(wù)分為兩個(gè)部分:一是建模,即建立翻譯的計(jì)算方法以及從雙語(yǔ)語(yǔ)料庫(kù)中估計(jì)模型的參數(shù);二是解碼,即尋求一種高效搜索算法取有關(guān)概率計(jì)算的最大值。

  基于統(tǒng)計(jì)的方法以大規(guī)模的雙語(yǔ)語(yǔ)料庫(kù)為基礎(chǔ),需要訓(xùn)練,一般翻譯速度比較慢;而且它還有被懷疑之處——這種方法會(huì)不會(huì)由于本身的固有屬性,不可能有很高的譯文正確率。但基于統(tǒng)計(jì)的機(jī)器翻譯方法還是具有很多優(yōu)勢(shì),如開(kāi)發(fā)速度快、周期短、無(wú)需人工干預(yù)等,在特定領(lǐng)域訓(xùn)練數(shù)據(jù)充分的情況下翻譯性能基本可以達(dá)到實(shí)用水平。

  基于實(shí)例的機(jī)器翻譯方法

  基于實(shí)例的機(jī)器翻譯方法通過(guò)結(jié)構(gòu)化的翻譯例子直接把源語(yǔ)言的短語(yǔ)和句子與目標(biāo)語(yǔ)言的短語(yǔ)和句子對(duì)應(yīng)起來(lái),方法的不同使得處理步驟或多或少,但都必須實(shí)現(xiàn)源語(yǔ)言到目標(biāo)語(yǔ)言的轉(zhuǎn)換,其映射關(guān)系或者是詞到詞,或者是短語(yǔ)或句子到與之相應(yīng)的等價(jià)物,或者是一棵句法樹(shù)到另一棵句法樹(shù)。

  基于實(shí)例的機(jī)器翻譯(EBMT)的實(shí)現(xiàn)過(guò)程簡(jiǎn)單概述如下:給定源語(yǔ)言輸入句子S,在雙語(yǔ)語(yǔ)料庫(kù)C中匹配查找一個(gè)最相近的句子S’,則S’的譯文就被接受為S的譯文。翻譯的過(guò)程一般就是查找和復(fù)現(xiàn)相似的例子,發(fā)現(xiàn)和記起特定的源語(yǔ)言表達(dá)或相似的表達(dá)在以前是如何翻譯的,把以前的翻譯實(shí)例作為主要知識(shí)源。

  三、混合式機(jī)器翻譯方法

  基于混合式的機(jī)器翻譯方法能夠很好的利用兩種方法的優(yōu)點(diǎn),目前非常盛行?;旌鲜綑C(jī)器翻譯方法是將基于規(guī)則的翻譯方法和基于統(tǒng)計(jì)的翻譯方法結(jié)合。在基于規(guī)則的技術(shù)中引入語(yǔ)料庫(kù)方法,其中有基于實(shí)例的方法、統(tǒng)計(jì)方法,通過(guò)對(duì)語(yǔ)料庫(kù)的預(yù)處理使其轉(zhuǎn)化為自然語(yǔ)言知識(shí)庫(kù)的方法。Rules post-processed by statistics統(tǒng)計(jì)方法做后處理,翻譯使用規(guī)則方法。Statistics guided by rules使用規(guī)則方法做前后處理,翻譯使用統(tǒng)計(jì)方法。

  混合式機(jī)器翻譯方法是效果最好的,但目前混合方法中各種模型的耦合方式還比較松散,進(jìn)行多翻譯模型的深度融合可能是未來(lái)研究的一個(gè)熱點(diǎn)。

  機(jī)器翻譯瓶頸

  之前進(jìn)行的機(jī)器翻譯的有益的探索中,凡是取得了結(jié)果的研究大都努力避開(kāi)理解語(yǔ)言這一過(guò)程。因?yàn)檫@一過(guò)程本身涉及到了A的終極目標(biāo),機(jī)器的智能化。然而,這又是一個(gè)無(wú)法回避的問(wèn)題,不能理解語(yǔ)言就不可能進(jìn)行真正意義上的翻譯。

機(jī)器翻譯相關(guān)閱讀Relate

  • 旅游英語(yǔ)論文:機(jī)器翻譯及旅游文本的譯后
  • 被遺忘的在線(xiàn)翻譯行業(yè),現(xiàn)狀如何?
  • 機(jī)器翻譯的瓶頸在哪?如何突破?
  • 媒體報(bào)道相關(guān)問(wèn)答
    問(wèn):如何保證譯稿的準(zhǔn)確性?
    答:選用專(zhuān)業(yè)化的高素質(zhì)翻譯人員,依賴(lài)完整嚴(yán)格的質(zhì)量保證體系,執(zhí)行科學(xué)、規(guī)范的工作流程;此外,我們不主張和客戶(hù)之間沒(méi)有溝通的翻譯過(guò)程,為了保證最佳的翻譯質(zhì)量,客戶(hù)應(yīng)盡量提供您已在沿用的文稿中涉及到的詞匯或本行業(yè)相關(guān)術(shù)語(yǔ)的譯法。
    問(wèn):你們翻譯公司是否就是一個(gè)中介機(jī)構(gòu)?
    答:1、我們有自己的翻譯部,所有的文件都是經(jīng)過(guò)我們的譯員翻譯出來(lái)的。 2、我們有統(tǒng)籌和校審部,所有文件的質(zhì)量都是這兩個(gè)部門(mén)來(lái)把關(guān)。 3、我們對(duì)翻譯的后期修改維護(hù)負(fù)責(zé)。免費(fèi)為客戶(hù)提供后期的稿件維修工作。
    問(wèn):你們翻譯公司做過(guò)電子翻譯沒(méi)有?
    答:電子翻譯是我們的主要優(yōu)勢(shì)翻譯領(lǐng)域,電子行業(yè)客戶(hù)是我們最大的客戶(hù)群,我們精通電子行業(yè)細(xì)分的多個(gè)領(lǐng)域。
    問(wèn):目前我的文章在語(yǔ)法上應(yīng)該問(wèn)題不多,但是表達(dá)上可能有些單調(diào),這是投稿的忌諱,你們能解決嗎?
    答:給出中文原稿這個(gè)問(wèn)題應(yīng)該可以解決
    問(wèn):貴司的付款方式?
    答:我們支持對(duì)公帳戶(hù)、對(duì)私帳戶(hù)、郵局匯款、在線(xiàn)網(wǎng)銀、支付寶等各種方式,您可以選擇自己方便的付款方式進(jìn)行支付。
    問(wèn):需要與你們公司什么人接洽翻譯業(yè)務(wù)呢?
    答:我們公司采取專(zhuān)屬客服服務(wù)模式。為企業(yè)客戶(hù)配備專(zhuān)屬客服經(jīng)理,一對(duì)一溝通具體項(xiàng)目的翻譯需求,實(shí)時(shí)響應(yīng)與溝通,節(jié)假日不休。
    問(wèn):你們公司有專(zhuān)門(mén)的視頻資料或公司資料嗎?
    答:有的??梢月?lián)系我們客服人員獲取詳情。
    問(wèn):我想要翻譯一篇文章,請(qǐng)問(wèn)是怎么收費(fèi)的?
    答:資料翻譯報(bào)價(jià)是根據(jù)稿件總字?jǐn)?shù)、專(zhuān)業(yè)性程度、翻譯領(lǐng)域、交稿時(shí)間綜合考慮來(lái)確定的。一般來(lái)說(shuō),中譯英費(fèi)用160元/千字,英譯中150元/千字,都是基于漢字統(tǒng)計(jì)“字符數(shù)(不計(jì)空格)”數(shù)值計(jì)算。您可以參看我們的翻譯報(bào)價(jià)。
    問(wèn):一些特殊文檔稿件怎樣進(jìn)行字?jǐn)?shù)統(tǒng)計(jì)?
    答:對(duì)于這些文檔格式的稿件,如:Pdf、Powerpoint、CAD,我們一般先盡量用軟件轉(zhuǎn)換成WORD文件進(jìn)行統(tǒng)計(jì);如不能轉(zhuǎn)換,我們將通過(guò)估算字?jǐn)?shù)方式來(lái)統(tǒng)計(jì);估算方式統(tǒng)計(jì)結(jié)果如有爭(zhēng)議,將通過(guò)最終翻譯稿件實(shí)際字?jǐn)?shù)進(jìn)行換算。
    問(wèn):是否所有的文章內(nèi)容收費(fèi)都是固定的?
    答:我們對(duì)學(xué)術(shù)類(lèi)資料精譯的基本收費(fèi)標(biāo)準(zhǔn)是中譯英0.18元/字,英譯中0.16元/字。但不排除特殊難度的資料采用特殊報(bào)價(jià)。如中醫(yī)資料,歷史考古,古漢語(yǔ),哲學(xué)等等難度晦澀的專(zhuān)業(yè)資料。
    本站部分內(nèi)容和圖片來(lái)源于網(wǎng)絡(luò)用戶(hù)和讀者投稿,不確定投稿用戶(hù)享有完全著作權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果侵犯了您的權(quán)利,請(qǐng)聯(lián)系:187348839@qq.com,及時(shí)刪除。
    Go To Top 回頂部
    • 掃一掃,微信在線(xiàn)