聯(lián)系方式 |
全國運營電話: |
158-9898-6870 |
日照24小時熱線: |
15898986870 |
聯(lián)系QQ: |
10932726 1097430389 |
電 話: |
158-9898-6870 158-9898-6870 |
E-mail: |
info@yishengfanyi.com |
|
|
谷歌翻譯團隊開發(fā)了能把智能手機變成會“走路”的翻譯機
|
語言障礙是否能被打破?在谷歌看來,這肯定是可以做到事情。
據(jù)德國《明鏡周刊》報道,在一名來自德國的計算機科學家的領(lǐng)導(dǎo)下,谷歌正在開發(fā)一種通用翻譯工具的進程中取得進展。不過,谷歌在這個項目上正面臨著即將來臨的潛在競爭對手,那就是微軟和Facebook。
當科幻小說家構(gòu)想人類的未來時,許多有關(guān)改善世界的想法總是會重復(fù)不斷地迸發(fā)出來,比如說無限可用的能源和光速旅行等。而在這些想法中,創(chuàng)造微型計算機來作為通用的翻譯工具以消除所有語言障礙也躋身其中。
終結(jié)語言不通的歷史
在以上所述的三種夢想中,至少最后一種是谷歌正計劃將之變?yōu)楝F(xiàn)實的事情。在谷歌內(nèi)部,有一位來自德國西南部城市埃朗根(Erlangen)附近一個小鄉(xiāng)村的計算機科學家正在負責這個項目,他就是現(xiàn)年41歲的弗朗茲·約瑟夫·奧馳(Franz Josef Och)。
長期以來,奧馳一直都集中致力于實現(xiàn)一個目標:開發(fā)出一種完美的翻譯計算機,這種計算機是如此不顯眼而又如此之快,“以至于你幾乎不會注意到它,只有當它在你的耳中低語時除外”。在他的理想中,這種設(shè)備能迅速翻譯任何文本、網(wǎng)站內(nèi)容或是對話內(nèi)容。
對奧馳來說,通用翻譯工具不只是意味著旅行者將可在沒有語言障礙的情況下四處旅行,也不只是意味著許多口譯工作人員將會面臨黯淡的未來前景,而是具有一種大得多的重要意義:這是一條通往人工智能的道路。從青少年時期開始,他就一直都夢想著將來有一天可以創(chuàng)造出各種能模仿人類專有屬性的機器。
后來奧馳就學習了計算機科學專業(yè),并最終拿到了博士學位,他的畢業(yè)論文就與人工智能有關(guān)。隨后,他被美國國防部高級研究規(guī)劃署(Defense Advanced Research Projects Agency)聘用,在加利福尼亞州展開自己的工作。在2004年,奧馳接到了來自于谷歌聯(lián)合創(chuàng)始人拉里·佩奇(Larry Page)的電話,后者詢問道:“你想不想做大?”然后奧馳就成為了谷歌翻譯(Google Translate)部門的負責人。
對于谷歌這家互聯(lián)網(wǎng)巨頭來說,暢想夢幻般的未來正是其業(yè)務(wù)模式的一部分內(nèi)容,無論是無人駕駛汽車還是有關(guān)延長人類壽命的實驗都反映了這種模式。雖然到目前為止谷歌翻譯還幾乎沒有什么成果,但很可能沒人能比奧馳以及他領(lǐng)導(dǎo)下的團隊擁有更遠大的抱負:他們想要終結(jié)神話傳說中從巴比倫通天塔倒塌以后開始的語言不通的歷史。
免費提供
這位德國計算機科學家及其團隊已經(jīng)取得了一些重大的進展,F(xiàn)在,谷歌翻譯已經(jīng)可以在71種語言之間進行互相翻譯,例如將英語翻譯為德語或是將冰島語翻譯為日語等。
舉例來說,當來自于《明鏡周刊》的一篇文章使用谷歌翻譯時,用戶在一轉(zhuǎn)眼的短短時間里就能獲得這盤文章的法語版;意大利語的網(wǎng)站也可以只需點擊一下按鈕就能以德語顯示;用戶只需用智能手機給日語寫成的一個火車站指示牌拍照,谷歌翻譯應(yīng)用就能自動識別圖片上的文字并進行翻譯。
去年,谷歌翻譯的用戶使用量大約為2億次。到目前為止,這項服務(wù)還是免費的。但對于一項自動化的翻譯服務(wù)來說,跨國公司將會樂于使用這種服務(wù),從而為其帶來很高的價值,這意味著在未來谷歌幾乎肯定可以通過這種翻譯工具獲取大量收入。
但就目前而言,谷歌的目標還是完善這項服務(wù),并以通過智能手機提供該服務(wù)為發(fā)展道路。谷歌翻譯團隊已經(jīng)開發(fā)了一個應(yīng)用,這個應(yīng)用能把智能手機變成會“走路”的翻譯機,到目前為止已可處理二十余種語言的翻譯任務(wù)。這個應(yīng)用的表現(xiàn)非常好,前提是句式相對簡單。舉例來說,如果有人想在北京告訴一名出租車司機說他急需到一家藥店去,那么只需要對著智能手機說出某種語言(比如說德語),然后手機就會用中文來重復(fù)他的話,準確地說出:“請帶我去一家藥店!
奧馳覺得,這個應(yīng)用現(xiàn)在仍舊“略顯緩慢和笨拙,因為你必須要按下按鈕”才能進行翻譯。此外,翻譯的質(zhì)量也并非總是很好。但就在幾年以前,如果他預(yù)計谷歌翻譯能做到今天的事情,那么人們肯定會說他是瘋了。
量子躍遷般的重大突破
在數(shù)十年以前,IBM就為自動化翻譯奠定了基礎(chǔ),但當時該公司所從事的項目毫無進展,不久以后就被放棄了。也正因如此,在奧馳及其同事在谷歌開始展開相關(guān)工作的頭幾年時間里,自動化翻譯還只是一個“純粹的研究項目”。但在最近,他們已經(jīng)取得了重大的進展;按奧馳的話來說,這種進展可以說是一種“量子躍遷”般的重大突破。
谷歌翻譯團隊的工作地點是在該公司位于硅谷的總部園區(qū),這支隊伍的規(guī)模已經(jīng)擴大了很多。在這個團隊中有幾位德國計算機科學家,但卻連一個純粹的語言學家也沒有,就連奧馳本人也并非真正有天賦的語言學家。相反的,奧馳說道:“我在學習語言時總會遇到麻煩,這也正是機器翻譯的美妙之處:最重要的事情是擅長數(shù)學和統(tǒng)計學,然后又會編程,那就可以了!
開發(fā)詞典、定義語法結(jié)構(gòu)以及制定正常情況下翻譯程序所需要的所有規(guī)則以模仿人類翻譯,這幾乎不是谷歌翻譯團隊所從事的工作。事實上,這種規(guī)則經(jīng)常都會由于太過靈活而令計算機無從下手。舉例來說,在英語和德語中,形容詞是放在名詞前面的;但在法語中,通常情況下則是反過來的。其結(jié)果是,翻譯程序很快就會“迷失在翻譯中”。
谷歌團隊所強調(diào)的是自己最為了解的東西:海量的數(shù)據(jù)及其相關(guān)相關(guān)統(tǒng)計信息!盎旧蟻碚f,我們的系統(tǒng)正在做的事情就是把現(xiàn)有的譯文關(guān)聯(lián)起來,然后多多少少地靠自己來學習如何利用數(shù)之不盡的文本來進行翻譯!眾W馳說道,F(xiàn)有的數(shù)據(jù)量越是龐大,那么這個系統(tǒng)就能越好地運行,這也正是為何翻譯計算機只有在互聯(lián)網(wǎng)出現(xiàn)以后才有可能誕生的原因所在。
遠不夠完美
谷歌翻譯服務(wù)的算法能在雜亂無章的信息中進行搜索,收集相關(guān)數(shù)據(jù)并在這一過程中進行學習。舉例來說,當谷歌翻譯程序接到一個任務(wù),需要把一句法語翻譯成德語時,那么這個程序就會搜索可與這句話相匹配的已知短語,然后計算出如何基于這些信息來最好地組織一個新的句子。
這種方式經(jīng)常都有很好的效果,但距離完美則仍很遙遠。對于自動化的翻譯程序來說,語法、語調(diào)和歧義性仍舊是一個重大的問題。在很多情況下,通過翻譯程序來翻譯的信息能被人理解,但對于語言學家來說則與噩夢無異。畢竟,機器不可能對美學有任何感覺。
那么,谷歌是否需要教會這個程序擁有自己的創(chuàng)造力,才能真正取得成功呢?奧馳對此作出的回答是否定的,指出這實際上是個事關(guān)“更有效的學習”方法的問題。換而言之,計算機需要掌握的是模仿的藝術(shù),而并非具備創(chuàng)造力。
當兩種語言之間的結(jié)構(gòu)相似且可用數(shù)據(jù)數(shù)量龐大時,谷歌翻譯通常能有更好的表現(xiàn)。舉例來說,英語和西班牙語之間的互譯就是如此。但是,英語與日語之間的互譯則沒那么好!安恍业氖,英語和德語恰好是難以互譯的一對語言!眾W馳說道!斑@真讓我頭大!
不過,谷歌到底想要利用谷歌翻譯服務(wù)來做到什么事情呢?這家公司是不是想要在人際交流中占據(jù)壟斷地位,并在全球互動的領(lǐng)域中樹立自己的霸權(quán)?
競爭對手的崛起
奧馳對這個問題也不太清楚,他表示有關(guān)商業(yè)的事情并不在自己的考慮范圍之內(nèi)。但他說道:“機器翻譯能讓許多人獲取許多信息,這將令其他許多事情變成可能!彼解釋道,間接效益才更重要。
與此同時,谷歌在這個領(lǐng)域中正面臨著越來越大的競爭壓力。幾個星期以前,F(xiàn)acebook已經(jīng)收購了一家小型公司,后者已經(jīng)開發(fā)出了一種用于自動化翻譯的系統(tǒng)。這家社交網(wǎng)絡(luò)巨頭想要利用這個系統(tǒng)來為用戶之間的交流提供便利,因其10多億用戶分布在200多個國家中。
歐盟也已經(jīng)開發(fā)出了自己的自動化翻譯程序MT@EC,但這個程序主要以處理官方術(shù)語為主。受預(yù)算削減的影響,歐盟很可能不得不在未來幾年時間里裁減10%的翻譯人員。
微軟也已推出一個翻譯項目。在去年秋天,微軟研究部門全球負責人里克·拉希德(Rick Rashid)在中國召開的一次會議上宣布了這個項目的成功。當時他用英語講話,而一臺微軟計算機同時將他說的話翻譯成普通話,而且是以拉希德自己的聲音說出來的。從這一點說來,至少微軟的這個翻譯程序已經(jīng)沾染上了一絲人性。
|
|
|