于洪區(qū)機器翻譯與人工翻譯之爭
信息來源:發(fā)布時間:2019/7/26 15:20:48
機器翻譯是指利用計算機把一種自然語言翻譯成另一種自然語言的技術,是一門結合了語言學和計算機科學等學科的交叉學科。認知智能是人工智能的最高階段,自然語言理解是認知智能領域的“皇冠”。機器翻譯這一自然語言處理領域最具挑戰(zhàn)性的研究任務,則是自然語言處理領域“皇冠上的明珠”。近年來,機器翻譯發(fā)展十分迅猛,但對于機器翻譯與人工翻譯孰優(yōu)孰劣、機器翻譯能否取代人工翻譯,一直存在爭議。機器翻譯之父韋弗曾提出“翻譯即解碼”的結構主義觀點,但是,數年之后,他自己又推翻了這一論斷,表示“機器成不了普希金,機器翻譯永遠都無法傳達出語言本身的優(yōu)雅與格調”。
機器翻譯發(fā)展迅速沈陽翻譯公司
語言能力是區(qū)分人類和動物的重要特征之一,是人類有效交流的保證。用機器來進行語言翻譯的想法,最早可追溯到古希臘時期?,F代意義上的“機器翻譯”一詞,由古圖拉特(Couturat)和洛(Leau)1903年在《通用語言的歷史》一書中最早提出。1949年,韋弗發(fā)表了具有廣泛影響力的名為《翻譯》的備忘錄,正式提出了機器翻譯的思想。直到2006年Hinton提出深度學習技術,才為實現這一目標提供了更好的解決途徑。目前的前沿技術是基于人工神經網絡的機器學習,其技術核心是一個擁有海量節(jié)點(神經元)的深度神經網絡,可以自動地從語料庫學習翻譯知識。一種語言的句子被向量化之后,在網絡中層層傳遞,轉化為計算機可以“理解”的表示形式,再經過多層復雜的傳導運算,生成另一種語言的譯文。
2015年,蒙特利爾大學引入注意力機制,使得神經機器翻譯達到實用階段。此后,神經機器翻譯不斷取得進展。2016年,谷歌GNMT發(fā)布,該系統(tǒng)可模仿人腦的神經思考模式,翻譯出與人工翻譯相媲美的譯文。同年,微軟在Switchboard對話語義識別達到人類水平,訊飛上線NMT系統(tǒng),神經機器翻譯開始被大規(guī)模應用??茖W雜志Nature梳理了2016年科技領域的十大突破,排在首位的就是人工智能,其中提及人工智能的機器翻譯使錯誤減少了約60%。隨后,Facebook的人工智能研究團隊開發(fā)了一種新的神經機器翻譯算法,在三種機器翻譯任務上得分高于所有同類系統(tǒng)。2017 年,微軟在斯坦福問答數據集 SQuAD 上達到人類水平。機器翻譯的發(fā)展速度遠遠超出人們的想象,但是對于機器翻譯是否能夠真正完全代替人工翻譯,學界仍舊爭論不休。
機器翻譯取代人工翻譯沈陽翻譯公司
目前而言,一部分專家認為機器翻譯很快會達到人工翻譯水平,在不遠的將來會完全取代人工翻譯。2010年,谷歌機器翻譯專家歐赫認為文本機器翻譯是合理有效的,真正的挑戰(zhàn)只在語音識別方面。他提出,未來幾年即有可能實現手機端語音到語音的自動翻譯。2019年2月《衛(wèi)報》刊登《機器翻譯的時代是否已經到來》一文,美國韋弗利實驗室(Waverly Labs)的安德魯·奧喬亞表示“在未來十到十二年內,機器翻譯技術可與人工翻譯相媲美,甚至超過人工翻譯的水平”。
專家們對于機器翻譯的信心來自最新一代的翻譯技術——神經網絡翻譯。神經網絡翻譯打造的機器翻譯系統(tǒng),采用了一系列新的學習手段來模擬人工翻譯。首先,利用人工智能任務的天然對稱性進行對偶學習。當訓練集中的一個中文句子被翻譯成英文后,系統(tǒng)會將相應的英文結果再翻譯回中文,并與原始的中文句子進行比對,進而從這個比對結果中學習有用的反饋信息,對機器翻譯模型進行修正。其次,利用推敲網絡,模擬人們寫作時不斷推敲、修改的過程。這樣,通過多輪翻譯,不斷地檢查、完善翻譯的結果,使翻譯的質量得到大幅提升。再次,采用聯合訓練的方法迭代改進翻譯系統(tǒng)。用中英翻譯的句子對去補充反向翻譯系統(tǒng)的訓練數據集,同樣的過程也可以反向進行。最后,采用一致性規(guī)范讓翻譯可以從左到右進行,也可以從右到左進行,最終讓兩個過程生成一致的翻譯結果。這一系列技術有效模仿了人工翻譯的過程,極大提升了機器翻譯的整體質量。
除此之外,機器翻譯相關學科之間的互動更加頻繁,合作更加緊密。翻譯界和技術界都呈現出了更大的包容性,相關人士達成一定共識,即過去那種把語言學家排除在外,僅依賴技術界,埋頭做數據、分析開發(fā)系統(tǒng)的做法是不可取的。在語言學和翻譯學領域,越來越多的人開始關注機器翻譯,對技術應用探索也不再一味抵觸,開始從用戶和市場需求的角度來客觀看待不同層級和不同受眾的語言服務,計算機輔助翻譯在專業(yè)翻譯領域發(fā)揮著越來越重要的作用。
機器翻譯技術仍備受質疑沈陽翻譯公司
對于現有的機器翻譯技術,很多學者也表示質疑。一方面,他們認為機器翻譯的廣泛適用性還有待考察。盡管機器翻譯在某些測試中正確率較高,而且在某些領域接近或超過人工譯員,但是這些測試只是針對特定范圍的文本,要想達到測試水平,必須滿足對于源語言和環(huán)境的苛刻要求。在筆譯方面,馮志偉在《機器翻譯研究》中表示,目前的機器翻譯系統(tǒng)對普通文本的翻譯在可讀性和準確性方面離人們的實際需求還有相當大的距離。機器翻譯系統(tǒng)對普通文本的翻譯,通常需要大量的譯后審校工作才能使譯文達到出版的要求,所花費的時間和費用往往會超過純人工翻譯。在口譯方面,中國科學院自動化研究所宗成慶在《機器翻譯的夢想與現實》中指出,在日??谡Z對話中,目前口語機器翻譯僅能對資源較為充分的語言(如英漢、日漢等),在說話場景不是非常復雜、口音基本標準、語速基本正常、使用詞匯和句型不是非常生僻的情況下,可基本滿足正常交流的需要。
機器翻譯發(fā)展迅速沈陽翻譯公司
語言能力是區(qū)分人類和動物的重要特征之一,是人類有效交流的保證。用機器來進行語言翻譯的想法,最早可追溯到古希臘時期?,F代意義上的“機器翻譯”一詞,由古圖拉特(Couturat)和洛(Leau)1903年在《通用語言的歷史》一書中最早提出。1949年,韋弗發(fā)表了具有廣泛影響力的名為《翻譯》的備忘錄,正式提出了機器翻譯的思想。直到2006年Hinton提出深度學習技術,才為實現這一目標提供了更好的解決途徑。目前的前沿技術是基于人工神經網絡的機器學習,其技術核心是一個擁有海量節(jié)點(神經元)的深度神經網絡,可以自動地從語料庫學習翻譯知識。一種語言的句子被向量化之后,在網絡中層層傳遞,轉化為計算機可以“理解”的表示形式,再經過多層復雜的傳導運算,生成另一種語言的譯文。
2015年,蒙特利爾大學引入注意力機制,使得神經機器翻譯達到實用階段。此后,神經機器翻譯不斷取得進展。2016年,谷歌GNMT發(fā)布,該系統(tǒng)可模仿人腦的神經思考模式,翻譯出與人工翻譯相媲美的譯文。同年,微軟在Switchboard對話語義識別達到人類水平,訊飛上線NMT系統(tǒng),神經機器翻譯開始被大規(guī)模應用??茖W雜志Nature梳理了2016年科技領域的十大突破,排在首位的就是人工智能,其中提及人工智能的機器翻譯使錯誤減少了約60%。隨后,Facebook的人工智能研究團隊開發(fā)了一種新的神經機器翻譯算法,在三種機器翻譯任務上得分高于所有同類系統(tǒng)。2017 年,微軟在斯坦福問答數據集 SQuAD 上達到人類水平。機器翻譯的發(fā)展速度遠遠超出人們的想象,但是對于機器翻譯是否能夠真正完全代替人工翻譯,學界仍舊爭論不休。
機器翻譯取代人工翻譯沈陽翻譯公司
目前而言,一部分專家認為機器翻譯很快會達到人工翻譯水平,在不遠的將來會完全取代人工翻譯。2010年,谷歌機器翻譯專家歐赫認為文本機器翻譯是合理有效的,真正的挑戰(zhàn)只在語音識別方面。他提出,未來幾年即有可能實現手機端語音到語音的自動翻譯。2019年2月《衛(wèi)報》刊登《機器翻譯的時代是否已經到來》一文,美國韋弗利實驗室(Waverly Labs)的安德魯·奧喬亞表示“在未來十到十二年內,機器翻譯技術可與人工翻譯相媲美,甚至超過人工翻譯的水平”。
專家們對于機器翻譯的信心來自最新一代的翻譯技術——神經網絡翻譯。神經網絡翻譯打造的機器翻譯系統(tǒng),采用了一系列新的學習手段來模擬人工翻譯。首先,利用人工智能任務的天然對稱性進行對偶學習。當訓練集中的一個中文句子被翻譯成英文后,系統(tǒng)會將相應的英文結果再翻譯回中文,并與原始的中文句子進行比對,進而從這個比對結果中學習有用的反饋信息,對機器翻譯模型進行修正。其次,利用推敲網絡,模擬人們寫作時不斷推敲、修改的過程。這樣,通過多輪翻譯,不斷地檢查、完善翻譯的結果,使翻譯的質量得到大幅提升。再次,采用聯合訓練的方法迭代改進翻譯系統(tǒng)。用中英翻譯的句子對去補充反向翻譯系統(tǒng)的訓練數據集,同樣的過程也可以反向進行。最后,采用一致性規(guī)范讓翻譯可以從左到右進行,也可以從右到左進行,最終讓兩個過程生成一致的翻譯結果。這一系列技術有效模仿了人工翻譯的過程,極大提升了機器翻譯的整體質量。
除此之外,機器翻譯相關學科之間的互動更加頻繁,合作更加緊密。翻譯界和技術界都呈現出了更大的包容性,相關人士達成一定共識,即過去那種把語言學家排除在外,僅依賴技術界,埋頭做數據、分析開發(fā)系統(tǒng)的做法是不可取的。在語言學和翻譯學領域,越來越多的人開始關注機器翻譯,對技術應用探索也不再一味抵觸,開始從用戶和市場需求的角度來客觀看待不同層級和不同受眾的語言服務,計算機輔助翻譯在專業(yè)翻譯領域發(fā)揮著越來越重要的作用。
機器翻譯技術仍備受質疑沈陽翻譯公司
對于現有的機器翻譯技術,很多學者也表示質疑。一方面,他們認為機器翻譯的廣泛適用性還有待考察。盡管機器翻譯在某些測試中正確率較高,而且在某些領域接近或超過人工譯員,但是這些測試只是針對特定范圍的文本,要想達到測試水平,必須滿足對于源語言和環(huán)境的苛刻要求。在筆譯方面,馮志偉在《機器翻譯研究》中表示,目前的機器翻譯系統(tǒng)對普通文本的翻譯在可讀性和準確性方面離人們的實際需求還有相當大的距離。機器翻譯系統(tǒng)對普通文本的翻譯,通常需要大量的譯后審校工作才能使譯文達到出版的要求,所花費的時間和費用往往會超過純人工翻譯。在口譯方面,中國科學院自動化研究所宗成慶在《機器翻譯的夢想與現實》中指出,在日??谡Z對話中,目前口語機器翻譯僅能對資源較為充分的語言(如英漢、日漢等),在說話場景不是非常復雜、口音基本標準、語速基本正常、使用詞匯和句型不是非常生僻的情況下,可基本滿足正常交流的需要。