吉林機(jī)器翻譯與人工翻譯之爭(zhēng)
信息來(lái)源:發(fā)布時(shí)間:2019/7/26 15:20:48
機(jī)器翻譯是指利用計(jì)算機(jī)把一種自然語(yǔ)言翻譯成另一種自然語(yǔ)言的技術(shù),是一門(mén)結(jié)合了語(yǔ)言學(xué)和計(jì)算機(jī)科學(xué)等學(xué)科的交叉學(xué)科。認(rèn)知智能是人工智能的最高階段,自然語(yǔ)言理解是認(rèn)知智能領(lǐng)域的“皇冠”。機(jī)器翻譯這一自然語(yǔ)言處理領(lǐng)域最具挑戰(zhàn)性的研究任務(wù),則是自然語(yǔ)言處理領(lǐng)域“皇冠上的明珠”。近年來(lái),機(jī)器翻譯發(fā)展十分迅猛,但對(duì)于機(jī)器翻譯與人工翻譯孰優(yōu)孰劣、機(jī)器翻譯能否取代人工翻譯,一直存在爭(zhēng)議。機(jī)器翻譯之父韋弗曾提出“翻譯即解碼”的結(jié)構(gòu)主義觀點(diǎn),但是,數(shù)年之后,他自己又推翻了這一論斷,表示“機(jī)器成不了普希金,機(jī)器翻譯永遠(yuǎn)都無(wú)法傳達(dá)出語(yǔ)言本身的優(yōu)雅與格調(diào)”。
機(jī)器翻譯發(fā)展迅速沈陽(yáng)翻譯公司
語(yǔ)言能力是區(qū)分人類和動(dòng)物的重要特征之一,是人類有效交流的保證。用機(jī)器來(lái)進(jìn)行語(yǔ)言翻譯的想法,最早可追溯到古希臘時(shí)期。現(xiàn)代意義上的“機(jī)器翻譯”一詞,由古圖拉特(Couturat)和洛(Leau)1903年在《通用語(yǔ)言的歷史》一書(shū)中最早提出。1949年,韋弗發(fā)表了具有廣泛影響力的名為《翻譯》的備忘錄,正式提出了機(jī)器翻譯的思想。直到2006年Hinton提出深度學(xué)習(xí)技術(shù),才為實(shí)現(xiàn)這一目標(biāo)提供了更好的解決途徑。目前的前沿技術(shù)是基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí),其技術(shù)核心是一個(gè)擁有海量節(jié)點(diǎn)(神經(jīng)元)的深度神經(jīng)網(wǎng)絡(luò),可以自動(dòng)地從語(yǔ)料庫(kù)學(xué)習(xí)翻譯知識(shí)。一種語(yǔ)言的句子被向量化之后,在網(wǎng)絡(luò)中層層傳遞,轉(zhuǎn)化為計(jì)算機(jī)可以“理解”的表示形式,再經(jīng)過(guò)多層復(fù)雜的傳導(dǎo)運(yùn)算,生成另一種語(yǔ)言的譯文。
2015年,蒙特利爾大學(xué)引入注意力機(jī)制,使得神經(jīng)機(jī)器翻譯達(dá)到實(shí)用階段。此后,神經(jīng)機(jī)器翻譯不斷取得進(jìn)展。2016年,谷歌GNMT發(fā)布,該系統(tǒng)可模仿人腦的神經(jīng)思考模式,翻譯出與人工翻譯相媲美的譯文。同年,微軟在Switchboard對(duì)話語(yǔ)義識(shí)別達(dá)到人類水平,訊飛上線NMT系統(tǒng),神經(jīng)機(jī)器翻譯開(kāi)始被大規(guī)模應(yīng)用。科學(xué)雜志Nature梳理了2016年科技領(lǐng)域的十大突破,排在首位的就是人工智能,其中提及人工智能的機(jī)器翻譯使錯(cuò)誤減少了約60%。隨后,F(xiàn)acebook的人工智能研究團(tuán)隊(duì)開(kāi)發(fā)了一種新的神經(jīng)機(jī)器翻譯算法,在三種機(jī)器翻譯任務(wù)上得分高于所有同類系統(tǒng)。2017 年,微軟在斯坦福問(wèn)答數(shù)據(jù)集 SQuAD 上達(dá)到人類水平。機(jī)器翻譯的發(fā)展速度遠(yuǎn)遠(yuǎn)超出人們的想象,但是對(duì)于機(jī)器翻譯是否能夠真正完全代替人工翻譯,學(xué)界仍舊爭(zhēng)論不休。
機(jī)器翻譯取代人工翻譯沈陽(yáng)翻譯公司
目前而言,一部分專家認(rèn)為機(jī)器翻譯很快會(huì)達(dá)到人工翻譯水平,在不遠(yuǎn)的將來(lái)會(huì)完全取代人工翻譯。2010年,谷歌機(jī)器翻譯專家歐赫認(rèn)為文本機(jī)器翻譯是合理有效的,真正的挑戰(zhàn)只在語(yǔ)音識(shí)別方面。他提出,未來(lái)幾年即有可能實(shí)現(xiàn)手機(jī)端語(yǔ)音到語(yǔ)音的自動(dòng)翻譯。2019年2月《衛(wèi)報(bào)》刊登《機(jī)器翻譯的時(shí)代是否已經(jīng)到來(lái)》一文,美國(guó)韋弗利實(shí)驗(yàn)室(Waverly Labs)的安德魯·奧喬亞表示“在未來(lái)十到十二年內(nèi),機(jī)器翻譯技術(shù)可與人工翻譯相媲美,甚至超過(guò)人工翻譯的水平”。
專家們對(duì)于機(jī)器翻譯的信心來(lái)自最新一代的翻譯技術(shù)——神經(jīng)網(wǎng)絡(luò)翻譯。神經(jīng)網(wǎng)絡(luò)翻譯打造的機(jī)器翻譯系統(tǒng),采用了一系列新的學(xué)習(xí)手段來(lái)模擬人工翻譯。首先,利用人工智能任務(wù)的天然對(duì)稱性進(jìn)行對(duì)偶學(xué)習(xí)。當(dāng)訓(xùn)練集中的一個(gè)中文句子被翻譯成英文后,系統(tǒng)會(huì)將相應(yīng)的英文結(jié)果再翻譯回中文,并與原始的中文句子進(jìn)行比對(duì),進(jìn)而從這個(gè)比對(duì)結(jié)果中學(xué)習(xí)有用的反饋信息,對(duì)機(jī)器翻譯模型進(jìn)行修正。其次,利用推敲網(wǎng)絡(luò),模擬人們寫(xiě)作時(shí)不斷推敲、修改的過(guò)程。這樣,通過(guò)多輪翻譯,不斷地檢查、完善翻譯的結(jié)果,使翻譯的質(zhì)量得到大幅提升。再次,采用聯(lián)合訓(xùn)練的方法迭代改進(jìn)翻譯系統(tǒng)。用中英翻譯的句子對(duì)去補(bǔ)充反向翻譯系統(tǒng)的訓(xùn)練數(shù)據(jù)集,同樣的過(guò)程也可以反向進(jìn)行。最后,采用一致性規(guī)范讓翻譯可以從左到右進(jìn)行,也可以從右到左進(jìn)行,最終讓兩個(gè)過(guò)程生成一致的翻譯結(jié)果。這一系列技術(shù)有效模仿了人工翻譯的過(guò)程,極大提升了機(jī)器翻譯的整體質(zhì)量。
除此之外,機(jī)器翻譯相關(guān)學(xué)科之間的互動(dòng)更加頻繁,合作更加緊密。翻譯界和技術(shù)界都呈現(xiàn)出了更大的包容性,相關(guān)人士達(dá)成一定共識(shí),即過(guò)去那種把語(yǔ)言學(xué)家排除在外,僅依賴技術(shù)界,埋頭做數(shù)據(jù)、分析開(kāi)發(fā)系統(tǒng)的做法是不可取的。在語(yǔ)言學(xué)和翻譯學(xué)領(lǐng)域,越來(lái)越多的人開(kāi)始關(guān)注機(jī)器翻譯,對(duì)技術(shù)應(yīng)用探索也不再一味抵觸,開(kāi)始從用戶和市場(chǎng)需求的角度來(lái)客觀看待不同層級(jí)和不同受眾的語(yǔ)言服務(wù),計(jì)算機(jī)輔助翻譯在專業(yè)翻譯領(lǐng)域發(fā)揮著越來(lái)越重要的作用。
機(jī)器翻譯技術(shù)仍備受質(zhì)疑沈陽(yáng)翻譯公司
對(duì)于現(xiàn)有的機(jī)器翻譯技術(shù),很多學(xué)者也表示質(zhì)疑。一方面,他們認(rèn)為機(jī)器翻譯的廣泛適用性還有待考察。盡管機(jī)器翻譯在某些測(cè)試中正確率較高,而且在某些領(lǐng)域接近或超過(guò)人工譯員,但是這些測(cè)試只是針對(duì)特定范圍的文本,要想達(dá)到測(cè)試水平,必須滿足對(duì)于源語(yǔ)言和環(huán)境的苛刻要求。在筆譯方面,馮志偉在《機(jī)器翻譯研究》中表示,目前的機(jī)器翻譯系統(tǒng)對(duì)普通文本的翻譯在可讀性和準(zhǔn)確性方面離人們的實(shí)際需求還有相當(dāng)大的距離。機(jī)器翻譯系統(tǒng)對(duì)普通文本的翻譯,通常需要大量的譯后審校工作才能使譯文達(dá)到出版的要求,所花費(fèi)的時(shí)間和費(fèi)用往往會(huì)超過(guò)純?nèi)斯しg。在口譯方面,中國(guó)科學(xué)院自動(dòng)化研究所宗成慶在《機(jī)器翻譯的夢(mèng)想與現(xiàn)實(shí)》中指出,在日??谡Z(yǔ)對(duì)話中,目前口語(yǔ)機(jī)器翻譯僅能對(duì)資源較為充分的語(yǔ)言(如英漢、日漢等),在說(shuō)話場(chǎng)景不是非常復(fù)雜、口音基本標(biāo)準(zhǔn)、語(yǔ)速基本正常、使用詞匯和句型不是非常生僻的情況下,可基本滿足正常交流的需要。
機(jī)器翻譯發(fā)展迅速沈陽(yáng)翻譯公司
語(yǔ)言能力是區(qū)分人類和動(dòng)物的重要特征之一,是人類有效交流的保證。用機(jī)器來(lái)進(jìn)行語(yǔ)言翻譯的想法,最早可追溯到古希臘時(shí)期。現(xiàn)代意義上的“機(jī)器翻譯”一詞,由古圖拉特(Couturat)和洛(Leau)1903年在《通用語(yǔ)言的歷史》一書(shū)中最早提出。1949年,韋弗發(fā)表了具有廣泛影響力的名為《翻譯》的備忘錄,正式提出了機(jī)器翻譯的思想。直到2006年Hinton提出深度學(xué)習(xí)技術(shù),才為實(shí)現(xiàn)這一目標(biāo)提供了更好的解決途徑。目前的前沿技術(shù)是基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí),其技術(shù)核心是一個(gè)擁有海量節(jié)點(diǎn)(神經(jīng)元)的深度神經(jīng)網(wǎng)絡(luò),可以自動(dòng)地從語(yǔ)料庫(kù)學(xué)習(xí)翻譯知識(shí)。一種語(yǔ)言的句子被向量化之后,在網(wǎng)絡(luò)中層層傳遞,轉(zhuǎn)化為計(jì)算機(jī)可以“理解”的表示形式,再經(jīng)過(guò)多層復(fù)雜的傳導(dǎo)運(yùn)算,生成另一種語(yǔ)言的譯文。
2015年,蒙特利爾大學(xué)引入注意力機(jī)制,使得神經(jīng)機(jī)器翻譯達(dá)到實(shí)用階段。此后,神經(jīng)機(jī)器翻譯不斷取得進(jìn)展。2016年,谷歌GNMT發(fā)布,該系統(tǒng)可模仿人腦的神經(jīng)思考模式,翻譯出與人工翻譯相媲美的譯文。同年,微軟在Switchboard對(duì)話語(yǔ)義識(shí)別達(dá)到人類水平,訊飛上線NMT系統(tǒng),神經(jīng)機(jī)器翻譯開(kāi)始被大規(guī)模應(yīng)用。科學(xué)雜志Nature梳理了2016年科技領(lǐng)域的十大突破,排在首位的就是人工智能,其中提及人工智能的機(jī)器翻譯使錯(cuò)誤減少了約60%。隨后,F(xiàn)acebook的人工智能研究團(tuán)隊(duì)開(kāi)發(fā)了一種新的神經(jīng)機(jī)器翻譯算法,在三種機(jī)器翻譯任務(wù)上得分高于所有同類系統(tǒng)。2017 年,微軟在斯坦福問(wèn)答數(shù)據(jù)集 SQuAD 上達(dá)到人類水平。機(jī)器翻譯的發(fā)展速度遠(yuǎn)遠(yuǎn)超出人們的想象,但是對(duì)于機(jī)器翻譯是否能夠真正完全代替人工翻譯,學(xué)界仍舊爭(zhēng)論不休。
機(jī)器翻譯取代人工翻譯沈陽(yáng)翻譯公司
目前而言,一部分專家認(rèn)為機(jī)器翻譯很快會(huì)達(dá)到人工翻譯水平,在不遠(yuǎn)的將來(lái)會(huì)完全取代人工翻譯。2010年,谷歌機(jī)器翻譯專家歐赫認(rèn)為文本機(jī)器翻譯是合理有效的,真正的挑戰(zhàn)只在語(yǔ)音識(shí)別方面。他提出,未來(lái)幾年即有可能實(shí)現(xiàn)手機(jī)端語(yǔ)音到語(yǔ)音的自動(dòng)翻譯。2019年2月《衛(wèi)報(bào)》刊登《機(jī)器翻譯的時(shí)代是否已經(jīng)到來(lái)》一文,美國(guó)韋弗利實(shí)驗(yàn)室(Waverly Labs)的安德魯·奧喬亞表示“在未來(lái)十到十二年內(nèi),機(jī)器翻譯技術(shù)可與人工翻譯相媲美,甚至超過(guò)人工翻譯的水平”。
專家們對(duì)于機(jī)器翻譯的信心來(lái)自最新一代的翻譯技術(shù)——神經(jīng)網(wǎng)絡(luò)翻譯。神經(jīng)網(wǎng)絡(luò)翻譯打造的機(jī)器翻譯系統(tǒng),采用了一系列新的學(xué)習(xí)手段來(lái)模擬人工翻譯。首先,利用人工智能任務(wù)的天然對(duì)稱性進(jìn)行對(duì)偶學(xué)習(xí)。當(dāng)訓(xùn)練集中的一個(gè)中文句子被翻譯成英文后,系統(tǒng)會(huì)將相應(yīng)的英文結(jié)果再翻譯回中文,并與原始的中文句子進(jìn)行比對(duì),進(jìn)而從這個(gè)比對(duì)結(jié)果中學(xué)習(xí)有用的反饋信息,對(duì)機(jī)器翻譯模型進(jìn)行修正。其次,利用推敲網(wǎng)絡(luò),模擬人們寫(xiě)作時(shí)不斷推敲、修改的過(guò)程。這樣,通過(guò)多輪翻譯,不斷地檢查、完善翻譯的結(jié)果,使翻譯的質(zhì)量得到大幅提升。再次,采用聯(lián)合訓(xùn)練的方法迭代改進(jìn)翻譯系統(tǒng)。用中英翻譯的句子對(duì)去補(bǔ)充反向翻譯系統(tǒng)的訓(xùn)練數(shù)據(jù)集,同樣的過(guò)程也可以反向進(jìn)行。最后,采用一致性規(guī)范讓翻譯可以從左到右進(jìn)行,也可以從右到左進(jìn)行,最終讓兩個(gè)過(guò)程生成一致的翻譯結(jié)果。這一系列技術(shù)有效模仿了人工翻譯的過(guò)程,極大提升了機(jī)器翻譯的整體質(zhì)量。
除此之外,機(jī)器翻譯相關(guān)學(xué)科之間的互動(dòng)更加頻繁,合作更加緊密。翻譯界和技術(shù)界都呈現(xiàn)出了更大的包容性,相關(guān)人士達(dá)成一定共識(shí),即過(guò)去那種把語(yǔ)言學(xué)家排除在外,僅依賴技術(shù)界,埋頭做數(shù)據(jù)、分析開(kāi)發(fā)系統(tǒng)的做法是不可取的。在語(yǔ)言學(xué)和翻譯學(xué)領(lǐng)域,越來(lái)越多的人開(kāi)始關(guān)注機(jī)器翻譯,對(duì)技術(shù)應(yīng)用探索也不再一味抵觸,開(kāi)始從用戶和市場(chǎng)需求的角度來(lái)客觀看待不同層級(jí)和不同受眾的語(yǔ)言服務(wù),計(jì)算機(jī)輔助翻譯在專業(yè)翻譯領(lǐng)域發(fā)揮著越來(lái)越重要的作用。
機(jī)器翻譯技術(shù)仍備受質(zhì)疑沈陽(yáng)翻譯公司
對(duì)于現(xiàn)有的機(jī)器翻譯技術(shù),很多學(xué)者也表示質(zhì)疑。一方面,他們認(rèn)為機(jī)器翻譯的廣泛適用性還有待考察。盡管機(jī)器翻譯在某些測(cè)試中正確率較高,而且在某些領(lǐng)域接近或超過(guò)人工譯員,但是這些測(cè)試只是針對(duì)特定范圍的文本,要想達(dá)到測(cè)試水平,必須滿足對(duì)于源語(yǔ)言和環(huán)境的苛刻要求。在筆譯方面,馮志偉在《機(jī)器翻譯研究》中表示,目前的機(jī)器翻譯系統(tǒng)對(duì)普通文本的翻譯在可讀性和準(zhǔn)確性方面離人們的實(shí)際需求還有相當(dāng)大的距離。機(jī)器翻譯系統(tǒng)對(duì)普通文本的翻譯,通常需要大量的譯后審校工作才能使譯文達(dá)到出版的要求,所花費(fèi)的時(shí)間和費(fèi)用往往會(huì)超過(guò)純?nèi)斯しg。在口譯方面,中國(guó)科學(xué)院自動(dòng)化研究所宗成慶在《機(jī)器翻譯的夢(mèng)想與現(xiàn)實(shí)》中指出,在日??谡Z(yǔ)對(duì)話中,目前口語(yǔ)機(jī)器翻譯僅能對(duì)資源較為充分的語(yǔ)言(如英漢、日漢等),在說(shuō)話場(chǎng)景不是非常復(fù)雜、口音基本標(biāo)準(zhǔn)、語(yǔ)速基本正常、使用詞匯和句型不是非常生僻的情況下,可基本滿足正常交流的需要。