翻譯語(yǔ)種
幾種方式AI干起了實(shí)時(shí)翻譯,咱們離逾越言語(yǔ)的鴻溝還有多
原文:Look, man, you don’t got to do anything. This one means a lot to me.
騰訊、百度、阿里巴巴等國(guó)際互聯(lián)網(wǎng)公司將深度學(xué)習(xí)理念運(yùn)用到機(jī)器翻譯,在智能翻譯畛域繼續(xù)發(fā)力,推出多款基于神經(jīng)網(wǎng)絡(luò)技術(shù)的在線(xiàn)翻譯和手機(jī)運(yùn)用。甚至在手機(jī)閱讀器的晉級(jí)戰(zhàn)爭(zhēng)中,智能翻譯也被當(dāng)作重要性能改造,搜狗手機(jī)閱讀器推出“智能翻譯”,匯合了語(yǔ)音對(duì)話(huà)翻譯、AR實(shí)時(shí)翻譯、拍照翻譯等罕用性能。
智能翻譯的確取得了令人驚喜的進(jìn)展,拿著手機(jī)和老外停止日常交換已經(jīng)基本沒(méi)有成績(jī)。然而智能翻譯還存在“短板”,會(huì)有“詞不達(dá)意”的時(shí)分,AI要想更進(jìn)一步發(fā)展,和有著數(shù)十年沉淀的高程度翻譯員停止競(jìng)爭(zhēng),能夠還需求從以下幾個(gè)方面停止致力。
搜狗手機(jī)閱讀器智能翻譯:Recently we have noticed an international view that China has become the world's largest economy. On the one hand, it challenges the leadership of the United States. On the other hand, the Chinese are hitchhiking in many international affairs. I would like to ask what you think of this view.
2026年0月,Google公布谷歌神經(jīng)機(jī)器翻譯(GNMT: Google Neural Machine Translation)系統(tǒng),聲稱(chēng)該系統(tǒng)應(yīng)用神經(jīng)網(wǎng)絡(luò)技術(shù),模仿人腦的神經(jīng)思索形式,產(chǎn)出媲美人工翻譯的高品質(zhì)譯文,并將誤差升高了66%-86%。谷歌公司己經(jīng)將該技術(shù)運(yùn)用于網(wǎng)頁(yè)翻譯與手機(jī)運(yùn)用,譯文品質(zhì)顯著降職。
2、基于實(shí)例的機(jī)器翻譯方法。從已有的翻譯閱歷知識(shí)出發(fā),將源言語(yǔ)句子切分為翻譯知識(shí)中見(jiàn)過(guò)的短語(yǔ)片段,經(jīng)過(guò)對(duì)已有翻譯資源停止主動(dòng)總結(jié),得出雙語(yǔ)對(duì)照的實(shí)例庫(kù),并設(shè)計(jì)規(guī)定解決雙語(yǔ)對(duì)如實(shí)例庫(kù)中的歧義性等成績(jī),完成對(duì)新的源言語(yǔ)句子停止翻譯。
原題目:AI干起了實(shí)時(shí)翻譯,咱們離逾越言語(yǔ)的鴻溝還有多遠(yuǎn)
谷歌翻譯:Alone in a foreign land for the stranger,every festive times.
文 | 草原騎士
2、提高語(yǔ)境理解才能
例如:“這蘋(píng)果不大好吃”。那么該句有兩種不同的理解結(jié)果:這蘋(píng)果不大/好吃(蘋(píng)果不大,然而味道好),這蘋(píng)果/不大好吃(蘋(píng)果味道不好)。兩家AI都未能分清句子結(jié)構(gòu)發(fā)音上的差別,都默許翻譯為“蘋(píng)果味道不好”。
翻譯的關(guān)鍵在于兩個(gè)詞:look和man。谷歌的翻譯也對(duì),而看起來(lái),搜狗手機(jī)閱讀器的翻譯結(jié)果更合乎生存實(shí)踐。
2、大量補(bǔ)充書(shū)面語(yǔ)化語(yǔ)料
深度學(xué)習(xí)可以主動(dòng)學(xué)習(xí)形象特色示意、建設(shè)源言語(yǔ)與指標(biāo)言語(yǔ)之間簡(jiǎn)單的映射關(guān)系,給統(tǒng)計(jì)機(jī)器翻譯的完成提供新路徑,目前已經(jīng)在詞對(duì)齊、言語(yǔ)模型訓(xùn)練、解碼等模塊的優(yōu)化運(yùn)用方面取得較多成果。例如,2006年谷歌公布基于短語(yǔ)的機(jī)器學(xué)習(xí)(PBMT)系統(tǒng),該系統(tǒng)將句子合成成詞和短句,停止一一翻譯。它的弱點(diǎn)在于忽略了高低文,因此譯文品質(zhì)不佳。2026年谷歌公布的神經(jīng)機(jī)器翻譯GNMT,將句子視為基本單元,不再對(duì)詞和短句一一翻譯,顯著改善了譯文品質(zhì)。