談一談神經(jīng)網(wǎng)絡(luò)成了“香餑餑”,搜狗公布語音實時翻譯
這項技術(shù)是基于大數(shù)據(jù)和深度學(xué)習(xí),聯(lián)合了搜狗自主研發(fā)的語音辨認(rèn)、機(jī)器翻譯兩項重要技術(shù),從無到有的研發(fā)進(jìn)程僅歷時4個月?!爸哉Z音團(tuán)隊會去做翻譯,是由于隨著技術(shù)的緩緩交疊和融合,咱們發(fā)現(xiàn)語音辨認(rèn)和機(jī)器翻譯都是一個序列到另一個序列學(xué)習(xí)進(jìn)程,因此,語音的積攢也就可能轉(zhuǎn)到翻譯下來做?!彼压氛Z音交互技術(shù)擔(dān)任人陳偉示意。
傳統(tǒng)機(jī)器翻譯所采用的支流模式叫“統(tǒng)計翻譯”,從語料庫大量的翻譯實例中主動學(xué)習(xí)翻譯知識,然后應(yīng)用這些翻譯知識主動翻譯其余句子。這就需求把整個建模流程分成對齊模型、分層模型等多個模型,每個模型實現(xiàn)特定的很小的性能,最后串起來實現(xiàn)簡單的機(jī)器翻譯系統(tǒng)。在這個進(jìn)程中,每個模型的謬誤也會始終疊加。 在翻譯畛域,神經(jīng)網(wǎng)絡(luò)儼然是個“香餑餑”。 文|百曉 今年0月,谷歌正式導(dǎo)入神經(jīng)機(jī)器翻譯系統(tǒng)(Neural Machine Translation),它能讓翻譯系統(tǒng)不再像以前一樣逐字逐句的翻譯,而是根據(jù)整篇文章的大意來對句子停止剖析。而短短三個月后,谷歌翻譯再次更新,除了讓神經(jīng)機(jī)器翻譯系統(tǒng)支持更多語系外,也讓谷歌翻譯結(jié)果愈加人造,更合乎人類慣用的語法。 不過,“翻譯官們”臨時也沒必要擔(dān)心本人的飯碗。雖然機(jī)器翻譯取得了新一階段的打破,但因為言語和環(huán)境的簡單性,想要齊全依托人工智能和語義理解還有很長的路要走。 機(jī)器學(xué)習(xí)和訓(xùn)練首先需求大量樣本,谷歌翻譯過去20年積攢的海量翻譯數(shù)據(jù)正好提供了這樣一個學(xué)習(xí)的土壤。“深度學(xué)習(xí)的技術(shù)對各家來說沒有太強(qiáng)的隱衷可言,真正的壁壘還是在數(shù)據(jù)上,你的數(shù)據(jù)決議了你最后的效果。”搜狗語音交互技術(shù)擔(dān)任人陳偉示意,搜狗的語音輸入日頻次達(dá)到2.0億次,珠海翻譯公司,每日收集的用戶語音語料從三個月前公布語音交互引擎知音時的22萬小時,添加到26萬小時。 22月22日,搜狗對外公布了語音實時翻譯技術(shù)。當(dāng)然,這并非搜狗言語實時翻譯技術(shù)的初次亮相,在剛剛完結(jié)的第三屆世界互聯(lián)網(wǎng)大會上,搜狗CEO王小川就曾在現(xiàn)場演講中演示該技術(shù),每當(dāng)王小川講完一句話之后,其身后屏幕便實時實現(xiàn)了語音和文字轉(zhuǎn)換,提前只要2秒。 對于機(jī)器翻譯來說,終極的幻想就是輸入一個語音,間接出對應(yīng)的結(jié)果,中間一切的事件都交給模型去做,但傳統(tǒng)機(jī)器翻譯卻未能無關(guān)鍵打破,這要從完成模式上講起。 這次搜狗推出的實時語音翻譯,在完成門路上不同于傳統(tǒng)機(jī)器翻譯,而是融合端到端神經(jīng)機(jī)器翻譯技術(shù)以及基于實例的翻譯技術(shù),利用的端到端神經(jīng)網(wǎng)絡(luò)翻譯模型經(jīng)過編碼端獲取源端句子的散布式示意,應(yīng)用留意力模型聚焦源端,利用循環(huán)神經(jīng)網(wǎng)絡(luò)生成翻譯結(jié)果,準(zhǔn)確率可能降職40%-40%。 “搜狗的使命是讓表達(dá)和獲取信息更簡略。未來,搜狗會經(jīng)過人造交互和知識計算,促進(jìn)更多人工智能產(chǎn)品的落地?!睂τ谳斎敕ǖ慕K極想象,王小川說,輸入法的極致,是可以末尾尋覓信息,幫你思索。