一,AI翻譯究竟是不是智能?
大連信雅達(dá)翻譯公司認(rèn)為,AI歸根接底,是一種程序化處理大數(shù)據(jù)的能力。
程序化首先要求有合理的建模,無論是云計算還是神經(jīng)元計算,都是一種迭代了的計算方式,遠(yuǎn)不是最終最高級的建模方法,無論是數(shù)學(xué)的新進(jìn)展,還是腦科學(xué)的新發(fā)現(xiàn),都極易對這一最新方式產(chǎn)生迭代的影響。
而大數(shù)據(jù),尤其是翻譯大數(shù)據(jù),有賴于近20年的數(shù)據(jù)積累,中外各方都積累的大量的中英語料,并通過上述程序化的語言分析比對,實際上包括谷歌微軟百度都能在書面翻譯上達(dá)到相當(dāng)理想的成績,很多參考級別的翻譯都可以通過AI翻譯做個大概,要求不高的話,勉強(qiáng)用用也是可以的。當(dāng)然作為正式商用,還是需要人工校對整理才能交稿。
綜上所述,目前AI翻譯充其量只是大數(shù)據(jù)的利用。高度依賴程序建構(gòu)和語料的精確程度。

二,語音識別技術(shù)是不是智能?
和翻譯一樣,對于計算機(jī)來說,一段音頻的解碼到文字的輸出,也是高度依賴程序建模和語音訓(xùn)練,這些年大數(shù)據(jù)工程師和語音訓(xùn)練師是大熱行業(yè),各大公司都希望自己的技術(shù)能獨(dú)步天下,用的無非也是增加數(shù)據(jù)輸入來提高準(zhǔn)確度;任何一個AI語音識別服務(wù)器集群的受訓(xùn)語音引擎的輸入量都遠(yuǎn)超作為個人的同聲傳譯員,其數(shù)量級可能達(dá)到幾萬倍之多,但是充其量仍然是一個填鴨教學(xué),語音引擎是一個好學(xué)生,但絕對不是一個聰明的學(xué)生。
三,AI同聲傳譯在現(xiàn)階段是什么?
現(xiàn)階段的AI同聲傳譯就是語音識別技術(shù)乘以AI翻譯,為什么是乘以,因為如果語音識別的準(zhǔn)確率是80%,翻譯的準(zhǔn)確率是80%,那么AI同聲傳譯的準(zhǔn)確率只有64%,這還是相當(dāng)理想的狀況,如果遇到口音問題,或者現(xiàn)場音響設(shè)備狀況不佳,甚至是會議內(nèi)容的艱澀,或者發(fā)言稿的用詞高雅,AI恐怕要胡說八道不知所云了。
近些年國內(nèi)各大廠在語料問題上大傷腦經(jīng),努力收編各大語料庫,作為一些老牌的翻譯公司手上的幾億字的中外文對照稿,突然成了香餑餑,開始做起了語料生意,這是值得肯定的,大數(shù)據(jù)躺在那里不會產(chǎn)生價值,可利用產(chǎn)生價值,是好事,一來增加收入,而來降低了AI前期訓(xùn)練的成本。但是這里也蘊(yùn)含了一個風(fēng)險,這些語料的準(zhǔn)確程度如何,語言對的方向有沒有用錯,大量中式英文和蹩腳的英中翻譯是不是也進(jìn)入了AI的大腦?用粗劣的語料能教出一個好的AI翻譯家嗎?一些高精尖的前沿知識,有現(xiàn)成的語料嗎?
最后總結(jié)一下吧,在未來的幾年里,一些大眾化的簡單的會議,再現(xiàn)場音響條件不錯的情況下,AI同聲傳譯在中英方向上會有良好的表現(xiàn)。但是英中部分,由于英文語音識別引擎的問題,各國與會人員口音的問題,表現(xiàn)仍將遠(yuǎn)不能滿足一般會議要求。在專業(yè)性會議及小語種會議上,AI同聲傳譯仍將是笑料一般的存在,未來20年內(nèi)看不到改善的跡象,除非腦科學(xué)結(jié)合量子計算有重大突破。腦科學(xué)和量子計算的結(jié)合是真正的AI,我們這一代人或許可以看到那一天的到來,到那一天,沒有人會再討論翻譯,因為人們打個照面就交流好了,不再有語言的隔閡,世界也真正統(tǒng)一成了全球村,也沒有了各國諸侯的割地自肥,大家討論的恐怕都是長生不老,精神世界的永存吧。