近年來AI技術的應用成果似乎喜憂參半,但巨頭們大張旗鼓的行動卻無法掩飾對這項技術的看好,而AI技術的落地越來越傾向普惠性也讓不少細分領域得以枝繁葉茂,比如翻譯。2006年,谷歌推出在線翻譯APP;2012年,有道翻譯官上線;2013年,百度上線安卓版翻譯軟件;2015年,微軟上線正式版翻譯應用;2016年,騰訊上線翻譯君……
AI的繁榮以及對AI的渴望讓巨頭們至今熱情不減。比如最近牛津大學出版社與搜狗達成合作,為其輸送牛津詞典相關內容;百度聯合攜程推出WIFI翻譯機;谷歌翻譯于去年重返中國市場等。
目前的翻譯排頭軍有國內的百度、科大訊飛、網易有道、搜狗等,國外則有谷歌、Facebook、微軟等,而且各家目前的翻譯技術都在日益精進。事實上,巨頭扎堆翻譯領域與翻譯技術的進化以及商業化潛力密切相關。
技術是硬實力,也是硬道理
谷歌早在2016年便推出可商業部署的神經系統機器翻譯(NMT),而且當時準確率可達86%,另外谷歌在去年年底還宣布在中國北京成立谷歌AI中心,其AI翻譯的技術或將在不久后取得新成果。
再看國內,百度于2015年便在百度翻譯APP上線了NMT系統,而且在2017年的百度世界大會上也秀了一次中英雙語同聲傳譯,同時李彥宏還介紹其準確率能夠達到95%,足見百度在AI翻譯技術的改善上也是孜孜不倦;網易有道也在去年5月上線了NMT技術,雖然來得有些晚,但卻絲毫不影響加固自己在翻譯賽道上的護城河。
而AI翻譯技術的進步離不開不斷的學習,以谷歌的AI翻譯學習過程為例,據悉其系統使用人類監督的神經網絡,首先需要比較平行文本,即以前由人類翻譯過的書籍和文章,其次再通過比較這些平行文本中的大量數據,從而學習任意兩種指定語言之間的對等關系,并獲得在它們之間快速轉換的能力。
可以看出,AI翻譯技術的進化是以大量學習資料為前提的,簡單來說可以是缺哪兒補哪兒,而好的數據資料就像優質的教育資源一般,能夠培育出優質的AI學生。
進擊的巨頭加上此起彼伏的NMT技術革新,成為了AI翻譯領域的常態。依靠大量人工翻譯的結果文本,翻譯技術才能夠不斷在吸收和學習中提高翻譯的準確率,比如騰訊在最近的一次與中外翻譯公司的合作中提到的時政與專業類別翻譯由于受特定語境的影響較大,也是AI翻譯技術一直渴望攻克的難點。而中外翻譯公司的人工翻譯文本相當于一個營養源,不斷喂食騰訊的機器翻譯技術,幫助其進一步完善和強化自身的學習能力。
一邊是近乎100%準確率的人工翻譯,一邊是尚不完美、嗷嗷待哺的機器翻譯技術,用數據喂養技術的訓練方式是否最終會讓后來者騰訊的AI翻譯技術實現彎道超車,需要拭目以待。
就以上幾個案例來看,翻譯能力的進化過程本質上就是AI技術的進化,通過給技術喂養各種翻譯數據,從而使其習得越來越接近于人工翻譯的水平。總的來說,就技術層面而言,在翻譯領域的AI可以代表一定的技術實力,這也是AI時代各巨頭愿意扎根這一領域的直接原因,打好了技術基礎,就有能力面對后AI時代的“刀山火海”。