-
“你打籃球像蔡徐坤”:微信翻譯這個(gè)bug是怎么回事?
關(guān)鍵字: 微信翻譯蔡徐坤打籃球bug吳亦凡
硅星人認(rèn)為,微信應(yīng)該進(jìn)一步、更加詳細(xì)地告知我們:這個(gè)bug為什么會(huì)出現(xiàn),由哪些因素所導(dǎo)致。
一方面,微信翻譯背后的技術(shù)確實(shí)比較復(fù)雜。解釋它,有助于用戶去理解它的工作原理,明白這個(gè)翻譯結(jié)果的背后,可能有著十分復(fù)雜的技術(shù)原因。
另一方面,你關(guān)掉了"you are so"句式,還會(huì)出現(xiàn)學(xué)校簡稱;關(guān)了學(xué)校簡稱,還會(huì)有更多會(huì)觸發(fā)bug的詞被發(fā)現(xiàn)。發(fā)現(xiàn)一次關(guān)一次?這樣傷害的是正常使用翻譯功能用戶的體驗(yàn),長此以往總不是辦法。
遺憾的是,微信方面表示,以上面微博為準(zhǔn),不再更多置評(或許是因?yàn)椴幌肜^續(xù)惹惱蔡徐坤的粉絲吧。)同時(shí),中文互聯(lián)網(wǎng)上完全找不到針對此事靠譜的技術(shù)解答,即便在知乎上,相關(guān)主題下面也都是用戶在分享自己發(fā)現(xiàn)的bug截圖,沒有人解釋原因。
既然這樣,不妨讓硅星人來試試?
我們采訪了多位機(jī)器學(xué)習(xí)專家,并在接下來的篇幅里 1)解釋微信翻譯用的到底是什么技術(shù);2)再嘗試回答"you play basketball like caixukun" 這句話,為什么在微信翻譯里被翻錯(cuò)了。
微信翻譯用的是什么技術(shù)?
硅星人經(jīng)過多方面了解,確信微信英漢互譯系統(tǒng)采用的是目前機(jī)器學(xué)習(xí)領(lǐng)域比較火的“神經(jīng)機(jī)器翻譯”(Neural Machine Translation, 簡稱 NMT) 技術(shù),由微信AI團(tuán)隊(duì)自研。
從外行人的角度來看,NMT在翻譯一句話時(shí),做了這些事情:
Step 1: 在一定程度上模仿人腦的思維方式,NMT根據(jù)一個(gè)單詞在整個(gè)句子(可以是長句)當(dāng)中的語境,為這個(gè)單詞建立一個(gè)神經(jīng)網(wǎng)絡(luò)的模型,形成一個(gè)語義表示。
比如單詞是英語的 dog,可以理解為NMT在它的“大腦”里形成了一條狗的印象。
Step 2: 按照在句子甚至段落中的語境,將模型重新轉(zhuǎn)化成另一種語言。
比如 dog 翻譯成法語就是 “l(fā)e chien”;但如果語境是“一條狗生下了小狗”,那么 dog 就會(huì)被翻譯成陰性的"la chienne"。
(NMT不是真的在大腦中形成狗的視覺印象,事實(shí)上整個(gè)過程跟圖像完全沒有任何關(guān)系。這個(gè)所謂的“印象”,通過一連串向量 (vector) 表示。狗的例子來自于 Microsoft Translator [1])
NMT的主要優(yōu)勢是對長句子(甚至段落)有著不俗的翻譯能力,閱讀起來上下文連貫程度接近人翻。問世之后,NMT 也逐漸被微軟、Google、百度、騰訊等大公司的翻譯產(chǎn)品所采用。
“機(jī)翻技術(shù)一直在不斷迭代更新,以前基于規(guī)則,過去十年主要基于統(tǒng)計(jì),現(xiàn)在我們開始用神經(jīng)網(wǎng)絡(luò)。神經(jīng)機(jī)器翻譯是目前機(jī)器翻譯上比較火的一項(xiàng)技術(shù)。我們絕大多數(shù)的大語種翻譯已經(jīng)基于這個(gè)技術(shù)了,“在美國一家頂級(jí)科技公司的研究分支擔(dān)任資深研究員的王夏*告訴硅星人。
”在機(jī)翻技術(shù)發(fā)展的每個(gè)階段,科研人員都會(huì)遇到一些問題。NMT也存在一些問題,比如整個(gè)過程的可解釋性是非常低的,”他說。
硅星人翻譯一下這句話的意思:在具體案例的層面上,一個(gè)NMT的系統(tǒng)為什么會(huì)把一句話 ABCDE 翻譯成 abcde,研究者目前是很難將翻譯過程解釋清楚的。
這句話為什么被翻錯(cuò)了?
當(dāng)NMT翻錯(cuò)了的時(shí)候,可能發(fā)生了哪些情況?
其實(shí)錯(cuò)沒錯(cuò)、錯(cuò)誤嚴(yán)重不嚴(yán)重,都是人來決定的。在機(jī)器眼里沒有對錯(cuò),選定的答案就是機(jī)器認(rèn)為概率最高或最有可能的那個(gè)答案,因?yàn)橐磺卸及凑漳P?、算法運(yùn)轉(zhuǎn)著。
接受這一點(diǎn),你才能理解這句話為什么翻錯(cuò)。
接下來進(jìn)入正題
- 原標(biāo)題:“你打籃球像蔡徐坤”:微信翻譯這個(gè)bug是怎么回事?
- 責(zé)任編輯:程北墨
- 最后更新: 2019-03-07 10:26:12
-
中國頁巖氣單井日產(chǎn)量創(chuàng)新高
2019-03-07 07:28 能源戰(zhàn)略 -
蘋果供應(yīng)商曬折疊屏大招:正研發(fā)可折玻璃
2019-03-06 21:38 蘋果新“品” -
去年我國研發(fā)經(jīng)費(fèi)支出近2萬億元,比上年增11.6%
2019-03-06 21:03 科技前沿 -
只差一塊錢,小米9和iQOO到底誰更香?
2019-03-06 17:41 手機(jī) -
中國存儲(chǔ)器能否打破海外壟斷?
2019-03-06 17:29 TMT觀察 -
-
小米盧偉冰總結(jié)魅族Note 9:遺憾還在繼續(xù)
2019-03-06 17:06 -
三星正研發(fā)兩款折疊屏手機(jī),一款類似華為Mate X
2019-03-06 16:22 大公司 -
去年全球智能手機(jī)出貨量減少5.1% 北美銳減13.2%
2019-03-06 14:57 手機(jī) -
觀點(diǎn):提速降費(fèi)與5G使能兼顧 運(yùn)營商如何兼顧
2019-03-06 13:30 -
格力手機(jī)3代上架官網(wǎng) 售價(jià)3600元
2019-03-06 13:22 -
動(dòng)工在即!華為要用100億打造上海青浦研發(fā)基地
2019-03-06 12:14 大公司 -
“夜視眼藥水” 治色盲有戲
2019-03-06 11:14 -
最新報(bào)告:萬億研發(fā)經(jīng)費(fèi),中國都花在哪兒了?
2019-03-06 10:28 科技前沿 -
蘋果iPhone XI配置曝光:三攝、水下模式、黑暗模式
2019-03-05 20:10 手機(jī) -
中國空間站安排上了!將首次向國際開放
2019-03-05 19:30 航空航天 -
銷量不佳,iPhone再次全網(wǎng)瘋狂降價(jià)
2019-03-05 18:23 手機(jī) -
張小龍請回答:微信這些功能是咋想的?
2019-03-05 14:27 TMT觀察 -
英特爾與紫光展銳5G情斷,2大關(guān)鍵因素露餡
2019-03-05 13:49 TMT觀察 -
紫光展銳自主研發(fā)的春藤510是一款怎樣的5G芯片?
2019-03-05 13:37 科技前沿
相關(guān)推薦 -
“搶奪中國主導(dǎo)地位,美國快走火入魔了” 評論 66無語!不讓來硬來,還拿中俄做借口 評論 226最新聞 Hot
-
“我們很快會(huì)看到中國救援隊(duì),而美國卻不見蹤影”
-
離大譜!美防長“迷惑行為”再+1
-
“搶奪中國主導(dǎo)地位,美國快走火入魔了”
-
丹麥忍無可忍,“怎么說話呢!”
-
尹錫悅“最后一搏”?文在寅被控涉嫌受賄遭檢方傳喚
-
《自然》調(diào)查:超75%在美科研人員想“run”
-
果然,“歐盟沒硬起來”
-
美國達(dá)美航空一客機(jī)與軍機(jī)差點(diǎn)又撞……
-
美準(zhǔn)空軍部長:中國留給我們的時(shí)間不多了…
-
無語!不讓來硬來,還拿中俄做借口
-
美軍飛行員怒了:這是要害死我們!
-
新協(xié)議更狠!“烏克蘭將變成美國的殖民地…”
-
哥大臨時(shí)校長將辭職
-
“他在華直播6小時(shí),美國人發(fā)現(xiàn)自己被騙了”
-
回流美國?美車企集體沉默“裝死”:先讓子彈飛一會(huì)兒
-
普京強(qiáng)硬表態(tài),點(diǎn)了英國
-