看板 C_Chat
未來科技一定能更好且淘汰,本質上就是很愚蠢的循環論證。 簡單說,人類翻譯會面臨的問題,不代表模型就能解決。 那麼我們就舉一個成語例子: Jemandem einen Bären aufbinden. 你直接問模型的話,例如,翻譯為繁體中文:Jemandem einen Bären aufbinden. 你會得到一個:「對某人胡說八道」 或 「騙人/編故事騙人」的翻譯。 那正確性呢?事實上除非你懂德文,你不會知道這個翻譯到底省略了什麼。 所以你也只能接受這種翻譯結果,那麼我們來看其他的語言翻譯: ok,那麼這次我們用德文翻譯為英文看看: To pull someone's leg. 嗯,拉某人的腿,意思是扯後腿嗎? (其實是開玩笑,它保留了開玩笑的語境) 那你就會陷入很常見的翻譯陷阱:語義偏離。(Semantic Bleaching) 不過要理解這點,我要先公布答案。 Jemandem einen Bären aufbinden 這句話直接翻譯是:給某人綁上一隻熊。 所以這句俚語的語境是:我把某人綁在一隻熊上了。 但常理而言,這聽起來就是很荒誕的騙人玩笑,所以德翻中實際上是捨棄了 讓你想像笑點的「我要把你綁在熊上」的玩笑畫面,直接告訴你意義。 而且每次生成的意思,受制於大語言模型本身的特性,它會有一定的隨機性。 所以你會看到英文比較偏向害人扯後腿的解讀。 然後如果是像網飛那樣,只是便宜行事來節省成本,先統一把原文翻譯為英文。 才從英文翻譯為其他語言,那語意捨棄與偏移的程度就會更大,最後只剩下開玩笑。 理論上來說,最好是全部針對原文客製化的翻譯。 但實際上會面臨資料集的不平均,也就是英語系資料偏多,因為它通常是常用語。 所以在多語言的大語言模型中,你躲不掉會以英文為向量座標原點翻譯的偏移。 同樣的狀況你其實應該很常見了,就像模型回答經常會回答"質量"而非"品質" 這種基於中國用語資料為居多,而造成原因又大多是資料集免不了直接幹別人文章 再用簡繁轉換的內容農場,資料早就被中國用語汙染了。 所以回答偶而會有這種看起來很不悅的語意偏移。 以英為尊來作為翻譯的座標之力的模型,就會造成更顯著的負面效果。 的確你不能說他錯,翻譯的輪廓還在,但裡面的語境,也就是玩笑的笑點消失了。 「那只是現在未來技術一定能解決阿」 首先你要理解一個事實,你現在看到的語言翻譯,模型的運作原理用猴子都能懂得解釋 就是把它變成一種向量座標,然後單純的翻轉(Mapping)找最接近的目標語言。 你可以想像把概念對折試圖找到最接近的點。 但問題是,不同語言不見得能完美對齊,必定會有因為不同文化/時空語境下的差異。 所以模型實際上只能妥協,捨棄了綁你綁在熊上的玩笑,而直接告訴你胡扯。 而與其在微弱的「德-中」直接路徑上冒險,因為樣本稀疏對折找不太到。 不如先跳到眾多的「德-英」空間,先對折一次,再對折成「英-中」 這就會導致模型翻譯結果不可避免地帶有「英文偏移濾鏡」。 原本翻譯的譯者是可以自己的語言專業,在潤飾校稿,來拉回有語境的翻譯。 但如果你都把人類砍了,那這基本上無解,你等於是自己把人工校正的途徑砍了。 我認為作品有濃厚的歷史背景,有時空和語言差異下,原本還可以靠人工校正, 但因為省錢砍掉的話,那可見的未來就不是翻譯更好,反而是可預期翻譯網飛化。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.159.43.11 (泰國) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1774879087.A.D95.html
x2159679: 對AI擁護者來說不存在語言專業就是了 03/30 22:00
tonyxfg: 但即使是人類來翻,也要翻譯者精通該俚語才翻得出來吧? 03/30 22:01
tonyxfg: 他如果只是普通懂,那一樣只是照字面意思翻譯而已。 03/30 22:01
efun77000: AI那個問題還是AI唬爛你也沒能力判斷 03/30 22:02
efun77000: 人類翻譯也是一樣,他唬爛你讀者也看不知道 03/30 22:04
Chricey: 有人用過中醫針灸治療關節痛的嗎?效果如何? 03/30 22:04
vsepr55: AI仔也不看好嗎,直接叫AI總結就好== 03/30 22:05
vsepr55: AI寫劇本->AI翻譯->AI懶人包,AI仔完美世界 03/30 22:07
labbat: 以前翻譯還要上網考究,現代AI都自動幫忙我爬蟲比對翻譯了 03/30 22:10
sudekoma: 結局也就「用的AI不夠好」和「再找人工校對就好」兩種 03/30 22:10
Kroner: 吃過關節保健品,都沒什麼效果,有推薦的牌子嗎? 03/30 22:10
shinchen: 這篇講的問題其實現在人翻譯也存在 因為德翻中的人難找 03/30 22:10
shinchen: 所以實際遊戲公司找翻譯還是要過德翻英跟英翻中兩層 03/30 22:11
sudekoma: 校對給酬會比翻譯低,只是找來輔助AI的酬勞還會更低 03/30 22:11
sudekoma: 就不要期待拿香蕉皮能請到猴子了 03/30 22:12
Chricey: 看到有人提到關節痛,我就想到有一篇UC2推薦的文章 03/30 22:12
shinchen: 更偷懶的就連日翻中這種很多人會的也要過一層英文 03/30 22:12
sezna: 網飛一堆不拿日翻中,要過兩層的給你英翻中 03/30 22:13
rxsmalllove: 這件事遲早變成在意的人也不多www 03/30 22:13
foxey: 前陣子看到一個研究說Z世代依賴網路知識學習能力已經退化 03/30 22:14
Kroner: 樓上UC2當糖吃,天天走拿飛 03/30 22:14
sudekoma: (′・ω・`)原來現在介意的人算多嗎 03/30 22:15
foxey: 再來的網紅短影音世代還有AI世代應該會把高低差拉更大吧 03/30 22:15
greydust: 可是pull someone's leg意思不是扯後腿啊... 我是不懂德 03/30 22:15
greydust: 文但按你這篇來看 英文和中文翻譯的語境並沒差太多 03/30 22:16
Kroner: 有人知道UC2和其他關節保健品的差異嗎? 03/30 22:16
對啦,我這邊有寫錯,我主要的意思是: 德翻英:把某人綁在熊上 → 拉某人的腿 (玩笑語境存在) 德翻中:開玩笑(捨棄語境) 那為何會這樣,這是因為模型實際上會面臨多次語言翻譯後,轉譯後語境喪失的問題。
rxsmalllove: 咦?算吧 現在有只剩少數知識分子在取暖了嗎?應該 03/30 22:16
rxsmalllove: 還沒吧 03/30 22:16
foxey: AI強在他亂講你要是沒相當知識當背景根本看不出來 03/30 22:16
foxey: 然後錯誤就會扶正 正確的變錯的 03/30 22:16
Kroner: 關節痛按摩有效嗎? 03/30 22:16
foxey: 當多數人都信以為真 有問題的是知道錯的那邊 03/30 22:17
kimokimocom: AI仔會跟你說現在不行明年可以 03/30 22:19
kimokimocom: 明年不行五年內可以 五年不行十年內可以 03/30 22:19
greydust: 雖然這篇講的沒錯但例子很有問題 你這個例子看起來反而 03/30 22:21
Chricey: 樓下關節痛都吃鞏固力 03/30 22:21
greydust: 像是人類翻譯拿到英文文本寫to pull someone's leg, 然 03/30 22:22
greydust: 後自以為是扯後腿的意思才翻錯的 至少我試了幾個AI, 都 03/30 22:23
KyHZ56: 在意的人一直都很多 只是越來越懶得嘴罷了 03/30 22:23
greydust: 能正確地翻譯出是捉弄/胡鬧某人的意思 03/30 22:23
Kroner: UC2推薦?有人試過嗎?靠譜嗎? 03/30 22:23
Cishang: AI要準確就要丟人力物力資源去建立資料庫阿 不是讓AI亂抓 03/30 22:23
Cishang: 一通就可以的事 03/30 22:23
greydust: 我是很難想像這種會寫在字典裡面的片語AI會弄錯, 如果是 03/30 22:24
greydust: 網路用語還比較有可能AI會隨便唬爛 03/30 22:24
Chricey: 關節痛按摩有效嗎? 03/30 22:24
修正錯字與贅字。 ※ 編輯: midas82539 (98.159.43.156 泰國), 03/30/2026 22:28:00
greydust: 至於你說的語境問題 中文的捉弄本來就有玩笑的語境了 03/30 22:26
x2159679: Z世代學習能力退化尊督假督,現在網路學習不都很方便嗎 03/30 22:26
M820Scorpion: 因為語言是活的,只懂得照抄跟它是相反的面向 03/30 22:30
tonyxfg: 說學習能力退化的論點,聽過笑笑就好,因為每個舊世代都 03/30 22:33
Kroner: UC2神招啊,吃下去就對了 03/30 22:33
tonyxfg: 認為沒用原本方法學習的新世代學習能力下降了,都認為一 03/30 22:33
tonyxfg: 代不如一代,但現實是不是這樣……還真不見得。 03/30 22:33
speed7022: 不太懂這篇想說啥,"人工翻譯還有一戰之力"嗎? 03/30 22:33
OEC100: 以後這是校閱的事,薪水也不一樣 03/30 22:34
Kroner: 有人知道UC2和其他關節保健品的差異嗎? 03/30 22:34
henry1234562: 這篇重點一開始就說了 人工翻譯的問題模型不能解決 03/30 22:35
henry1234562: 模型翻譯只有快 但翻譯要遇到的問題一個不少 03/30 22:36
henry1234562: 而少了人工去潤飾 直接用必然就會顯得粗糙 03/30 22:36
yamis: 我能理解你的意思,但是翻成中文該如何翻?找一個有能替代 03/30 22:37
Chricey: 求推薦UC2,樓下請提供三家 03/30 22:37
yamis: 的俚語還是照意義翻?像銀魂的桂與假髮和gay ,有些人喜歡 03/30 22:37
yamis: 原意有些不懂日語諧音的喜歡gay 03/30 22:37
Peurintesa: 這個問題人工也會有 問題在資方願意花多少錢翻更好 03/30 22:41
guogu: 你這問題跟用不用AI沒關係啊... 03/30 22:44
Kroner: 關節痛這種東西靠UC2就對了 03/30 22:44
midas82539: ...天啊,我就是要說明這問題用不用AI都會碰到阿 03/30 22:45
speed7022: 所以呢? 用還是不用AI? 03/30 22:47
lucky0417: 既然都會遇到 那幹嘛不用AI 03/30 22:48
midas82539: 偷換概念成用或不用AI有意義嗎?如果一個問題用不用 03/30 22:48
Chricey: UC2推薦?有人試過嗎?靠譜嗎? 03/30 22:48
midas82539: AI都會碰到,那麼應該是保留翻譯工作來做為校正的空間 03/30 22:49
midas82539: 而不是反過來把職位砍掉,因為問題並沒有解決 03/30 22:49
lucky0417: 阿原文都強烈反對了 二選一你選有求必應的AI還是意見一 03/30 22:50
lucky0417: 堆的翻譯 03/30 22:50
Chricey: UC2神招啊,吃下去就對了 03/30 22:50
speed7022: 只有"他"被解雇,你實際上不知道有沒有保留職位給其他 03/30 22:52
speed7022: 人校正或是他們公司的作業流程阿 03/30 22:52
midas82539: 原文第一段就說很清楚了,你扎一個稻草人反駁沒有意義 03/30 22:55
speed7022: 工三小扎草人,這件事情已經由官方公布了嗎? 03/30 22:56
Kroner: 關節痛有沒有辦法完全根治啊?UC2聽起來像萬靈丹 03/30 22:56
Lupin97: 小看仰賴AI的現代人適應積非成是的能力惹,翻譯語境的落 03/30 22:57
Lupin97: 差我在乎、但大眾不一定在乎=.= 03/30 22:57
speed7022: 一個尚未證實就聽信片面的言論,你就確定真實了? 03/30 22:57
pride829: 所以這句話是什麼意思 03/30 23:04
Chricey: 看到關節痛,我就想起我姨媽 03/30 23:04
qazw222: 太小看資料庫的廣泛 03/30 23:15
caryamdtom: 可怕的是大眾不在乎,然後久了這些語意差異、背後的 03/30 23:37
caryamdtom: 文化背景就被遺忘了 03/30 23:37
DICKASDF: 我覺得看錯差異吧 從成本來說 的確是更好不是嗎 03/30 23:48
Kroner: 有人知道如何處理關節痛嗎?求分享! 03/30 23:48
DICKASDF: 要麻是翻譯爛但大家慢慢習慣 成本比請人好很多 03/30 23:49
DICKASDF: 要麻是未來還真有進步可能 這兩個情況不是 03/30 23:50
DICKASDF: 至於說文化的= = 有多少比例的人真在意他國文化 03/30 23:50
DICKASDF: 尤其有些還是屬於方言文化 比如台語 原住民語 03/30 23:51
Chricey: 5樓關節跟X一樣 03/30 23:51
z900215ro: 這篇是在表達專業翻譯懂比較多,臭ai 怎麼那麼笨?ai 03/30 23:51
z900215ro: 也能學習啊? 03/30 23:52