close
科技專欄

ChatGPT vs 專業翻譯:質量相若,效率千倍,成本十萬分之一

約一年前,我在台北萬華區的木咖 cafe 跟許明恩聊天,他問到對區塊勢進一步發展的意見。我的看法是區塊勢以個人品牌與價值主導,無論是增加寫手還是接受業配都不合適,建議明恩把文章翻譯成英語,發展海外市場。那是既能保持自媒體的純粹,又能增加一個全新發展維度的「低掛果實」。

自視過高固然不該,但妄自菲薄亦不見得好,台港總是滿足於舶來品,看好萊塢電影,讀翻譯書,有時會低估了自身作品的質量和價值。其實兩地不少優秀作品,只是被文化、語言壁壘、市場慣性和銷售通路等因素限制,才被侷限於本地市場。區塊勢便是一例,其文章質量已經處於世界水平,放到英語市場毫不遜色,只是為了專注才一直活在巴別塔。

我雖然及不上明恩,但畢竟也是個認真耕耘的文字工作者,早就想翻譯自己的作品,可惜多年未能成事。然而,最近 ChatGPT 終於讓我扚起心肝,實現多年願望。即日起,我已經做到接近同步發表每週文章的英文版:

ChatGPT vs Professional Translation: Comparable quality, a thousand times more efficient, and one-hundred-thousandth the cost

Google、DeepL 與 ChatGPT 大比併

AI 翻譯毫不新鮮,運作多年的 Google Translate 早已相當不俗,而專注於翻譯的 DeepL 則更勝一籌。但我一直還沒利用 AI 翻譯作品,除了因為懶惰成性,那總是差一點點的質量,才是讓我卻步的主因。

ChatGPT 的關注度已經夠高,我不想進一步神化它,事實上 AI 以至其他科技的發展都是慢慢積累,就算真的有一個爆發點,也不是 ChatGPT 一蹴而就,而是 AI 技術持續改善到剛超過臨界點的結果。

Google Translate、DeepL 和 ChatGPT 翻譯普通文句的質量大同小異,比較的意義不大,因此我選了一些帶廣東話和潮語,難度特別高的段落,去說明三者的差異。

左膠的自省:NFT 書難以理解,是因為沒能打破「魚蛋論」定律

跟作家朋友 Alice 電郵拜年,雙方道賀也閒聊,自然地聊到 NFT 書。Alice 說「弱弱一問,咁買 NFT 書得到嘅係咪即係個唔同款嘅封面……」

這句話非同小可。首先,「弱弱一問」等同此地無銀,當一個問題真的很弱,提問者才不會加上這個前言。

ckxpress.com


Zuojiao’s introspection: NFT books are difficult to understand because they failed to break the law of “fish egg theory”

Emailed New Year’s greetings with writer friend Alice, both congratulated and chatted, and naturally talked about NFT books. Alice said, “A weak question, so what you get when you buy an NFT book is a cover of a different style…”

This sentence is no small matter. First of all, “weak and weak question” means that there is no money here. When a question is really weak, the questioner will not add this preface.

Google Translate


Left glue’s introspection: NFT books are difficult to understand because they fail to break the law of “fish egg theory“

When I emailed Alice, a writer friend, to congratulate her and chat, I naturally talked about NFT books. Alice said, “I’m sorry, but the NFT book I bought is a different cover ……”.

This is a very important statement. First of all, “weak question” is the same as having no money here. When a question is really weak, the questioner will not add this preamble.

DeepL

左膠:Google 乾脆投降用拼音;DeepL 翻譯成「left glue」🫠

弱弱一問:Google 的「a weak question」未免太 Chinglish,DeepL 的「I’m sorry」就自然得多。但當「弱弱一問」第二次出現,兩者都用了不一樣的翻譯,語境出錯,而 Google 的「weak and weak question」更是讓人啼笑皆非。

此地無銀:Google 的「there is no money here」和 DeepL 的「having no money here」理論上都沒有錯,但外國人肯定看不懂就是。

且看 ChatGPT 的表現:

Self-reflection of the leftists: The difficulty in understanding NFT books is due to the failure to break the “fish-egg theory” law

During my New Year’s email exchange with writer friend Alice, we naturally talked about NFT books. Alice asked, “Can I ask if buying an NFT book is like getting a different cover?”

This statement is not insignificant. Firstly, “Can I ask” is equivalent to “I don’t have much to contribute here.” This indicates that the question is not trivial.

ChatGPT

「左膠」翻譯成 leftist,不知翻譯達人有沒有更好的建議,至少我是想不到了。「弱弱一問」變成了「Can I ask」有點輕,但也很自然,說不定英語裏面的確沒有更能對應的說法,畢竟「弱弱一問」可算是潮語了。不知是運氣還是實力,片語第二次出現時同樣翻譯成「Can I ask」,正確表達語意。

難度最高的「此地無銀」被巧妙地避開了,按語境改寫成「I don’t have much to contribute here」,算是很不錯。

唯一讓我有點失望的,是始終沒能看到「魚蛋」正確翻譯成「fish ball」,漠視了香港文化。

總體而言,ChatGPT 給我的感覺是像一個能把整段文字的意思消化,再以英語寫出來,而原有的 AI 翻譯工具則比較「斷詞取義」,尤以 Google 為甚。

上週我小試牛刀,以 ChatGPT 翻譯了〈Solution looking for a problem 作為創業路徑〉一文,其中一段特別能說明以上的觀察。文中談到麥兜與麥太,當 Google 把麥太慘不忍睹地翻譯成「Mai Tai」,DeepL 翻譯成稱得上正確的「Mrs. Mak」,ChatGPT 竟然懂得翻譯成「McDull’s mother」,煞是有趣。

有興趣進一步了解的,不妨把以下一小段文字放到各種翻譯工具,留言分享你的觀察:

麥嘜漫畫有這樣一個小故事。麥太問麥兜,為甚麼總是吃很多飯。心地善良的麥兜說,吃得飯多就有力氣,就可以幫別人打開瓶子了。

十萬倍的成本差距

打了強心針,我再走一步,找 ChatGPT 幫我翻譯兩本著作。

托開源社群的福,我從 github clone 了 bilingual_book_maker,設好環境,就把整本《區塊鏈社會學:金錢、媒體與民主的再想像》丟給 gpt-3.5-turbo API 翻譯。

因為不知道需要運行多久,我特意深夜三點臨去睡之前才執行,以為就讓它慢慢運行多個小時,睡醒再查看,結果卻是我一直盯著屏幕,觀察翻譯的質量,還沒睡著,1 小時 4 分 55 秒後,十萬字就翻譯好了,而且全部文句通順,可用率有 99%,只有少量錯處,大部分是名字。然後我查看成本,不得了,只需 0.33 美元。

我再以同一方法,翻譯了約 8 萬字的《所謂「我不投資」,就是 all in 在法定貨幣》,質量相若,這次花了 1 小時 36 分 43 秒,成本 0.36 美元。

相比起來,傳統的人工翻譯,需時一個月算是快吧,還沒算上雙方溝通,釐清原文意思等工夫。至於成本,傳統翻譯的中等價位約每字 1.2 港元(4.5 台幣),換言之翻譯《區》需要廿多萬港元,成本是 AI 翻譯的十萬倍。我完全沒有專業翻譯員開天殺價的意思,他們的確需要花大量時間和精力,然而一本書帶給我的收入只有幾萬港元,平均每字收入不到 0.4 港元(1.5 台幣),就算我分毫不要全用作翻譯,也遠遠負擔不起市場價。客觀結果是,世界上的絕大部分作品,都沒有獲翻譯的福分,而 AI 馬上要改變這一點。

AI 與人工翻譯的成本和效率差距實在太大,AI 製造失業論肯定又要登場了。半生修為一夜之間被機器輕鬆取代實在恐怖,社會務必關注。不過樂觀地看還有另一個可能性,當 AI 翻譯的質量足夠好,被翻譯的文本將會是昔日的千倍甚至萬倍,雖然 99% 工序改由 AI 處理,但餘下 1% 對「工人智能」的需求,說不定比現在整個翻譯市場還要大得多。

說來說去,無論是何種專業,面對 AI,要不就善用它,要不就要有實力達到連它都去不到那 1% 的境界,才有機會免於被淘汰。

AI 翻譯臨界點已經來臨

我不確定坊間「AI 奇點已經來臨」的說法是否言過其實,但可以肯定的是,作為一個用 ChatGPT 翻譯科普文本的作者,它的質量已經超越了我要求的合格點(至少是翻譯成英文而言),速度足以讓我同步發表,成本更是低得無話可說。

說時遲那時快,執筆之際,剛收到 OpenAI 題為「GPT-4 is here」的郵件,馬上切換到 GPT-4 模型,再把以上段落翻譯一次,結果標題被翻譯為:

Self-reflection of the Leftist: NFT books are hard to understand because they fail to break the “Fishball Theory” law

GPT-4

我最期待的畫面出現了。

高重建

高重建

The author 高重建

Founder of LikeCoin & #decentralizehk