韓文生成式AI——Wrtn實測紀錄及ChatGPT的影響力(2023年底)

2023-09-4

這篇文章將分成兩個部分:

  1. 介紹韓文生成式AI——Wrtn及使用體驗、提供譯者和韓文學習者使用靈感

  2. ChatGPT 雜談:跳轉〈ChatGPT的影響力〉 ,這裡將會寫到目前在學校和業界的觀察


韓文生成式AI——Wrtn實測紀錄

在去年底和今年初分別寫了〈ChatGPT 會不會取代翻譯工作〉,以及〈繼續玩一下ChatGPT〉


當時主要是用韓文來實測,想知道ChatGPT除了英文之外,對其他語言的理解程度在哪裡。當然事後也知道,這類生成式AI事前也需要用大型語言資料庫(LLM)來學習,相對於英文的龐大資訊量,ChatGPT在其他語言的運用上當然是相對不足了。

最近又發現了韓國新創企業Wrtn的生成式AI,決定來試一下,看它能不能幫忙理解比較抽象難懂、需要當地知識的文字。

Wrtn:念作 Written 뤼튼

首先我遇到的難題經常是網路上及字典都查不到的用法,這個以前會問認識的韓國朋友,但總不能總是詢問,如果生成式AI有能力幫忙解析文字就很有幫助。

Wrtn的技術來源

根據Wrtn的報導,Wrtn的AI結合了GPT-4 (實際上使用也可選擇GPT3.5模型)、Naver Hyper Clova及自家的語言模型,是韓國第一個推出文字AI Plugins的公司,同時也有桌面板和Mobile版App,從網站上來看,也有跨足企業合作的野心,預計應該會推出chatbot或企業版的其他功能。

基於以上技術背景,詢問Wrtn時它也會說明自己不是純翻譯ChatGPT的答案喔!試用之後也會發現它說的沒錯,在韓文生成上感覺比ChatGPT更為流暢。

開始之前——生成式AI的限制

1. 資料時間:

但首先生成式AI的極限在於它是學習了某個時間點之前的資料,所以對於考證流行語想必不太有用。

在正式使用Wrtn之前我就先詢問它On檔電視劇下一集會有哪些角色出場,果然它先很誠懇地解釋了自己學習過的資料庫時間,後方又跟一般的生成式AI一樣耍嘴皮子了一番,說它猜測故事的開展會是主要人物將持續登場,故事將涉及他們之間的矛盾、戀愛、友情等各種人際關係,此外因劇情需要也可能會有其他人物登場……

從簡單的小測驗,就知道我們不能用Wrtn來驗證事實(和ChatGPT一樣)



2. 可能會出現與事實不符的資訊

呈上,在Wrtn的對話框上直接標示了警語,提示這個AI和ChatGPT一樣只是「生成語言」,並不具事實考證。

3. 只能根據提供的段落判讀資訊

生成式AI需要靠對話中給出的更多資訊來判讀內容、生成內容,如果缺乏上下文脈絡,很有可能判讀錯誤。


實作——用於幫助原文理解

在有上述的限制之後,我決定這次的測試策略是拿我已經略知內容的文句來拷問它:

PS: 寫這篇文的時候,我預設讀者可能都能多少閱讀一些韓文,也希望這篇文主要幫助韓文學習者或韓文譯者,因此翻譯會較為簡略 ><。

其中我最想了解的是Wrtn能不能幫忙解析文字背後的意義。我所選用的章節包含了某種暗喻,因此雖然可以根據字面上的意思直譯,但因為中文中並沒有相似的形容,直譯將失去語感,因此與其直譯,或許更需要找到有著類似暗示的俗諺或比喻來描寫。

選用的直譯內容為「光想就很卑微,更不用說這是一個跨越很多橋,還有很多後患跟來的常見故事」

我也請Wrtn將節錄章節翻譯成英文和中文。對我來說,Wrtn翻出的段落先不論精確度,我先注意到的是這樣的解釋不夠止癢

因為這本來就是很抽象的文學字面,翻譯出來的中文和英文也只能說是中規中矩。

*Wrtn給出的英中文翻譯。


但是我本來的目的並不是要它翻譯,而是希望它給出更詳細的說明,因為知道明確的意思和用例可以給我一些更好的翻譯靈感,解救一時文字枯槁的我

於是繼續問下去,這次直接要它解體比喻的內涵是什麼,以及文中為什麼要「過橋」呢?又有什麼「後患」呢。

這次答案給得更詳細,它說明「翻橋」本來就是韓文中常見的比喻,意指經過很多階段換來結果,因此全文是在說明「在好幾個階段帶來的後果之下,還可能招致預期不到的後患」。

到這裡我覺得對了解語意已經蠻足夠的了,剩下的就是譯者的功夫了,尤其是已經看過全篇的譯者,如果剛好只在這裡卡住,應該就有辦法往下翻去了。

詢問Wrtn關於這個比喻的細節以及出處

最後再小小驗證它一下,丟給它一個中文翻譯問它這樣翻好不好。

我覺得這裡更直接顯示了Wrtn的理解能力。它直接解釋給出的中文翻譯和部分原文意義一致,但是因為某方面沒有翻出來,應該再更具體,並且點出了為什麼覺得提示的中文翻譯有所偏誤。

身為知道前後文在說什麼的人,心知這樣的測試相當不公平,但是Wrtn給出了相當出色的答覆,也符合上下文脈。

提供中文翻譯,請它確認是否符合原文意義


Wrtn文字改寫,以及可以怎麼幫助韓文學習

我想學語言最困難的就是輸出了吧,輸出之後能不能找對人來改也是一個問題,這是我覺得生成式AI所帶來的最大便利。

這次我請它幫忙修正文法、拼寫,雖然忘了請它順便看띄어쓰기(韓文分寫),但它也改好了。另外同時也請它就這同樣內容改寫一篇。

用兩篇比較就能學習到更多自然的用法,我覺得這對練習韓文寫作應該會很有幫助。

*請Wrtn幫忙修正文法,同時請它以自然的語調來改寫(但是好像這邊分寫就出現了一點錯誤,보려之後應空格) *


Wrtn 商業用途

這是我目前覺得最驚喜的部分,Wrtn目前也有很多實用的商業功能,例如只要輸入貼文主題、貼文類型(活動消息、新產品介紹、團購、贊助廣告),就能自動生出貼文。

利用Wrtn生成IG貼文

除此之外也能生成各大平台廣告文案、業務及會議邀請等Email草稿、履歷自介、徵才廣告、Youtube短影片劇本、部落格文章,用途非常廣泛。

因為給出了分門別類的框架,和ChatGPT相比就不用再去費心打一串提示詞(prompt),非常貼心!


Wrtn 著作權聲明

至於這些Wrtn產出的文字是否可以拿來商用呢?Wrtn給出的說明非常明確:

由Wrtn生成的作品的版權歸誰所有?

版權和使用權歸用戶所有,可用於個人和商業目的。惟使用生成文字所引起的問題也應由用戶承擔。

Wrtn生成的作品由哪些資訊組成?

Wrtn每一次皆會根據用戶輸入的內容生成新的句子,生成的文本可能會基於已學習的資訊,但與其原始資訊(data)完全一致或和搜索引擎結果中出現相同文字的機率相對較低。

Wrtn生成的作品內容可信嗎?

生成的結果將優先考慮用戶輸入的內容,但在生成句子的過程中有時可能會包含與事實不符的訊息,在使用生成的文字時,建議您驗證其與事實的關係。

Wrtn的著作權聲明


Wrtn實測小總結

Wrtn所使用的韓文學習筆數比ChatGPT還多,可謂韓文專用生成式AI。從公司活動上來看也有往日本發展的野心,很期待能看到未來在日文圈的發展。

除此之外Wrtn也有AI Studio可供個人需求架設AI,並不需要寫任何code,對不懂coding的人來說是一大利多。

目前缺點是文字生成速度和ChatGPT相比稍嫌緩慢(推薦使用GPT3.5版模組,速度較快),以及生成內容偶爾也會看見一些錯誤,不過相信這些小問題都會逐步被排除。

比較好奇的還是Wrtn未來的商業模式,從目前網站架構,暫時可看出應該還先著重於商業營利,或許也會推出訂閱制,我自己覺得Wrtn如果可以依用戶需求推出不同feature捆包的訂閱,會很有潛力。

Wrtn介面連結:


ChatGPT的影響力

ChatGPT無論是在大眾討論或是我的生活裡,都浸染得越來越深。經歷一番大規模的「公測」之後,很多人都有了定論,很多負面的評論像是:

  • 「ChatGPT都在隨口瞎掰,不要用。」

  • 「ChatGPT寫出來的英文文章長得都一樣,用的詞都是那幾個,自己寫的反而更好,不懂為什麼有人要用。」(英文好的人更是特別這樣說)


學校

然而實質上在MBA的下半年,真的非常容易看到ChatGPT的蹤跡,上課討論老師問了問題,總是有人想用來「測測」看ChatGPT的實力(包括我)。也說真的,如果是定型的財務題目,又問得正確,ChatGPT是真的有能力直接產出實用解答,問題還是在於:

所以我們有沒有能力判別。

後來對我來說測試自己有沒有能力判別答案真偽才是一個功課。


很多同學也不是用來生成作業,而是用來潤英文稿、用來改寫、補述,或者給出初稿大綱。ChatGPT的感染程度在學校中是如洪水般的,回想它真正開始普及的時間,恐怕沒有幾個月。

而且其實大家都心知肚明,只要不是下這種要生成式AI直接產出內容的指令:「請幫我寫關於○○的600字論文」,而是自行寫過草稿再請ChatGPT修正語法錯誤,那些只能用近似程度(Similarity)來抓作弊的系統根本沒辦法辨識。

於是從道德層面,一個人想要學到哪裡、想要做到什麼真的都全憑良心了。

而現在歐美學校也非常認真檢討生成式AI的影響,就我就讀的學校,除了在下半年已經導入了辨識作業是否由AI產出的系統,據傳也會改變更多評鑑方式,改採現場限時考試而非交作業,這對未來大學院校學生顯然會是個衝擊。


求職

今年求職時最大的感受是ATS (Applicant Tracking System)以及LinkedIn搜尋功能的使用真的非常廣泛,身為非母語者,要配合每份JD(Job Description) 來調整履歷首先是一件非常耗時而且回報很低的事,所以ChatGPT被用來使用的頻率又更高,未來不排除會進入ATS和ChatGPT的鬥法時代。

最好用的功能同樣也不是請ChatGPT直接寫,而是請它幫忙配合JD內容抽換CV詞面,像是「drive the ecommerce strategy」,在JD可能會出現「manage online store strategy」之類的,就可以一次請ChatGPT修改。

當然這也是雙面刃,首先也需要閱讀的人有能力分辨ChatGPT寫的對不對,再者就是自己有沒有能力寫出一樣的詞彙和文法,然後ChatGPT用久了也會發現它在同一領域的字庫也未必很有創意就是了。


翻譯

經過幾個月,我覺得生成式AI在業界的衝擊還並非是AI真的取代了譯者的工作,而是想試試水溫的有心人士變多了。

除了開始洽詢AI潤稿的案子變多以外,更有人AI之名開始嘗試調降翻譯稿費。本來譯案薪資本來就很少因為通膨因素上漲,十年來如一日了,這個狀況比起AI是不是真的取代譯者這個問題還要嚴重,我總感覺,這是提早把有心從事翻譯的人趕出業界,未來三五年內將沒有訓練新譯者的空間,因為連本來最簡單、低價的譯案都無法支撐新進譯者的生活了。

同時已有翻譯公司已著手配合〈國家科學及技術委員會——行政院及所屬機關(構)使用生成式AI參考指引草案〉 ,以保護智財權及客戶機密、避免造成侵權等相關原因,要求譯者不得將翻譯文件上傳到生成式AI平台。

各方面都動得很快,但就不知道實務上能夠執行的層面有多遠多深了。

我還是覺得AI大概還是沒辦法那麼快取代譯者,尤其是具備專業知識、受過紮實訓練的譯者。但同時也產生另一個疑惑:未來我們要如何引導翻譯人材入行,甚至留住他們呢?

(畢竟我也為了生計早早就只剩下半隻手了。)

還有,人真的有可能分辨文字是否由AI產出嗎?同款AI的生成文字看久了的確是能從用字和結構看出端倪,AI在沒有指定風格的情況下文風還滿固定的。

但是翻譯呢?

看過很多媒體平台為求快速產製的新聞翻譯,有時候真的很難說人翻得比AI好,那些講求速食需求的工作,也很難再有什麼崇高理想要求人為翻譯了吧。


但是無論如何,AI越強,自己聽得懂和寫得出來的成就感就越大,辨識得出來AI寫錯時更有種學習沒有白費的爽快感,這是什麼都比不上的。


*延伸部落格文章:


—告訴我你的想法—



如果不希望留言刊登在這個頁面,也可以利用下方表單,留言將會寄到我的信箱,有任何想法或建議都歡迎在下面留給我知道 謝謝 :)