使用者對機器翻譯 (MinT) 服務的看法

這是 MinT 翻譯服務的兩部分更新中的第二部分。 在第一部分中,我們介紹了 MinT 的作用,以及這如何影響翻譯。在這篇文章中,我們將分享志願者使用這項服務的經驗。

譯者表達了對 MinT 的讚賞。他們中的許多人認為 MinT 翻譯的品質比他們以前使用過的其他翻譯服務更好。在引入 MinT 之前,克什米爾語、桑塔利語、通布卡語、薩丁尼亞語等代表性不足的語言一直缺乏機器翻譯服務。以下是三位代表性不足語言譯者的經驗和想法。

  • Iflaq 是克什米爾語母語使用者,自 2020 年起成為維基百科成員,他從志願者的 Facebook 貼文中找到了編輯英文維基百科的靈感。他點擊了志願者帖子中的鏈接,開始了一次關於如何編輯維基百科的學習冒險。最終,他創建了自己的帳戶——使用了一個不尋常的用戶名“511KeV”,意思是五百一十一千電子伏特(適用於物理學中的狀態的名稱)。他從英語維基百科開始了他的編輯之旅。六個月後,他在探索維基百科時發現了克什米爾語維基百科。起初,他沮喪地發現用戶界面包含一些英語訊息,而不是克什米爾語——克什米爾語是印度超過 710 萬人口使用的語言。儘管如此,克什米爾維基百科上的活躍貢獻者很少,而且只有 300 篇文章。

這項發現促使他將注意力從編輯英語維基百科轉向克什米爾語維基百科——當他發現這一點時,他已經紮根於英語維基百科並獲得了擴展的用戶權利。儘管他在上述的維基百科中取得了成就,但他將注意力轉向了克什米爾語言,掌握了翻譯擴展工具,並負責將克什米爾語的維基百科用戶界面從英語翻譯為克什米爾語。隨後,他透過將英語內容翻譯成克什米爾語,在克什米爾語維基百科上提供更多內容。

此外,511KeV同時積極進行外展活動,為克什米爾語維基百科招募更多志願翻譯人員。根據他與新成員合作和翻譯內容的經驗,克什米爾語維基百科貢獻者的翻譯非常耗時——因為如果沒有其他維基百科可用服務的初始機器翻譯支持,而且該語言的代表性不足。他進一步解釋說,他們從頭開始翻譯,沒有在工具中嵌入「詞典」——用作建議克什米爾語單字像其他語言維基百科一樣進行比較、審查和編輯,以最大限度地利用我們的志願者時間。

對於 511KeV 和其他克什米爾語的貢獻者來說,克什米爾語維基百科擁有期待已久的翻譯支援服務 MinT 是一個巨大的安慰——數字說明了一切。社群在短短四個月內就發布了破紀錄的 330 種翻譯,比去年的累積翻譯量減少了 15%。克什米爾語社群公開表示很高興獲得這項寶貴的援助。Iflaq 有效地利用 MinT 作為輔助,在 3 個月內發表了 120 多個不同文章的章節,其中包括Ahmed Raza Khan Barelvi Aziz Hajini的傳記。他樂觀地認為,MinT 的初始翻譯品質將提高到 100% 準確,我們將不得不要求調整翻譯限制以適應改進,並確保譯者在發佈之前仍然對其翻譯進行審查和編輯。

  • Prasanta Hembram 的用户名稱是 Rocky 734,是印度奧裡薩邦的翻譯志願者。儘管桑塔利語在全球擁有 760 萬語言使用者,但其維基百科專案上只有3388 篇文章。為了解決這一差距,Prasanta 自 2019 年以來一直使用內容翻譯工具將文章從英語翻譯成桑塔利語。 

在過去的幾年裡,桑塔利語的機器翻譯是志願者社群最需要的軟體功能之一。長期以來,Prasanta 使用的翻譯服務品質低劣和繁瑣——需要手動複製、貼上、事後檢查。 

最後,維基媒體基金會在四個月前部署了 MinT 翻譯服務,桑塔利語維基百科是最早使用該服務的維基百科社群之一。Prasanta 目前已使用 MinT 翻譯服務翻譯了大約 200 篇文章,包括有關地點、植物和傳記的文章。MinT 翻譯服務幫助他加快了將文章翻譯成桑塔利語的過程。他對簡單句子的整體翻譯品質印象深刻——儘管這在翻譯複雜句子方面沒有那麼有效。與他合作過的其他志願者翻譯同時注意到翻譯科技主題仍然很困難,並希望這項服務不僅適用於英語作為原始語言的維基百科文章。總的來說,MinT 的創建是向前邁出的重要一步。桑塔利語維基百科的幾乎所有主要貢獻者都在使用 MinT 以及最近發佈的章節翻譯工具。他希望 MinT 能夠繼續改進,並且使用翻譯服務的文章數量將增加一倍。他分享道:「我們非常感謝開發人員用我們的語言創建機器翻譯工具。我們從未想過能夠使用這樣的工具,我們非常感謝他們的工作。」 

桑塔利語維基百科的月度翻譯記錄,同比 [source of the image]
  • Adrià Martin是一位維基媒體成員,在加州州立大學長灘分校教授翻譯技術。在他的教學中,他向大學生介紹內容翻譯工具,並鼓勵他們將翻譯保存在個人沙箱中,以便後續審查和發佈。他的工作重點是加泰羅尼亞語和薩丁尼亞語翻譯。Adrià 過去曾與一個為薩丁尼亞語言創建機器翻譯系統的團隊合作,當有人向他發送通過網絡測試 MinT 的鏈接時,他感到非常興奮; 「當時,我正在指導一篇博士論文,我使用 MinT 將一些統計內容從義大利語產生了薩丁尼亞語的機器翻譯; MinT 的翻譯工作非常出色。」Adrià解釋。 

他尚未在內容翻譯工具中使用 MinT 支持,但他經常在個人工作中使用測試實例。他讚揚了加泰羅尼亞語和薩丁尼亞語所取得的卓越翻譯質量,並強調了該工具支持更廣泛的語言對的能力;考慮到薩丁尼亞語資源不足和缺乏普遍接受的標準化語言模型所帶來的挑戰,這一點尤其值得注意。此外,薩丁尼亞語的書寫方式多種多樣,為開發該語言的語言技術帶來了複雜的挑戰。

您可以透過存取任何語言的維基百科、translatewiki.net上的Special:ContentTranslation或直接在測試實例中開始使用 MinT。

請在此頁面上追蹤維基媒體基金會語言團隊的 MinT 翻譯計劃,並透過訂閱語言團隊的季度通訊來了解最近發生的事情。如果您對 MinT 有疑問,請隨時在專案討論頁面上提問。