包括維基百科在內的每一個大型網站均面對惡意機器人的攻擊——這種情況在現今的網絡上不只沒有改善,反而越來越嚴重。維基百科需要更強大的工具來抵擋惡意的自動化(包括人工智能驅動的)活動。維基媒體基金會在四月時寫了一篇文章,討論如何保護我們的基礎架構,避免網路數據抓取過度使用維基媒體內容作為訓練資料。在這篇文章中,我們將討論一種新的方法來保護維基媒體,防止惡意的機器人進行一般為人類準備的活動,例如建立帳號和編輯。
為此,我們正在維基百科上試用一項新的機器人檢測服務。我們將首先將其應用於帳戶創建,之後可能會擴展到保護編輯或其他敏感操作。
我們的目標是奠定基礎,更好地防禦自動化破壞行為,例如英文維基百科在七月處理的大規模詞彙替換事件,以及我們在三月處理的類似自動化帳戶接管事件。我們同時希望更好地防範可能更改內容或影響志願者社群維護誠信和建立共識流程的自動化傀儡。
這項新的機器人檢測服務將取代我們目前的驗證碼 (CAPTCHA),這是一種由軟體產生的基本「輸入單字」視覺拼圖,可追溯至 2000 年代。簡而言之,這個系統來自較早的網路時代,無法抵擋現代人工智慧支援的攻擊者。我們同時收到許多回饋,表示目前的驗證碼對於人類使用者來說太難使用了。
我們將試用的服務是hCaptcha,這是一家專注於機器人偵測的第三方服務。他們特別關注隱私敏感型客戶,包括 Signal 和許多其他網路服務,這使得他們非常適合維基百科。
在本次試用中,我們將觀察 hCaptcha 在阻止或減緩機器人驅動活動方面的表現,以及這程式如何幫助人類更輕鬆地使用維基百科。
我們希望在此坦誠地告訴大家,此次試驗將涉及將維基百科直接與第三方專有服務整合。這對維基媒體來說是新事物——作為維基媒體基金會,我們對此深感重視。然而,在這個時代,我們自己建構一項能夠保障專案安全的服務並不現實。致力於運行機器人檢測服務的組織擁有比我們更多的專業知識和資源——尤其是每年不斷變化的機器人檢測和規避的「貓捉老鼠」遊戲。
我們始終以最注重隱私的方式經營維基百科,這幫助我們避免了現代網路中常見那種隨意的資訊共享和線上追蹤。為了履行這項承諾,我們已將其設定為:hCaptcha 無法查看訪客的原始 IP 位址,同時無法查看正在執行的特定操作或正在存取的 URL。任何在機器人檢測過程中收集的存取設備信息,hCaptcha 將在 10 天內丟棄。
總而言之,這是一個提升維基百科可訪問性和安全性的機會,同時謹慎地限制對用戶隱私的影響。以下是一些技術細節:
- 與我們目前的驗證碼 (CAPTCHA) 不同,採用這種新方法,該服務將主要以隱形方式運作。大多數訪客(約 99.9%)根本不會看到需要解決的謎題。
- 對於那些看到謎題的訪客,他們需要完成謎題才能建立帳戶。這些謎題是視覺謎題,但對於有視力障礙或其他無障礙需求的用戶,我們提供文字謎題,僅使用鍵盤即可完成。
- 該服務將傳回一個「風險評分」,即使用者對該帳戶是否由虛假使用者建立的置信度。此風險評分不會公開,但會私下保存,以便維基媒體基金會和志願者調查人員分析並應對潛在的機器人驅動活動。
- 訪客 IP 位址不會被傳送到該服務——所有對服務的請求均會透過我們自己託管的代理伺服器進行,該代理伺服器會丟棄原始 IP 位址,並使用雜湊版本。
- 我們從服務載入的程式碼將被沙盒化,使其無法查看或干擾使用者會話的頁面內容,而且服務同時無法查看頁面的特定 URL。
- 請參閱我們的專案頁面以了解更多技術細節。
我們同時打算將從中獲得的機器人檢測數據整合到我們提供給可信賴的志願調查員的工具中,以應對傀儡及其他虛假活動。這是我們今年在安全保障上更廣泛努力的一部分,目的是在維基媒體專案中建立更多的反濫用訊號和工具,您將在我們的近期公開計劃中看到其中一些想法。
從未來幾週開始,在接下來的幾個月裡,我們將分析機器人如何與維基百科互動,確保 hCaptcha 不會意外地增加維基百科的使用難度,並確定我們可以採取的任何進一步的隱私和安全措施。我們將審查這些分析,並在決定是否擴大使用 hCaptcha 來取代我們現有的驗證碼 (CAPTCHA) 之前,與社群公開討論試驗的進展。
我們將在整個過程中與社群保持溝通。我們感謝迄今為止提供直接回饋的志願者,他們幫助我們塑造了隱私模型和技術實施。我們將隨著這項工作的進展分享更新資訊——請在我們的專案頁面上分享您的想法,並訂閱我們的團隊時事通訊以保持聯繫。
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation