NCMEC、Google 與圖像雜湊技術


美國國家失蹤及被剝削兒童中心 (National Center for Missing and Exploited Children,NCMEC) 每年都會收到數以百萬計的網上兒童性虐待內容 (CSAM) 報告。NCMEC 的高級副總裁兼營運總監 Michelle DeLaune 細述機構的發展、科技公司如何參與打撃兒童性虐待內容,以及 Google 的雜湊配對 API。

你可以介紹一下 NCMEC 和你的職責嗎?


我在 NCMEC 工作超過 20 年,親身見證機構的發展,以及關於兒童和兒童安全的挑戰與威脅。我最初是一位 CyberTipline 分析員。

CyberTipline 在 1998 年創立並投入服務,讓公眾人士可以報告懷疑兒童受剝削的事件。當時我們收到一些家長的報告,他們擔心有成人在網上與子女討論不合適的話題;也有人報告遇到包含兒童性虐待內容的網站。後來美國通過一項聯邦法例,要求美國科技公司需要向 CyberTipline 報告自己系統上出現的任何表面屬兒童性虐待的內容。

在早期,我們可能會每週收到超過 100 宗剝削兒童報告。在 2001 年,我們收到首個來自科技公司的報告。轉眼來到 2021 年,我們每天收到約 70,000 宗新報告。部分報告來自公眾人士,但大部都由科技公司提交。

NCMEC 如何幫助網上公司打擊兒童性虐待內容?


目前法例並未要求公司主動採取任何行動。簡單來說,如果公司偵測到或者知道有兒童性虐待內容,他們便必須報告。在過去多年來我們見到 CyberTipline 有重大發展,法定義務其實是背後的一大動力。但在過去五年來,報告數目急劇上升。這種增長源自很多科技公司都自願採取各種措施,主動偵測、移除和報告兒童性虐待內容。

我們在全國失踪及受虐兒童中心進行的其中一個旗艦項目是雜湊共享平台,其中一個面向科技公司,而另一個的對象則為選定的非政府組織。透過非政府組織雜湊共享平台,NCMEC 為有興趣的科技公司提供超過 500 萬雜湊值的兒童性虐待內容資料,這些資料均已經過確認和三重認證,可以協助公司打撃自己網絡上的兒童性虐待內容。包括 Google 在內的大型公司都加入了這個名單,同時採取主動措施,積極在他們的平台上移除兒童性虐待內容。這個名單同時讓其他有聲譽並為兒童服務的非政府組織可以透過 NCMEC 的雜湊平台向科技業界提供自己的雜湊,以嘗試減低科技公司需要分別接觸每個非政府組織的不便。

我們同時提供一個行業雜湊共享平台,讓選定的公司可以互相分享自己的兒童性虐待內容雜湊。我們確保任何願意和有能力主動偵測這些內容的公司都可以獲得所需的全部工具,同時鼓勵公司之間可以共享自己的兒童性虐待內容雜湊。Google 是這個平台的最大參與者,佔名單上總雜湊數目約 74%。

由於我們目前收到的報告量如此驚人,你可以想像到有時候我們會多次收到大量相同的圖像報告。由於公司利用雜湊值來偵測已知的有害內容,所以這種情況完全可以理解,但隨著已知內容增加,能夠識別在網上產生和分享的新內容對 NCMEC 就更加重要。

Google 的雜湊配對 API 幫助 NCMEC 優先處理 CyberTipline 報告。可以告訴我們這個項目是怎樣開始的嗎?


雜湊共享計劃取得空前成功,但同時也帶來了全新的挑戰:報告數量令我們不勝負荷。像 NCMEC 這樣的非牟利機構並沒有足夠的電腦能力來應付這種數據量。因此我們很高興能獲得 Google 的協助,也非常感謝他們幫助建構出雜湊配對 API 工具。

在 2020 年,我們總共收到 2,100 萬宗 CyberTipline 報告,但有時一宗報告可能包含數幅圖像和影片。因此 2,100 萬宗報告實際上包含接近 7,000 萬幅兒童性虐待圖像和影片。很明顯,當中難免有重複的數據,即使 NCMEC 可以輕易偵測完全配對,但仍無法實時和大規模偵測看來相似的配對,從而識別和優先處理從未見過的圖像。我們的工作是識別現正受到性虐待的兒童,因此這項工作非常關鍵。

雜湊配對 API 為 NCMEC 帶來哪些好處?


我們有一項非常重要的任務,就是要在識別到關鍵資料後盡快把資料轉交至執法機關。這套工具的其中一大好處是讓我們可以透過全新方式,為 CyberTipline 報告帶來重大價值。

我們的工作需要逐一審視兒童性虐待圖像和影片,然後加上標籤。例如「屬於兒童性虐待內容」、「不屬於兒童性虐待內容」或「難以識別兒童或個案人士的年齡」。但單在去年我們就需要處理 7,000 萬個檔案,你可以想像我們永遠無法逐一標籤所有內容。這個 API 讓我們可以進行比對。當我們標籤了一個檔案,這個 API 就讓我們可以識別所有看起來相似的檔案,然後即時加上相應的標籤。結果我們能夠標籤超過 2,600 萬幅圖像。

這不但令傳送至執法機關的報告更有價值,以便他們可以優先考慮將會審查哪些報告,同時幫助我們識別從未見過的圖像。那些圖像通常顯示世界某個角落正有兒童受到性虐待。正所謂大海撈針,我們現在要找的「針」就是需要拯救的兒童。Google 的工具讓我們集中找出包含急需協助兒童的圖像。

對於負責處理 CyberTipline 報告和分析兒童性虐待內容的 NCMEC 人工審查員而言,這套工具對他們的心靈健康有何影響?


這套兒童性虐待內容偵測工具減少了職員需要重複審視相同圖像的時間。這些圖像展示兒童受到性虐待,而受虐兒童現在可能已經成年。這些圖像會永遠在網上存在,令受害者持續受到傷害。如果職員能夠標籤圖像,就可以集中處理描繪近期兒童受性虐待的內容,同時移除不法的圖像。

這是我們各位職員的首要工作,大家都想幫助受虐兒童。工具可讓職員無需多次重複看到已知的有害內容,為保持職員心靈健康帶來突破性改善。

這些工作如何幫助科技公司同心合力打撃這類網上內容?


我們知道 Google 向其他公司提供兒童性虐待內容偵測技術,以支持全球打撃兒童性虐待內容,而雜湊配對 API 本身就對 NCMEC 和很多其他公司都有直接影響。當全國中心的程序更加簡潔和有效率,所有科技公司都可得益。現在我們可以更及時地回應和處理 CyberTipline 報告,而這些報告也比未有採用此工具時更有價值。

NCMEC 為科技公司、執法機關、曾經受虐的人士以及其家人提供中央資源。我們以非常獨特的角度來回應問題並思考解決方案。在 CyberTipline 的支持下,我們可以很快掌握新出現以及現時在網上散播的兒童性虐待內容。我們會向執法機構提供這些報告。我們不應忘記,這些工作最終牽涉到現實中的兒童受到受性虐待和剝削。

我們知道有超過 20,000 名被識別出的兒童曾受到性虐待,而他們的受虐經歷會透過影片或圖像永留印記。部分曾經受虐的倖存者仍然是兒童,而部分現在已經成年,他們仍然強烈感受到所面對的持續傷害。因此我們需要盡一切努力來減少這些圖像繼續流傳。

有一點公眾可能未有留意到,就是大家可能會忽略已知的兒童性虐待內容,因為這些圖像被認為已經「過時」或者「再次流傳」。我們持續提醒大家這些都是現實中的兒童,而超過 20,000 位人士正在嘗試走出陰霾並重獲新生。知道 Google 等公司正盡最大努力移除這些代表他們人生最黑暗時期的圖像,對他們來說實在是一大慰藉。

如果你在網上接觸到兒童性虐待圖像或內容,可以向全國失踪及受虐兒童中心 (NCMEC) 或者全球其他合適機關 報告。 

Google 致力打擊網上兒童性虐待和剝削行為,並盡力防止任何人透過我們的服務散播兒童性虐待內容 (CSAM)。你可以透過我們的保護兒童網站Protecting Children website 了解詳情。

探索 Google 如何協助確保人人網上安全。

瞭解我們如何保障更多使用者的網絡安全。

瞭解詳情