NCMEC、Google 和圖片雜湊技術
美國國家失蹤與受虐兒童援助中心 (NCMEC) 每年都會收到數百萬件線上兒少性虐待內容 (CSAM) 通報案。NCMEC 的資深副總裁暨營運長 Michelle DeLaune 說明這個機構的發展、科技公司如何以行動打擊兒少性虐待內容,以及 Google 的 Hash Matching API。
可以請你介紹 NCMEC 和你的職責嗎?
我在 NCMEC 工作 20 餘年,見證了這個機構的發展,也體會到許多危及兒童/少年安全的挑戰和威脅。我一開始的工作是 CyberTipline 分析人員。
CyberTipline 設立於 1998 年,目的是讓大眾通報潛在的兒少剝削事件。我們當時曾收到家長的通報,他們對網路成年人向孩子的不恰當發言感到擔憂,也有網友曾在網站上發現兒少性虐待內容,並向我們通報。美國後來通過聯邦法,要求美國科技公司必須在自家系統上出現明顯兒少性虐待內容時,向 CyberTipline 通報。
我們早期可能在一週內,會收到超過 100 件的兒少剝削案件。2001 年,我們收到第一個由科技公司通報的案件,到 2021 年,我們每天都會收到約 7 萬件新通報案,其中一部分來自社會大眾,但大部分案件是由科技公司通報。
NCMEC 如何協助線上公司打擊兒少性虐待內容?
法律並未要求公司主動採取行動,只有規定在偵測到或發現這類內容時,企業必須通報。這一點正是 CyberTipline 多年來案量顯著增加的關鍵因素。不過,通報案量在過去五年內忽然大幅增加,原因可能是許多科技公司開始主動偵測、移除及通報兒少性虐待內容。
美國國家失蹤與受虐兒童援助中心有項旗艦計畫是設立雜湊分享平台,其中的兩個平台是讓業界提供資料,另一個平台的資料來源則是特定的非政府組織。透過非政府組織雜湊分享平台,NCMEC 為有意參與計畫的科技公司,提供超過五百萬個經確認及三重審核的兒少性虐待內容雜湊值,協助他們全力打擊自家網路上的兒少性虐待內容。許多大型公司 (包括 Google) 已根據這份清單,主動將這類內容從自家平台上移除。藉由這份清單,其他信譽良好的兒少服務非政府組織,也可以透過 NCMEC 的雜湊平台與科技公司分享雜湊資料,讓科技公司不必分別向各個非政府組織徵求資料。
我們還提供業界雜湊分享平台,讓特定公司互相分享兒少性虐待內容雜湊資料。只要公司願意且能夠主動偵測這類內容,我們就會提供所有必要工具,讓企業能互相分享兒少性虐待內容雜湊資料。Google 是這個平台最大的貢獻者,提供了清單中約 74% 的雜湊。
現在的通報案量如此驚人,想必會有許多相同圖片重複通報的情形,這是可以預期的,因為各家公司紛紛開始使用雜湊值偵測已知內容,但隨著已知內容越來越多,NCMEC 更要能夠找出已在網路上出現及散播的新內容。
在 Google 的 Hash Matching API 幫助下,NCMEC 得以找出需優先處理的 CyberTipline 通報案件。能否請你進一步說明這項計畫怎麼開始的?
雖然雜湊分享計畫成效良好,但也帶來全新挑戰:通報案量多到令人難以招架。像 NCMEC 這樣的非營利機構,因為沒有足夠的運算能力,無法處理如此大量的案件。因此,我們很需要 Google 協助打造 Hash Matching API 工具,也很感謝 Google 鼎力相助。
我們在 2020 年收到 2,100 萬個 CyberTipline 通報案件,但每個案件中可能有多個圖片和影片檔案。事實上,這 2,100 萬個通報案件總共有將近 7,000 萬個兒少性虐待圖像和影片檔案。這麼大量的檔案中肯定會有重複內容,雖然 NCMEC 可以輕鬆偵測完全一致的項目,但無法大規模即時偵測看起來相似的項目,因此很難辨識出未曾看過但必須優先處理的圖片。不過,如要找出目前受到性虐待的兒童和少年,辨識這類圖片是重要關鍵。
Hash Matching API 為 NCMEC 帶來哪些好處?
我們的任務是取得這類關鍵資訊,並盡早提供給執法機關,這點非常重要。使用這項工具的好處很多,其中一項是我們可以透過新方式大幅提升 CyberTipline 通報案件的價值。
NCMEC 有一項計畫是在審查完每個兒少性虐待圖像和影片檔案後加上標籤,例如「這是兒少性虐待內容」、「這不是兒少性虐待內容」或「難以辨別兒童/少年或當事人年齡」。我們光是去年就要處理 7,000 萬個檔案,因此絕對無法全部加上標籤。不過,這個 API 可讓我們比較檔案內容。為一個檔案加上標記後,我們可以透過這個 API 找出所有看起來相似的檔案,並即時根據結果加上標記。目前,我們已經運用這個 API 為超過 2,600 萬張圖片加上標記。
有了這項功能,我們提供給執法機關的通報案件就能發揮更多作用,幫助這些機關決定通報案件的審查優先順序。另外,我們也因此發現前所未見的圖片。在這些圖片中,當事人往往是目前在世界某處受到性虐待的兒童和少年。如果將這個情況比喻為大海撈針,那根針就是等待救援的兒童和少年。Google 的工具讓我們可以鎖定這些圖片,盡快拯救需要立即救援的兒童和少年。
NCMEC 人工審查員需要處理 CyberTipline 通報案件及分析兒少性虐待內容,這對他們的身心健康有何影響?
這項兒少性虐待內容偵測工具減少了我們員工重複審查相同圖片的情況。有些圖片中的性虐待受害兒童和少年現在可能已經成年,但圖片持續在網路上流傳,導致當事人不斷受到傷害。採用圖片標記功能後,審查員除了能夠移除非法圖片,還能將心力放在近期受性虐待的兒童和少年身上。
幫助這些兒童和少年是我們同仁的初衷。我們從這項工具中獲益良多,員工更能維護自己的身心健康,不必一再重複處理已知的有害內容。
這項計畫如何協助科技公司共同打擊這類線上內容?
我們知道 Google 為許多公司提供兒少性虐待內容偵測技術,齊力打擊全球各地的兒少性虐待內容。Hash Matching API 本身不只幫助了 NCMEC,也對許多其他機構帶來直接影響。NCMEC 的程序現在更簡化、有效率,所有科技公司都因此受惠。有了這項工具後,我們比以往更能及時回應及處理 CyberTipline 通報案件,並讓這些通報案件發揮更大作用。
NCMEC 可為科技公司、執法機關、倖存者及其家人彙整相關資源,並以獨特的角度評估問題和解決方案。透過 CyberTipline,我們得以掌握網路流傳的新上傳或既有兒少性虐待內容,而且所有通報案件資訊都會提交給執法機關。我們絕不能忘記,這些遭到性虐待和剝削的受害者都是真實存在的兒童和少年。
我們目前已找到超過 2 萬名受害兒童和少年,這些孩子不但曾受過性虐待,受虐情形也以影片或圖片形式留存了下來。有些倖存者仍是兒童和少年,有些則已長大成人。他們都清楚意識到自己依然持續受到傷害,因此我們必須盡己所能,避免這些圖片在網路上流傳。
大眾可能不清楚的是,有些人會因為兒少性虐待內容「過時」或「重複出現」而忽視,但我們不斷提醒大家,這些都是真實的兒童,超過 2 萬名受害者正在努力療傷,試圖重新找回自己的人生。得知 Google 等公司正致力移除這類圖片,避免讓更多人看到他們生命中最不幸的時刻,這些受害者感到非常欣慰。
如果你在網路上發現兒少性虐待圖像或內容,可以向美國國家失蹤與受虐兒童援助中心 (NCMEC) 或世界各地相關主管機關通報。
Google 致力打擊線上兒少性虐待和剝削行為,並防止不肖人士透過我們的服務散播兒少性虐待內容 (CSAM)。如要瞭解詳情,請前往我們的「保護兒童和少年」網站。