NCMEC 與 Google 攜手合作,
運用圖片雜湊技術


美國國家失蹤及被剝削兒童和少年保護中心 (NCMEC) 每年都會收到數百萬個線上兒少性虐待內容 (CSAM) 通報案件。NCMEC 的資深副總裁暨營運長 Michelle DeLaune 將說明這個機構的發展、科技公司如何採取行動打擊兒少性虐待內容,以及 Google 的 Hash Matching API。

可以請你介紹 NCMEC 和你的職責嗎?


我在 NCMEC 工作超過 20 年,因此親自見證了這個機構的發展,也見過許多危及兒童/少年及其安全的挑戰和威脅。我一開始在這裡的工作是 CyberTipline 分析人員。

CyberTipline 設立於 1998 年,目的是讓大眾通報潛在的兒童剝削事件。我們當時曾收到家長的通報,因為他們對於網路上有成年人對孩子說了不恰當的言論而感到擔心。此外,網友也曾在發現網站上有兒少性虐待內容時向我們通報。美國後來通過了一項聯邦法,要求美國的科技公司必須在自家系統上出現明顯的兒少性虐待內容時向 CyberTipline 通報。

我們早期可能會在一週內收到超過 100 個兒童和少年剝削通報案件。2001 年,我們收到第一個由科技公司通報的案件。到了 2021 年,我們每天都會收到約 7 萬個新的通報案件,其中一部分來自一般大眾,但大部分案件是由科技公司通報。

NCMEC 如何協助線上服務公司打擊兒少性虐待內容?


法律並未要求公司主動採取任何打擊兒少性虐待內容的措施,只規定在偵測到或發現這類內容時必須通報。這一點正是 CyberTipline 多年來案量增長的關鍵因素。不過,通報案量在過去五年內大幅增加,原因可能是許多科技公司開始主動偵測、移除及通報兒少性虐待內容。

美國國家失蹤及被剝削兒童和少年保護中心有一項旗艦計畫是設立雜湊分享平台,其中兩個平台是讓業界提供資料,另一個平台的資料來源則是特定的非政府組織。透過非政府組織雜湊分享平台,NCMEC 為有意參與計畫的科技公司提供超過五百萬個經過確認和三重審核的兒少性虐待內容雜湊值,協助他們全力打擊自家網路上的兒少性虐待內容。許多大型公司 (包括 Google) 已根據這份清單主動將這類內容從自家平台上移除。其他信譽良好的兒少服務非政府組織也可以透過這份清單和 NCMEC 的雜湊平台與科技公司分享雜湊資料,讓科技公司不必分別向各個非政府組織徵求這類資料。

我們還提供業界雜湊分享平台,讓特定公司彼此互相分享兒少性虐待內容雜湊。只要公司願意且能夠主動偵測這類內容,我們就會提供所有必要的工具,並讓有志於此的公司互相分享兒少性虐待內容雜湊。Google 是這個平台的最大貢獻者,提供了清單中約 74% 的雜湊。

現在的通報案量如此驚人,理當會有許多相同圖片重複通報的情形,這是因為各家公司紛紛開始使用雜湊值偵測已知內容。不過,隨著已知內容越來越多,NCMEC 更要能夠找出已在網路上出現及散播的新內容。

在 Google 的 Hash Matching API 幫助下,NCMEC 得以找出要優先處理的 CyberTipline 通報案件。能否請你進一步說明這項計畫是怎麼開始的?


雖然雜湊分享計畫成效良好,但也帶來全新的挑戰:通報案量多到令人難以招架。像 NCMEC 這樣的非營利機構沒有足夠的運算能力,因此無法處理如此大量的案件。因此,我們亟需 Google 協助打造 Hash Matching API 工具,也很感謝 Google 鼎力相助。

我們在 2020 年收到 2100 萬個 CyberTipline 通報案件,但每個案件中可能有多個圖片和影片檔案。事實上,這 2100 萬個通報案件總共有將近 7000 萬個兒少性虐待圖像和影片檔案。這麼大量的檔案中肯定會有重複內容,雖然 NCMEC 可以輕鬆偵測完全一致的項目,但無法大規模即時偵測看起來相似的項目,因此很難辨識出未曾看過但必須優先處理的圖片。不過,如要找出目前受到性虐待的兒童和少年,辨識這類圖片是重要的關鍵。

Hash Matching API 為 NCMEC 帶來哪些好處?


我們的任務是取得這類關鍵資訊,並盡早提供給執法機關,這點非常重要。使用這項工具的好處很多,其中一項是我們可以透過新的方式大幅提升 CyberTipline 通報案件的價值。

NCMEC 有一項計畫是在審查完每個兒少性虐待圖像和影片檔案後加上標籤,例如「這是兒少性虐待內容」、「這不是兒少性虐待內容」或「難以辨別兒童/少年或當事人年齡」。我們光是去年就要處理 7000 萬個檔案,因此絕對無法全部加上標籤。不過,這個 API 可讓我們比較檔案內容。為一個檔案加上標記後,我們可以透過這個 API 找出所有看起來相似的檔案,並即時根據結果加上標記。目前我們已經運用這個 API 為超過 2600 萬張圖片加上標記。

有了這項功能,我們提供給執法機關的通報案件就能發揮更多作用,幫助這些機關決定通報案件的審查優先順序。另外,我們也因此發現前所未見的圖片。在這些圖片中,當事人往往是目前在世界某處受到性虐待的兒童和少年。如果將這個情況比喻為大海撈針,那根針就是等待救援的兒童和少年。Google 的工具讓我們可以鎖定這些圖片,盡快拯救需要立即救援的兒童和少年。

對負責處理 CyberTipline 通報案件及分析兒少性虐待內容內容的 NCMEC 人工審查員來說,這對他們的身心健康有何影響?


這項兒少性虐待內容偵測工具降低了我們員工重複審查相同圖片的機率。有些圖片中的性虐待受害兒童和少年現在可能已經成年,但圖片持續在網路上流傳,導致當事人不斷受到傷害。採用圖片標記功能後,審查員除了能夠移除非法圖片,還能將心力放在近期受到性虐待的兒童和少年身上。幫助這些兒童和少年是我們員工從事這項工作的初衷。我們從這項工具中獲益良多,員工因此更能維護自己的身心健康,不必一再重複處理已知的有害內容。

這項計畫如何協助科技公司共同打擊這類線上內容?


我們知道 Google 為許多公司提供兒少性虐待內容偵測技術,協助打擊全球各地的兒少性虐待內容。Hash Matching API 本身不只幫助了 NCMEC,也對許多其他機構帶來直接影響。NCMEC 的程序現在更為簡化而有效率,所有科技公司都因此受惠。有了這項工具,我們能夠比以往更及時地回應及處理 CyberTipline 通報案件,並讓這些通報案件發揮更大的作用。

NCMEC 可為科技公司、執法機關、倖存者及其家人彙整相關資源,並以獨特的角度評估問題和解決方案。透過 CyberTipline,我們得以掌握網路上流傳的現有/新兒少性虐待內容,而且所有通報案件資訊都會提交給執法機關。我們絕不能忘記,這些遭到性虐待和剝削的受害者都是真實存在的兒童和少年。

我們目前已找出超過 2 萬名受害兒童和少年,這些孩子不但曾受過性虐待,受虐情形也以影片或圖片形式留存了下來。有些倖存者仍是兒童和少年,有些則已長大成人。他們都清楚意識到自己依然持續受到傷害,因此我們必須盡己所能,避免這些圖片在網路上流傳。

有一點大家可能不清楚,已知的兒少性虐待內容往往因為遭人認為是「舊內容」或「以前就流傳過的內容」而受到忽略。我們不斷高聲疾呼,提醒大家當事人是真實存在的兒童和少年,而這 2 萬多名孩子正設法讓自己從傷痛中復原,並取回自己人生的掌控權。得知 Google 等公司正致力移除這類圖片,避免讓更多人看到他們人生中最不幸的時刻,能讓這些受害者感到非常欣慰。

如果你在網路上發現兒少性虐待圖像或內容,可以向美國國家失蹤及被剝削兒童保護中心 (NCMEC)世界各地的相關主管機關通報。 

Google 致力打擊線上兒少性虐待和剝削行為,並防止不肖人士透過我們的服務散播兒少性虐待內容 (CSAM)。如要瞭解詳情,請前往我們的「保護兒童和少年」網站

資訊安全

瞭解跟世界上其他公司相比,Google 如何保障更多使用者的線上安全。

瞭解詳情