NCMEC, Google a technológia hashovania obrázkov


Centrum NCMEC (National Center for Missing and Exploited Children) v Spojených štátoch dostáva každý rok milióny hlásení o materiáli zobrazujúcom sexuálne zneužívanie detí na internete. Jeho hlavná viceprezidentka a hlavná prevádzková riaditeľka Michelle DeLauneová objasňuje vývoj tejto organizácie a hovorí o tom, ako technologické firmy zintenzívňujú potláčanie materiálu zobrazujúceho sexuálne zneužívanie detí, a o rozhraní API na vyhľadávanie zhôd hodnôt hash od Googlu.

Povedzte nám o centre NCMEC a vašej role.


Pre NCMEC pracujem viac ako 20 rokov, takže som osobne zažila vývoj tejto organizácie, ako aj výzvy a hrozby týkajúce sa našich detí a ich bezpečnosti. Svoju kariéru som tu začala ako analytička systému CyberTipline.

Systém CyberTipline bol vytvorený a spustený v roku 1998 ako spôsob, ktorým môže verejnosť nahlasovať potenciálne prípady zneužívania detí. V tom čase sme dostávali hlásenia od rodičov, ktorí sa obávali, že sa s ich dieťaťom na internete nevhodným spôsobom rozprával dospelý, a od ľudí, ktorí narazili na web s materiálom zobrazujúcim sexuálne zneužívanie detí. Potom bol v Spojených štátoch prijatý federálny zákon, ktorý vyžaduje, aby americké technologické firmy nahlasovali systému CyberTipline všetky zjavné prípady materiálu zobrazujúceho sexuálne zneužívanie detí prítomného v ich systémoch.

Na začiatku sme riešili niečo vyše 100 hlásení zneužívania detí týždenne. Prvé hlásenie od technologickej firmy sme dostali v roku 2001. Keď sa prenesieme do roku 2021, vtedy sme už dostávali každý deň približne 70 000 nových hlásení. Niektoré hlásenia pochádzajú od verejnosti, ale väčšinu odosielajú technologické firmy.

Ako centrum NCMEC pomáha internetovým firmám bojovať proti materiálu zobrazujúcemu sexuálne zneužívanie detí?


Právne predpisy nevyžadujú, aby firmy vyvíjali proaktívne úsilie. Ak rozpoznajú obsah s materiálom zobrazujúcim sexuálne zneužívanie detí alebo sa o ňom dozvedia, musia ho nahlásiť. To bolo impulzom k inštrumentálnemu nárastu, ku ktorému došlo v posledných rokoch v systéme CyberTipline. V posledných piatich rokoch však došlo k najvýznamnejšiu skoku v počte hlásení. Možno ho považovať za dôsledok dobrovoľného úsilia mnohých technologických firiem proaktívne rozpoznávať, odstraňovať a nahlasovať materiál zobrazujúci sexuálne zneužívanie detí.

Jedným z ústredných programov, ktoré v centre NCMEC (National Center for Missing and Exploited Children) prevádzkujeme, sú platformy na zdieľanie hodnôt hash, pričom na jednej môžu prispievať firmy z odvetvia a na druhej môžu zároveň prispievať vybrané mimovládne organizácie. Prostredníctvom platformy na zdieľanie hodnôt hash neziskovými organizáciami poskytuje centrum NCMEC zainteresovaným technologickým firmám viac ako päť miliónov hodnôt hash potvrdeného a trikrát prevereného materiálu zobrazujúceho sexuálne zneužívanie detí, čím im pomáha v úsilí bojovať proti takémuto materiálu vo svojich sieťach. Mnoho veľkých firiem vrátane Googlu tento zoznam využíva a podniká proaktívne opatrenia na odstraňovanie materiálu zobrazujúceho sexuálne zneužívanie detí zo svojich platforiem. Tento zoznam tiež umožňuje ďalším renomovaným mimovládnym organizáciám, ktoré poskytujú služby pre deti, odosielať prostredníctvom platformy hodnôt hash centra NCMEC hodnoty hash technologickému odvetviu, čím sa minimalizuje potreba, aby technologické firmy museli kontaktovať jednotlivé mimovládne organizácie individuálne.

Poskytujeme aj platformu na zdieľanie hodnôt hash v rámci odvetvia, ktorá umožňuje vybraným firmám zdieľať medzi sebou vlastné hodnoty hash materiálu zobrazujúceho sexuálne zneužívanie detí. Zaisťujeme, aby každá firma, ktorá chce a dokáže proaktívne rozpoznávať tento materiál, mala na to všetky potrebné nástroje a aby mohli firmy medzi sebou zdieľať vlastné hodnoty hash takéhoto materiálu. Google je najväčším prispievateľom platformy – z celkového počtu hodnôt hash v zozname prispel podielom 74 %.

Určite si viete predstaviť, že vzhľadom na objem hlásení, ktoré teraz dostávame, je veľa rovnakých obrázkov nahlasovaných viackrát. To je úplne pochopiteľné, pretože firmy pomocou hodnôt hash rozpoznávajú známy materiál, ale keď sa jeho objem zvýši, pre centrum NCMEC je dôležitejšie dokázať identifikovať nový vytvorený materiál zdieľaný na internete.

Rozhranie API na vyhľadávanie zhôd hodnôt hash od Googlu pomohlo centru NCMEC priorizovať hlásenia systému CyberTipline. Povedzte nám viac o tom, ako sa tento projekt začal.


Program zdieľania hodnôt hash mal taký úspech, že vznikla úplne nová výzva: objem predstavujúci nesmierne výzvy. Nezisková organizácia ako NCMEC nemá výpočtový výkon, aby dokázala taký veľký objem spracovať. Preto sme sa tak usilovali o pomoc Googlu s vytvorením nástroja s rozhraním API na vyhľadávanie zhôd hodnôt hash a preto sme za ňu takí vďační.

V roku 2020 sme dostali 21 miliónov hlásení CyberTipline, pričom každé z nich môže obsahovať niekoľko obrázkov a videí. Týchto 21 miliónov hlásení v skutočnosti zahŕňalo 70 miliónov obrázkov a videí zobrazujúcich sexuálne zneužívanie detí. V rámci tohto objemu sa, samozrejme, vyskytli aj duplikáty. NCMEC síce dokáže ľahko zisťovať presné zhody, ale nedokázali by sme rozpoznávať vizuálne podobné zhody vo veľkom rozsahu a v reálnom čase, aby sme tak identifikovali a priorizovali obrázky, ktoré sme predtým nikdy nevideli. A práve to je kľúčovým cieľom pokusov o identifikáciu detí, ktoré sú aktívne sexuálne zneužívané.

Aké výhody prinieslo rozhranie API na vyhľadávanie zhôd hodnôt hash centru NCMEC?


Máme veľmi dôležitú prácu, ktorou je čo najrýchlejšie odovzdávať tieto závažné informácie orgánom činným v trestnom konaní. Jednou z výhod tohto nástroja je to, že nám poskytuje nový spôsob, ako pridať hláseniam CyberTipline mimoriadnu hodnotu.

Máme pracovný program, v rámci ktorého prechádzame všetky obrázky a videá zobrazujúce sexuálne zneužívanie detí a označujeme ich štítkami, ako napríklad: „Toto je materiál zobrazujúci sexuálne zneužívanie detí,“ „Toto nie je materiál zobrazujúci sexuálne zneužívanie detí,“ či „Je ťažké určiť vek dieťaťa alebo osoby.“ Ale určite si dokážete predstaviť, že keďže iba za posledný rok sme prijali 70 miliónov súborov, nikdy sa nám ich nepodarí označiť všetky. Toto rozhranie API nám umožňuje porovnávať. Keď označíme jeden súbor, umožní nám identifikovať všetky vizuálne podobné súbory, ktoré potom náležite označíme štítkom v reálnom čase. Vo výsledku sme dokázali označiť viac ako 26 miliónov obrázkov.

Pomáha nám to zvýšiť hodnotu hlásení, ktoré odosielame orgánom činným v trestnom konaní, aby mohli priorizovať, ktoré hlásenia skontrolujú ako prvé. Pomáha nám to aj identifikovať, ktoré obrázky sme ešte nikdy nevideli. Na daných obrázkoch je často dieťa, ktoré je niekde vo svete sexuálne zneužívané. Ak si vezmeme známe porekadlo o hľadaní ihly v kope sena, v tomto prípade je ihlou dieťa, ktoré treba zachrániť. Tento nástroj od Googlu nám umožňuje zamerať sa na obrázky detí, ktoré potrebujú okamžitú pomoc.

Ako to vplývalo na kontrolórov, pracovníkov z centra NCMEC, ktorí spracúvajú hlásenia zo systému CyberTipline a analyzujú materiál zobrazujúci sexuálne zneužívanie detí?


Vďaka nástroju na rozpoznávanie materiálu zobrazujúceho sexuálne zneužívanie detí si naši pracovníci nemusia opakovane prezerať rovnaké obrázky. Existujú obrázky sexuálneho zneužívania detí, ktoré môžu byť teraz už v dospelom veku. Obrázky sú trvalo k dispozícii na internete, čím prispievajú k pretrvávajúcemu prenasledovaniu týchto osôb. Možnosť označiť tieto obrázky umožňuje kontrolórom zamerať sa na deti na obrazovom materiáli zobrazujúcom nedávne sexuálne zneužívanie a zároveň odstrániť tieto nezákonné obrázky tak, aby sa nezobrazovali.

Naši pracovníci sú tu práve preto, že chcú týmto deťom pomôcť. Ide o prelomové zlepšenie, pokiaľ ide o možnosť našich pracovníkov udržať si duševnú rovnováhu a nevystavovať sa opakovane rovnakému známemu škodlivému materiálu.

Ako táto práca pomáha technologickým firmám ako celku bojovať proti tomuto typu internetového obsahu?


Vieme, že Google poskytuje technológiu na rozpoznávanie materiálu zobrazujúceho sexuálne zneužívanie detí firmám, ktoré podporujú celosvetový boj proti tomuto materiálu, pričom samotné rozhranie na vyhľadávanie zhôd hodnôt hash má priamy vplyv na mnohých účastníkov mimo centra NCMEC. Všetky technologické firmy využívajú výhody zjednodušeného a efektívnejšieho procesu v našom centre. Hlásenia CyberTipline sa riešia a spracúvajú včasnejšie a s vyššou pridanou hodnotou v porovnaní so situáciou, keď by sme tento nástroj nemali.

NCMEC je ústredným zdrojom pre technologické firmy, orgány činné v trestnom konaní, obete a ich rodiny. Máme neuveriteľne jedinečný pohľad na problémy a riešenia. Vďaka systému CyberTipline vieme o novom aj existujúcom materiáli zobrazujúceho sexuálne zneužívanie detí, ktorý je v obehu na internete. Všetky tieto hlásenia sa sprístupňujú orgánom činným v trestnom konaní. Vždy by sme mali mať na zreteli, že na opačnom konci sú skutočné deti, ktoré sú sexuálne zneužívané a vykorisťované.

Vieme o viac ako 20 000 identifikovaných detí, ktoré boli sexuálne zneužité a ktorých zneužitie bolo zvečnené vo videu alebo na obrázku. Tieto obete, z ktorých niektoré sú stále deti a iné sú už dospelé, sú si veľmi dobre vedomé pretrvávajúceho prenasledovania, ktorému čelia. Preto je pre nás také dôležité urobiť všetky možné opatrenia, aby sme minimalizovali a zredukovali obeh týchto obrázkov.

Verejnosti môže unikať to, že ľudia majú sklon nepovažovať za dôležitý známy materiál zobrazujúci sexuálne zneužívanie detí, pretože obrázky sú „staré“ alebo „stále v obehu“. Ľuďom neustále silne pripomíname, že ide o skutočné deti a že týchto viac ako 20 000 osôb sa pokúša zotaviť a dostať svoj život pod kontrolu. Je pre nich veľkou útechou, že firmy ako Google robia všetko, čo je v ich silách, aby odstránili obrázky zobrazujúce najhoršie okamihy ich života.

Ak na internete narazíte na obrázky alebo materiál zobrazujúci sexuálne zneužívanie detí, môžete ho nahlásiť centru NCMEC (National Center for Missing and Exploited Children) alebo príslušnému úradu, ktorým je úrad podľa geografickej oblasti.

Google sa zaväzuje bojovať proti sexuálnemu zneužívaniu a využívaniu detí a predchádzať tomu, aby sa pomocou jeho služieb šíril materiál zobrazujúci sexuálne zneužívanie detí. Viac sa o tom dozviete na webe Ochrana detí - Protecting Children.

Zistite, ako Google robí internet bezpečným miestom pre všetkých.