NCMEC, Google a technologie hashování obrazu


Ve Spojených státech dostává Národní centrála pro pohřešované a zneužívané děti (NCMEC) každý rok milióny hlášení o materiálech zobrazujících sexuální zneužívání dětí. Viceprezidentka a provozní ředitelka Národní centrály pro pohřešované a zneužívané děti (NCMEC) Michelle DeLaune hovoří o vývoji organizace, o tom, jak technologické společnosti postupují v boji proti materiálům zobrazujícím sexuální zneužívání dětí, a o rozhraní Google Hash Matching API.

Můžete nám prozradit něco bližšího o NCMEC a jakou funkci zde zastáváte?


V Národní centrále pro pohřešované a zneužívané děti (NCMEC) pracuji už více než 20 let, takže jsem byla přímým svědkem nejen jejího rozvoje, ale i problémů a nebezpečí, která našim dětem hrozí. Začínala jsem tu jako analytička CyberTipline.

Linka CyberTipline vznikla a byla spuštěna v roce 1998. Představovala způsob, jak může veřejnost hlásit případy možného zneužívání dětí. Tenkrát jsme dostávali hlášení od rodičů, kteří měli obavy, že někdo dospělý na internetu nevhodně mluvil s jejich dítětem, a od lidí, kteří se setkali s webovými stránkami obsahujícími materiály zobrazující sexuální zneužívání dětí. Poté byl ve Spojených státech schválen federální zákon, podle kterého musí americké technologické společnosti lince CyberTipline hlásit veškeré případy, kdy ve svých systémech objeví materiály zobrazující zřejmé případy sexuálního zneužívání dětí.

Zpočátku jsme dostávali něco přes 100 hlášení o zneužívání dětí týdně. První oznámení od technologické společnosti jsme obdrželi v roce 2001. A teď v roce 2021 nám každý den chodí přibližně 70 000 nových hlášení. Některé z nich jsou od veřejnosti, ale většinu těchto oznámení nám zasílají technologické společnosti.

Jak Národní centrála pro pohřešované a zneužívané děti (NCMEC) pomáhá na internetu společnostem v boji proti materiálům zobrazujícím sexuální zneužívání dětí?


Zákon nevyžaduje, aby společnosti vyvíjely proaktivní úsilí. Pokud však objeví nějaké materiály zobrazující sexuální zneužívání dětí nebo o nich vědí, musí je nahlásit. Právě tato skutečnost byla impulzem k instrumentálnímu rozvoji, který jsme během let zaznamenali u CyberTipline. K největšímu skoku v počtu hlášení však došlo v průběhu posledních pěti let. Tento nárůst lze přičíst úsilí, které mnoho technologických společností dobrovolně vynakládá, aby proaktivně zjišťovaly, odstraňovaly a nahlašovaly materiály zobrazující sexuální zneužívání dětí.

Jedním z hlavních programů, které v Národním centru pro pohřešované a zneužívané děti provozujeme, jsou platformy pro sdílení hodnot hash, a to jak pro průmyslové, tak i pro vybrané nevládní organizace. Prostřednictvím platformy pro sdílení hodnot hash, která slouží nevládním organizacím, poskytuje Národní centrála pro pohřešované a zneužívané děti (NCMEC) zainteresovaným technologickým společnostem více než pět milionů hodnot hash obsahujících potvrzené a trojnásobně ověřené materiály zobrazující sexuální zneužívání dětí, což jim pomáhá tento obsah vymýtit ze sítí. Tohoto seznamu využilo mnoho velkých společností (včetně Googlu), které se proaktivně snaží ze svých platforem odstraňovat materiály zobrazující sexuální zneužívání dětí. Tento seznam také umožňuje dalším renomovaným nevládním organizacím, které slouží dětem, aby své hodnoty hash poskytovaly technologickému průmyslu prostřednictvím hashovací platformy NCMEC. Technologické společnosti díky tomu nemusejí navštěvovat každou nevládní organizaci zvlášť.

Nabízíme také platformu Industry Hash Sharing, která umožňuje vybraným společnostem navzájem sdílet své hodnoty hash s materiály zobrazujícími sexuální zneužívání dětí. Zajišťujeme, aby každá společnost, která je ochotna a schopna proaktivně detekovat tento materiál, měla k dispozici všechny potřebné nástroje a aby společnosti mohly navzájem sdílet své vlastní hodnoty hash s materiály zobrazujícími sexuální zneužívání dětí. Nejvíce do této platformy přispívá společnost Google, a to zhruba 74 % z celkového počtu hodnot hash na seznamu.

Asi si dokážete představit, že vzhledem k objemu zpráv se mnohé nahlašované fotky opakují. To je zcela pochopitelné, protože společnosti používají hodnoty hash k detekci známého materiálu. Čím více známého materiálu však přibývá, tím důležitější pro NCMEC je, aby dokázala identifikovat materiál nový, který byl vyroben a sdílen online.

Rozhraní Hash Matching API od Googlu pomohlo Národní centrále pro pohřešované a zneužívané děti (NCMEC) stanovit priority hlášení z CyberTipline. Můžete nám blíže popsat, jak tento projekt začal?


Program sdílení hodnot hash byl nesmírně úspěšný, čímž však vznikl nový problém – obrovský objem dat. Nezisková organizace jako NCMEC nemá k dispozici výpočetní výkon, který by umožnil škálování v tomto měřítku. Proto jsme společnosti Google nesmírně vděční, že nám pomohla vytvořit nástroj Hash Matching API.

V roce 2020 jsme z linky CyberTipline obdrželi 21 milionů hlášení, přičemž každé z nich může obsahovat i několik obrázků či videí. Těchto 21 milionů hlášení tak ve skutečnosti zahrnovalo téměř 70 milionů obrázků a videí sexuálního zneužívání dětí. V takovém objemu samozřejmě existuje duplicita, ale NCMEC dokáže snadno identifikovat pouze přesné shody – shody vizuálně podobné bychom v tomto měřítku v reálném čase nikdy zjistit nedokázali, což by nám znesnadňovalo stanovení priorit u dosud neviděných obrazů. Právě to je ale nejdůležitější, když se snažíme identifikovat děti, které jsou aktivně sexuálně zneužívány.

Jaké výhody přineslo rozhraní Hash Matching API Národní centrále pro pohřešované a zneužívané děti (NCMEC)?


Máme opravdu důležitý úkol, a to vzít tyto kritické informace a předat je co nejrychleji orgánům činným v trestním řízení. Jednou z výhod tohoto nástroje je, že nám umožňuje zcela novým způsobem zhodnocovat hlášení z CyberTipline.

Máme pracovní program, ve kterém procházíme každou fotku či video zobrazující sexuální zneužívání dětí a označujeme je. Například „Toto je materiál zobrazující sexuální zneužívání dětí“, „Toto není materiál zobrazující sexuální zneužívání dětí“ nebo „Věk dítěte nebo osoby lze těžko určit.“ Ale jak si dokážete představit, jen těžko můžeme označit všechny, když jen v loňském roce jsme pracovali s více než 70 milióny souborů. Toto rozhraní API nám však umožňuje provádět srovnání. Když označíme jeden soubor, rozhraní API nám umožní identifikovat všechny vizuálně podobné soubory, které pak v reálném čase odpovídajícím způsobem označíme. Výsledkem je, že jsme takto dokázali označit více než 26 milionů obrázků.

Díky tomu můžeme orgánům činným v trestním řízení posílat hodnotnější hlášení, díky kterým mohou lépe určovat, co zkontrolovat jako první. Toto rozhraní nám také umožňuje snáze identifikovat, které obrázky jsme ještě nikdy neviděli. Tyto snímky často zobrazují dítě, které je kdesi ve světě sexuálně zneužíváno. Pokud vše pojmeme jako příslovečné hledání jehly v kupce sena, je v tomto případě tou jehlou dítě, které potřebuje zachránit. Nástroj Google nám umožnil zaměřit se na obrázky dětí, které potřebují okamžitou pomoc.

A jak to pomohlo kontrolorům NCMEC, kteří zpracovávají hlášení z CyberTipline a analyzují obsah materiálů zobrazujících sexuální zneužívání dětí?


Tento nástroj pro zjišťování materiálů zobrazujících sexuální zneužívání dětí usnadnil našim zaměstnancům práci, takže už si nemusejí znovu a znovu prohlížet jedny a ty samé obrázky. Existují fotky sexuálně zneužívaných dětí, které jsou teď nejspíš už dospělé. Jejich snímky však na internetu stále přežívají a nadále tak přispívají k viktimizaci těchto lidí. Když ale dokážeme tyto fotky vyčlenit, můžeme se více zaměřit na děti, které byly dle vyobrazení zneužívány nedávno, a zároveň z dohledu odstranit nelegální obrázky.

Proto je zde náš personál – chtějí těmto dětem pomoci. Toto vylepšení našim zaměstnancům značně zjednodušilo život, protože se už nemusejí pořád dokola probírat stále stejnými materiály.

Jak tato práce pomáhá technologickým společnostem jako celku bojovat proti takovýmto materiálům na internetu?

Víme, že Google společnostem poskytuje technologii detekce materiálů zobrazujících sexuální zneužívání dětí a pomáhá tak v celosvětovém boji proti tomuto fenoménu. Samotné rozhraní Hash Matching API má přímý dopad na mnohé mimo NCMEC. Všechny technologické společnosti využívají výhod jednoduššího a efektivnějšího procesu v Národním centru. Hlášení z linky CyberTipline jsou řešena a zpracovávána včas a s větší přidanou hodnotou, než kdybychom tento nástroj neměli.

NCMEC je centrálním zdrojem pro technologické společnosti, orgány činné v trestním řízení, oběti zneužívání i jejich rodiny. Máme skvělou a jedinečnou optiku, kterou pohlížíme na problémy a řešení. Díky lince CyberTipline velmi dobře víme, jaké nově vytvořené i existující materiály zobrazující sexuální zneužívání dětí kolují po internetu. Všechna tato hlášení jsou k dispozici orgánům činným v trestním řízení. Nikdy bychom neměli ztrácet ze zřetele, že na konci všeho stojí skutečné děti, které byly sexuálně zneužívány.

Víme o více než 20 000 konkrétních dětí, které byly sexuálně zneužívány a jejich zneužívání zaznamenáno, ať už na videu nebo na fotce. Někteří z těch, kteří něco takového zažili, jsou ještě děti, jiní už dospělí. Všichni si však velmi dobře uvědomují viktimizaci, které musí neustále čelit. Proto je tak důležité, abychom se ze všech sil snažili oběh těchto obrázků co nejvíce omezit.

Veřejnost si možná zcela neuvědomuje, že i když jsou některé materiály zobrazující sexuální zneužívání dětí už „staré“ nebo „recirkulované“ a někdo má tendenci je proto odmítat, stále se jedná o skutečné děti. Proto neustále bijeme na poplach a snažíme se lidem připomínat, že těch více než 20 000 lidí se snaží vyléčit z prožitých traumat a znovu žít normálním životem. Vědomí, že společnosti jako Google se maximálně snaží odstraňovat snímky zachycující nejhorší okamžiky jejich života, je pro oběti sexuálního zneužívání velkou útěchou.

Pokud na internetu narazíte na fotky nebo jiný materiál zobrazující sexuální zneužívání dětí, můžete to nahlásit Národní centrále pro pohřešované a zneužívané děti (NCMEC) nebo příslušnému správnímu orgánu

Společnost Google hodlá rozhodně potírat sexuální zneužívání dětí na internetu a své služby nemíní poskytovat k šíření materiálů, které by něco takového zobrazovaly.Bližší informace najdete na našem webu [Ochrana dětí] (https://protectingchildren.google/#introduction).

Pokroky v kyberbezpečnosti

Zjistěte, jak online chráníme víc lidí než kdokoli jiný na světě.

Další informace