NCMEC, Google a technologie hashování obrazu
Ve Spojených státech dostává Národní centrála pro pohřešované a zneužívané děti (NCMEC) každý rok milióny hlášení o materiálech zobrazujících sexuální zneužívání dětí. Viceprezidentka a provozní ředitelka NCMEC, Michelle DeLaune, hovoří o vývoji organizace, o tom, jak technologické společnosti postupují v boji proti materiálům zobrazujícím sexuální zneužívání dětí, a o rozhraní Google Hash Matching API.
Můžete nám prozradit něco bližšího o NCMEC a jakou funkci zde zastáváte?
V Národní centrále pro pohřešované a zneužívané děti (NCMEC) pracuji už více než 20 let, takže jsem byla přímým svědkem nejen jejího rozvoje, ale i problémů a nebezpečí, která našim dětem hrozí. Začínala jsem tu jako analytička CyberTipline.
Linka CyberTipline vznikla a byla spuštěna v roce 1998. Představovala způsob, jak může veřejnost hlásit případy možného zneužívání dětí. Tenkrát jsme dostávali hlášení od rodičů, kteří měli obavy, že někdo dospělý na internetu nevhodně mluvil s jejich dítětem, a od lidí, kteří se setkali s webovými stránkami obsahujícími materiály zobrazující sexuální zneužívání dětí Poté byl ve Spojených státech schválen federální zákon, podle kterého musí americké technologické společnosti lince CyberTipline hlásit veškeré případy, kdy na svých systémech objeví materiály zobrazující jasné případy sexuálního zneužívání dětí.
Zpočátku jsme dostávali možná něco přes 100 hlášení o zneužívání dětí týdně. První oznámení od technologické společnosti jsme obdrželi v roce 2001. A teď, v roce 2021, nám každý den chodí přibližně 70 000 nových hlášení. Některá z nich jsou od veřejnosti, ale většinu těchto oznámení nám zasílají technologické společnosti.
Jak Národní centrála pro pohřešované a zneužívané děti (NCMEC) pomáhá na internetu společnostem v boji proti materiálům zobrazujícím sexuální zneužívání dětí?
Zákon nevyžaduje, aby společnosti vyvíjely jakékoli proaktivní úsilí. Pokud však objeví nějaké materiály zobrazující sexuální zneužívání dětí nebo o nich vědí, musí je nahlásit. Právě tato skutečnost byla impulzem k instrumentálnímu rozvoji, který jsme během let zaznamenali u CyberTipline. K největšímu skoku v počtu hlášení však došlo v průběhu posledních pěti let. Tento nárůst lze přičíst úsilí, které mnoho technologických společností dobrovolně vynakládá, aby materiály zobrazující sexuální zneužívání dětí proaktivně zjišťovaly, odstraňovaly a nahlašovaly.
Jedním z hlavních programů, které v NCMEC provozujeme, jsou platformy pro sdílení hodnot hash, a to jak pro průmyslové, tak i pro vybrané nevládní organizace. Prostřednictvím platformy pro sdílení hodnot hash, která slouží nevládním organizacím, poskytuje NCMEC zainteresovaným technologickým společnostem více než pět milionů hodnot hash obsahujících potvrzené a trojnásobně ověřené materiály zobrazující sexuální zneužívání dětí, což jim pomáhá tento obsah vymýtit ze sítí. Tohoto seznamu využilo mnoho velkých společností (včetně Googlu), které se proaktivně snaží ze svých platforem odstraňovat materiály zobrazující sexuální zneužívání dětí. Tento seznam také umožňuje dalším renomovaným nevládním organizacím, které slouží zájmům dětí, poskytovat hodnoty hash aktérům technologického odvětví prostřednictvím hashovací platformy NCMEC. Technologické společnosti díky tomu nemusejí navštěvovat každou nevládní organizaci zvlášť.
Nabízíme také platformu Industry Hash Sharing, která umožňuje vybraným společnostem navzájem sdílet vlastní hodnoty hash materiálů, které sexuální zneužívání dětí zobrazují. Zajišťujeme, aby každá společnost, která je ochotna a schopna takový materiál proaktivně detekovat, měla k dispozici všechny potřebné nástroje a aby společnosti mohly navzájem sdílet své vlastní hodnoty hash závadných materiálů. Nejvíce do této platformy přispívá společnost Google, a to zhruba 74 % z celkového počtu hodnot hash na seznamu.
Asi si dokážete představit, že vzhledem k objemu zpráv se mnohé nahlašované fotky opakují. To je zcela pochopitelné, protože společnosti používají hodnoty hash k detekci známého materiálu. Čím více známého materiálu však přibývá, tím důležitější pro NCMEC je, abychom dokázali identifikovat materiál nový, který byl vyroben a sdílen online.
Rozhraní Hash Matching API od Googlu pomohlo NCMEC stanovit priority hlášení z CyberTipline. Můžete nám blíže popsat, jak tento projekt začal?
Program sdílení hodnot hash byl nesmírně úspěšný, čímž však vznikl nový problém – obrovský objem dat. Nezisková organizace jako NCMEC nemá k dispozici výpočetní výkon, který by umožnil škálování v tomto měřítku. Proto jsme společnosti Google nesmírně vděční, že nám pomohla vytvořit nástroj Hash Matching API.
V roce 2020 jsme z linky CyberTipline obdrželi 21 milionů hlášení, přičemž každé z nich může obsahovat i několik obrázků či videí. Těchto 21 milionů hlášení tak ve skutečnosti zahrnovalo téměř 70 milionů obrázků a videí sexuálního zneužívání dětí. V takovém objemu samozřejmě existuje duplicita, ale NCMEC dokáže snadno identifikovat pouze přesné shody – shody vizuálně podobné bychom v tomto měřítku v reálném čase nikdy zjistit nedokázali, což by nám znesnadňovalo stanovit priority u dosud neprozkoumaného materiálu. Právě to je ale nejdůležitější, když se snažíme identifikovat děti, které jsou aktivně sexuálně zneužívány.
Jaké výhody přineslo rozhraní Hash Matching API organizaci NCMEC?
Máme opravdu důležitý úkol, a to vzít tyto kritické informace a předat je co nejrychleji orgánům činným v trestním řízení. Jednou z výhod tohoto nástroje je, že nám umožňuje zcela novým způsobem zhodnocovat hlášení z CyberTipline.
Máme pracovní program, ve kterém procházíme každou fotku či video zobrazující sexuální zneužívání dětí a označujeme je. Například „Toto je materiál zobrazující sexuální zneužívání dětí“, „Toto není materiál zobrazující sexuální zneužívání dětí“ nebo „Věk dítěte nebo osoby lze těžko určit.“ Ale jak si dokážete představit, jen těžko můžeme označit všechny, když jen v loňském roce jsme pracovali s více než 70 milióny souborů. Toto rozhraní API nám však umožňuje provádět srovnání. Když označíme jeden soubor, rozhraní API nám umožní identifikovat všechny vizuálně podobné soubory, které pak v reálném čase odpovídajícím způsobem označíme. Výsledkem je, že jsme takto dokázali označit více než 26 milionů obrázků.
Díky tomu můžeme orgánům činným v trestním řízení posílat hodnotnější hlášení, která jim umožní lépe určit, co zkontrolovat jako první. Toto rozhraní nám také umožňuje snáze identifikovat, které obrázky jsme ještě nikdy neviděli. Dané snímky často zobrazují dítě, které je kdesi ve světě sexuálně zneužíváno. Pokud vše přirovnáme k příslovečnému hledání jehly v kupce sena, je v tomto případě tou jehlou dítě, které potřebuje zachránit. Nástroj Google nám umožnil zaměřit se na obrázky dětí, které potřebují okamžitou pomoc.
A jak to pomohlo kontrolorům NCMEC, kteří zpracovávají hlášení z CyberTipline a analyzují obsah materiálů zobrazujících sexuální zneužívání dětí?
Tento nástroj pro zjišťování takto závadných materiálů usnadnil našim zaměstnancům práci, takže už nemusejí znovu a znovu zkoumat ty samé obrázky. Existují fotky sexuálně zneužívaných dětí, které jsou teď nejspíš už dospělé. Jejich snímky však na internetu stále přežívají a nadále tak přispívají k viktimizaci těchto lidí. Když ale dokážeme tyto fotky vyčlenit, můžeme se více zaměřit na děti, které dle vyobrazení byly zneužívány nedávno, a zároveň zablokovat nelegální obrázky.
Proto je zde náš personál – chtějí těmto dětem pomoci. Toto vylepšení našim zaměstnancům značně zjednodušilo život, jelikož se už nemusejí pořád dokola probírat stejnými materiály.
Jak tato práce pomáhá technologickým společnostem jako celku bojovat proti takovýmto materiálům na internetu?
Víme, že Google společnostem poskytuje technologii detekce materiálů zobrazujících sexuální zneužívání dětí a pomáhá tak v celosvětovém boji proti tomuto fenoménu. Samotné rozhraní Hash Matching API pak má značné přímé dopady i mimo NCMEC. Výhod našeho jednoduššího a efektivnějšího procesu využívají všechny technologické společnosti. Hlášení z linky CyberTipline jsou řešena a zpracovávána včas a s větší přidanou hodnotou, než kdybychom tento nástroj neměli.
NCMEC je centrálním zdrojem pro technologické společnosti, orgány činné v trestním řízení, oběti zneužívání i jejich rodiny. Máme skvělou a jedinečnou optiku, kterou na problémy a řešení nahlížíme. Díky lince CyberTipline velmi dobře víme, jaké nově vytvořené i existující materiály zobrazující sexuální zneužívání dětí po internetu kolují. Všechna tato hlášení jsou k dispozici orgánům činným v trestním řízení. Nikdy bychom neměli ztrácet ze zřetele, že na konci všeho stojí skutečné děti, které byly sexuálně zneužívány.
Víme o více než 20 000 konkrétních dětech, které byly sexuálně zneužívány a je to zaznamenáno, ať už na videu nebo fotce. Někteří z těch, kteří něco takového zažili, jsou ještě děti, jiní už dospělí. Všichni si však velmi dobře uvědomují viktimizaci, které musí neustále čelit. Proto je tak důležité, abychom se ze všech sil snažili oběh těchto obrázků co nejvíce omezit.
Jedna věc, která nemusí být veřejnosti jasná, souvisí s určitou tendencí relativizovat známé materiály zobrazující sexuální zneužívání dětí. Například z toho důvodu, že obrázky jsou „staré“ nebo „recyklované“. Neustále však apelujeme a snažíme se lidem připomínat to, že se jedná o skutečné děti – a že těch více než 20 000 jedinců se snaží uzdravit a znovu získat kontrolu nad svým životem. Vědomí, že společnosti jako Google se maximálně snaží odstraňovat snímky zachycující nejhorší okamžiky jejich života, je pro oběti sexuálního zneužívání velkou útěchou.
Pokud na internetu na fotky nebo jiný materiál zobrazující sexuální zneužívání dětí narazíte, můžete to Národní centrále pro pohřešované a zneužívané děti nahlásit, případně příslušnému správnímu orgánu.
Společnost Google hodlá rozhodně potírat sexuální zneužívání dětí na internetu a své služby nemíní poskytovat k šíření materiálů, které by něco takového zobrazovaly. Další informace najdete na našem webu o ochraně dětí.