画像ハッシュ化技術を活用した NCMEC と Google の取り組み
米国では、全米行方不明・被搾取児童センター(NCMEC)宛てに、オンライン上の児童性的虐待のコンテンツ(CSAM)に関する通報が毎年数百万件も寄せられています。NCMEC のシニア バイス プレジデント兼最高執行責任者である Michelle DeLaune 氏が、組織の進化、テクノロジー企業による CSAM への取り組み、Google の Hash Matching API について語ります。
NCMEC と、ご自身の役割について教えてください。
私は 20 年以上 NCMEC に在籍しており、これまでに組織の進化、そして子どもたちを取り巻く脅威や課題の変化を最前線で目のあたりにしてきました。NCMEC でのキャリアのスタートは、CyberTipline のアナリストでした。
CyberTipline は、児童搾取のおそれがある事案を一般市民が通報できるよう、1998 年に創設されました。当時の通報内容は、オンライン上で子どもが不適切に声をかけられていると心配する保護者からの相談や、CSAM が含まれるウェブサイトを見つけた方からの報告がほとんどでした。その後、米国で連邦法が成立し、米国のテクノロジー企業は自社のシステムにおいて明らかな CSAM が見つかった場合、CyberTipline に報告することが義務付けられました。
当初、児童の搾取に関する通報は週に 100 件程度でした。それが 2001 年に初めてテクノロジー企業から通報を受けて以来、その数は増え続け、2021 年には 1 日あたり約 7 万件もの新しい通報が届くようになったのです。中には一般の方からのものもありますが、その大半はテクノロジー企業からによるものです。
NCMEC は、CSAM 対策に取り組むオンライン企業をどのように支援していますか。
法律上、企業が積極的に対策を講じることは義務付けられていません。あくまで、CSAM コンテンツを検出した場合や、そのようなコンテンツを認識した場合に報告の義務がある、ということです。これが、長年にわたって CyberTipline レポートが増加してきた要因です。しかし最も大きく報告数が伸びたのは、ここ 5 年以内のことです。この爆発的ともいえる増加は、多くのテクノロジー企業が CSAM を積極的に検出、削除、報告する取り組みを自主的に行っていることに起因していると考えられます。
全米行方不明・被搾取児童センターが運営する主要なプログラムに、ハッシュ共有プラットフォームがあります。これは、業界各社が情報を提供するためのものと、特定の NGO が提供するためのもので構成されています。NCMEC は NGO ハッシュ共有プラットフォームを介して、関心を持つテクノロジー企業に対し 3 重に精査された確認済み CSAM のハッシュ値を 500 万件以上提供しています。これにより、各企業がネットワーク上の CSAM 撲滅への取り組みを支援しています。Google を含む多くの大企業がこのリストを利用しており、自社のプラットフォームから CSAM を排除することに積極的に取り組んでいます。また、このリストによって、児童保護に取り組む他の信頼できる NGO も、NCMEC のハッシュ プラットフォームを通じてテクノロジー業界にハッシュを提供できるようになります。テクノロジー企業が各 NGO と個別に連携しなければならない手間を、最小限に抑えるのが狙いです。
また、私たちは、企業同士で CSAM ハッシュを共有できる業界ハッシュ共有プラットフォームも提供しています。CSAM を積極的に検出する意思と能力のある企業には、そのために必要なツールをすべて提供し、CSAM ハッシュを企業間で共有できるようにしています。Google はこのプラットフォームで最大の貢献者であり、リストにあるハッシュの総数の約 74% を占めています。
通報の件数がこれほど多くなると、同じ画像が何度も通報されることも珍しくありません。企業がハッシュ値を使用して既知のコンテンツを検出している以上、通報が重複するのは当然のことです。しかし、既知のコンテンツが増える中、NCMEC にとってより重要なのは、オンラインで生成、共有されている新しいコンテンツを識別できるようすることなのです。
Google の Hash Matching API は、NCMEC での CyberTipline レポートの優先度の設定に有用です。このプロジェクトが始まった経緯について詳しく教えてください。
ハッシュ共有プログラムの成功は、膨大な通報量というまったく新しい課題を生み出しました。これは非常に大きな問題でした。NCMEC のような非営利団体には、これほどの量に対応できる計算能力はありません。NCMEC が Hash Matching API ツールの開発において Google の支援を切望し、その多大な貢献に感謝しているのは、まさにこうした理由からです。
NCMEC が 2020 年に受け取った CyberTipline レポートは 2,100 万件にまでのぼり、その一つ一つに複数の画像や動画が含まれている可能性があります。実際、この 2,100 万件のレポートには、7,000 万件近くの児童への性的虐待の画像と動画が含まれていました。その中には当然、重複も存在します。NCMEC にとって完全に一致する画像を検出することは容易ですが、視覚的な類似を大規模かつリアルタイムに検出し、初見の画像を特定して優先順位を付けることまではできません。しかし、この高度な検知こそが、今この瞬間も性的虐待に苦しんでいる児童を特定する際、極めて重要な鍵となるのです。
Hash Matching API は NCMEC にどのようなメリットをもたらしましたか。
私たちには非常に重要な任務があります。それは、取得した重要な情報を精査し、一刻も早く法執行機関へ引き継ぐことです。このツールのメリットの一つは、CyberTipline レポートの価値を飛躍的に高める新たな手段が得られたことです。
NCMEC には、児童への性的虐待の画像と動画をくまなく調べてラベルを付けるという作業プログラムがあります。たとえば、「これは CSAM」、「これは CSAM ではない」、「これは人物の年齢を特定し難い」といったラベルです。しかし、ご想像のとおり、昨年だけでも 7,000 万件ものファイルがあり、そのすべてにラベルを付けることは到底不可能です。そこでこの API が、過去データとの照合を可能にしてくれます。あるファイルにタグを付けると、視覚的に類似するファイルを API ですべて識別できるので、リアルタイムで適切なタグを付けられます。その結果、2,600 万件を超える画像にタグを付けることができました。
これにより、法執行機関が優先度に基づいてレポートを審査できるようになり、法執行機関に送るレポートの価値が高まります。また、初見の画像を特定するためにも役立ちます。こうした画像の中には、世界のどこかで今現在、性的虐待の犠牲になっている児童が写っていることも少なくありません。ことわざにあるとおり、干し草の山から針を探すようなものですが、この場合、針は助けを必要としている一人の子どもなのです。Google のツールのおかげで、私たちは、今まさに助けを必要としている児童の画像に狙いを定めることができるようになりました。
CyberTipline レポートの処理や CSAM コンテンツの分析にあたる NCMEC の担当者の心身面においては、どのような影響がありましたか。
この CSAM 検出ツールによって、スタッフが何度も同じ画像を見る必要がなくなりました。性的虐待を受けている児童の画像があっても、その児童は現在すでに成人している可能性があります。こうした画像はネット上で半永久的に公開され続け、個人が継続的に被害を受けることにつながります。画像にタグを付けられるようになったことで、今まさに被害にあっている子どもたちの救出に焦点を当てることができ、またそうした違法画像の拡散も防ぐことができるようになります。
私たちがここにいる理由はそのためです。こうした子どもたちを助けたいのです。このタグ付けは、スタッフの心身の健康を維持するうえでも画期的な改善となりました。すでに確認済みの有害画像を、何度も見る必要がなくなったからです。
この取り組みは、この種のオンライン コンテンツの撲滅を図るテクノロジー企業全般にとって、どのように役立ちますか。
Google が CSAM 検出技術を各企業に提供して世界的な CSAM 対策を支援していること、Hash Matching API が NCMEC だけでなく多くの組織に直接的な影響を及ぼしている事実は広く知られています。どのテクノロジー企業も、NCMEC のプロセスがさらに合理的で効率的なものになったことの恩恵を受けています。CyberTipline レポートは、このツールがなかったときよりも迅速に、付加価値の高い方法で対応され処理されています。
NCMEC は、テクノロジー企業、法執行機関、被害者とそのご家族のための中心的なリソースです。問題と対峙し、解決策を導き出すうえで、非常に独特な視点を持っています。CyberTipline があるおかげで、新たに作成された CSAM や既存の CSAM がオンラインで出回っていることをすぐに把握でき、こうしたレポートはすべて法執行機関に提供されます。何よりも大切なのは、この活動の先には性的な被害を受け、搾取された児童が現実にいることを、私たちは決して忘れてはなりません。
性的虐待を受け、その様子が動画や画像として記録されてしまった児童が 2 万人以上いることがわかっています。被害者は、もちろんまだ未成年の場合もあれば、成人している場合もあります。そして、被害の苦しみは今も続いているのです。だからこそ、こうした画像が出回ることを可能な限り抑止し、画像を削除するために力を尽くすことが非常に重要なのです。
一般にはあまり理解されていないことかもしれませんが、既知の CSAM 画像が「古い」または「再度出回っている」と見なされることで、軽視されてしまう傾向があります。私たちは、そこに写っているのは実在する児童であること、そして 2 万人以上の児童が傷を癒やし、自分の人生を取り戻そうとしている現実を、強く訴え続けています。Google をはじめとする企業が、決してあってはならない画像を削除するためにあらゆる取り組みを行っているということが、被害者の方々の安心感につながっています。
児童への性的虐待の画像やコンテンツを見つけた場合は、全米行方不明・被搾取児童センター(NCMEC)、または世界各地の関係当局に通報してください。
Google は、オンライン上の児童性的虐待と搾取の撲滅を目指し、Google のサービスにおける児童性的虐待のコンテンツ(CSAM)の拡散防止に取り組んでいます。詳しくは、児童の保護に関するウェブサイトをご覧ください。