NCMEC, Google et la technologie de hachage d'images


Aux États-Unis, le National Center for Missing & Exploited Children (NCMEC) reçoit chaque année des millions de signalements de contenus en ligne d'abus sexuels sur mineurs. Michelle DeLaune, vice-présidente senior et directrice des opérations du NCMEC, revient sur l'évolution de l'organisation et comment les entreprises technologiques luttent contre les contenus d'abus sexuels sur mineurs grâce notamment à l'API Hash Matching de Google.

Que pouvez-vous nous dire sur le NCMEC et votre rôle au sein de celui-ci ?


Je travaille au NCMEC depuis plus de 20 ans et j'ai ainsi suivi de près l'évolution de l'organisme ainsi que les problématiques et menaces qui pèsent sur nos enfants et leur sécurité. J'ai commencé ma carrière ici, en tant qu'analyste CyberTipline.

Le dispositif CyberTipline a été créé en 1998 pour permettre au grand public de signaler des cas potentiels d'exploitation des enfants. À l'époque, nous recevions des signalements de parents inquiets qu'un adulte aborde de manière inappropriée leur enfant en ligne mais aussi de personnes qui découvraient des sites Web contenant des contenus d'abus sexuels sur mineurs. Une loi fédérale a ensuite été adoptée aux États-Unis, exigeant des entreprises technologiques américaines qu'elles signalent au dispositif CyberTipline tout incident apparent de contenus d'abus sexuels sur mineurs dans leurs plateformes.

Au début, nous recevions une centaine de signalements d’exploitation d’enfants par semaine. Le premier rapport que nous avons reçu d'une entreprise technologique date de 2001. Vingt ans plus tard, nous recevons environ 70 000 signalements par jour. Certains d'entre eux proviennent de particuliers, mais la majorité sont envoyés par des entreprises technologiques.

Comment le NCMEC aide-t-il les entreprises en ligne à lutter contre les contenus d'abus sexuels sur mineurs ?


La loi n'exige pas d'efforts proactifs de la part des entreprises. Si celles-ci détectent des contenus d'abus sexuels sur mineurs ou en sont informées, elles sont tenues de les signaler. Ce cadre règlementaire est à l'origine de la forte progression du dispositif CyberTipline au fil des ans. Mais c'est au cours des cinq dernières années que le nombre de signalements a le plus augmenté. L'explosion peut être attribuée aux mesures que de nombreuses entreprises technologiques déploient volontairement pour identifier, supprimer et signaler ces contenus de manière proactive.

Parmi les programmes phares du National Center for Missing & Exploited Children se trouvent les plateformes de partage de valeurs de hachage. Il est en effet possible de créer une valeur de hachage (ou empreinte) pour un fichier qui est connu pour contenir du contenu d'abus sexuel sur mineur. Ensuite, on peut partager cette empreinte avec d'autres organisations, afin que celles-ci comparent leurs propres fichiers avec ceux qui ont déjà été vérifiés comme étant illégaux. C'est ce que l'on appelle faire une correspondance de valeurs de hachage. Le NCMEC gère plusieurs plateformes de partage de valeurs de hachage de ce type, dont deux reçoivent les contributions des entreprises et une autre reçoit les contributions de certaines ONG. Grâce à la plateforme de partage de hachage pour les ONG, le NCMEC fournit aux entreprises technologiques intéressées plus de cinq millions de valeurs de hachage concernant des contenus d'abus sexuels sur mineurs confirmés après trois phases de validation. Le but est de les aider à lutter contre ce type de contenus sur leurs réseaux. De nombreuses grandes entreprises, dont Google, font usage de cette liste et prennent des mesures proactives pour supprimer les contenus d'abus sexuels sur mineurs de leurs plateformes. La liste permet également à des ONG de renom dédiées aux enfants de partager leurs empreintes avec le secteur technologique via la plateforme de hachage du NCMEC, afin d'éviter que ces entreprises n'aient à s'adresser individuellement à chaque ONG.

Nous proposons également une plateforme sectorielle qui permet à certaines entreprises de partager entre elles leurs valeurs de hachage de contenus d'abus sexuels sur mineurs. Nous veillons à ce que toute entreprise désireuse et en mesure de détecter ces contenus de manière proactive dispose des outils nécessaires pour le faire, et à ce que les entreprises puissent partager entre elles leurs propres empreintes. Google est le plus grand contributeur à cette plateforme, comptant pour environ 74 % du nombre total de valeurs de hachage.

Comme vous pouvez l'imaginer, vu le nombre de rapports que nous recevons, les mêmes images sont signalées plusieurs fois. Cela est tout à fait normal puisque les entreprises utilisent des valeurs de hachage pour détecter des contenus connus. Cependant, à mesure que ceux-ci augmentent, il importe davantage pour le NCMEC d'identifier les nouveaux contenus qui ont été produits et partagés en ligne.

L'API Hash Matching de Google a aidé le NCMEC à hiérarchiser les rapports CyberTipline. Comment ce projet a-t-il commencé ?


La réussite du programme de partage de valeurs de hachage nous a placés devant un nouveau défi : la gestion du nombre de signalements. Un organisme à but non lucratif comme le NCMEC ne dispose pas de la puissance de calcul nécessaire pour traiter un tel volume. C'est pourquoi nous étions ravis et reconnaissants de recevoir l'aide de Google pour créer l'API Hash Matching.

En 2020, nous avons reçu 21 millions de rapports CyberTipline, chacun pouvant contenir plusieurs images et vidéos. Nous avons ainsi réceptionné près de 70 millions d'images et de vidéos d'abus sexuels sur mineurs, dont nombre de doublons. Or, si le NCMEC peut facilement détecter les correspondances exactes, il nous était impossible d'en faire autant pour les correspondances visuellement similaires à grande échelle et en temps réel afin d'identifier les images encore jamais vues pour les traiter en priorité. Cette analyse est pourtant essentielle quand il s'agit d'identifier les enfants qui font actuellement l'objet d'abus sexuels.

Quels avantages le NCMEC a-t-il tirés de l'API Hash Matching ?


Nous avons une mission très importante : recueillir ces informations essentielles et les communiquer le plus rapidement possible aux autorités. Cet outil nous permet de largement améliorer l'impact des rapports CyberTipline.

Notre travail consiste à analyser et à classifier toutes les images et vidéos d'abus sexuels sur mineurs. Nous indiquons par exemple s'il s'agit ou non de contenus d'abus sexuels sur mineurs ou s'il est difficile d'identifier l'âge de l'enfant ou de la personne concernée. Comme vous pouvez l'imaginer, avec 70 millions de fichiers uniquement au cours de l'année dernière, il est impossible de tout classifier. Cette API nous permet de les comparer les uns aux autres. Quand nous attribuons un tag à un fichier, l'API nous permet d'identifier tous les fichiers visuellement similaires, auxquels nous pouvons ensuite ajouter des tags en temps réel. Nous avons ainsi pu catégoriser plus de 26 millions d'images.

Cela permet d'enrichir les signalements que nous envoyons aux autorités pour qu'elles puissent déterminer ceux à examiner en priorité. L'API nous aide également à identifier les images encore jamais vues. Ces images concernent souvent un enfant qui est au même moment victime d'abus sexuels quelque part dans le monde. Parfois, cela revient à chercher une aiguille dans une botte de foin, mais en l'occurrence, l'aiguille est un enfant qui a besoin d'être sauvé. L'outil de Google nous permet de donner la priorité aux images impliquant des enfants qui ont besoin d'une intervention immédiate.

Quel impact l'API a-t-elle eu sur le bien-être des examinateurs manuels du NCMEC qui traitent les rapports CyberTipline et analysent les contenus d'abus sexuels sur mineurs ?


L'outil de détection de contenus d'abus sexuels sur mineurs a réduit la nécessité pour notre personnel de s'exposer encore et encore aux mêmes images. Il circule aujourd'hui des images d'enfants victimes d'abus sexuels, alors qu'ils sont déjà à l'âge adulte. Ces images sont toujours disponibles en ligne et contribuent à leur victimisation permanente. Les identifier permet à notre personnel de se concentrer sur les mineurs victimes d'abus sexuels récents, tout en supprimant les images illégales.

Nos examinateurs sont là pour aider ces enfants. L'API a permis d'améliorer considérablement la possibilité d'adopter des pratiques favorisant leur bien-être et d'alléger le fardeau du visionnage répétitif des mêmes contenus nuisibles déjà identifiés.

Comment cette initiative permet-elle aux entreprises technologiques de lutter contre ce type de contenus en ligne ?


Google fournit une technologie de détection des contenus d'abus sexuels sur mineurs à des entreprises dans le cadre de la lutte mondiale contre ce fléau, et l'API Hatch Matching a un impact direct sur de nombreuses entités autres que le NCMEC. Toutes les entreprises technologiques peuvent travailler grâce aux procédures simplifiées et efficaces du NCMEC. Nous traitons les rapports CyberTipline plus rapidement et plus efficacement avec cet outil.

Le NCMEC est une ressource essentielle pour les entreprises technologiques, les autorités, les victimes et leurs familles. L'outil de Google nous fournit un moyen unique d'aborder les problèmes et les solutions. Grâce au dispositif CyberTipline, nous surveillons de près les contenus, nouveaux ou existants, d'abus sexuels sur mineurs qui circulent en ligne. Tous ces signalements sont mis à la disposition des forces de l'ordre. On ne doit jamais perdre de vue qu'il s'agit de vrais enfants qui sont victimes de violences et d'exploitation sexuelles.

Plus de 20 000 enfants identifiés ont été victimes d'abus sexuels qui ont été enregistrés sous forme d'images ou de vidéos. Ces personnes, dont certaines sont mineures et d'autres sont devenues adultes, ont parfaitement conscience de la victimisation qu'elles subissent. C'est pourquoi nous jugeons essentiel de faire notre possible pour limiter la circulation de ces contenus.

On a parfois tendance à oublier les contenus connus d'abus sexuels sur mineurs, parce que les images sont considérées comme « anciennes » ou « remises en circulation ». Nous ne cessons de rappeler qu'il s'agit là de véritables enfants, de plus de 20 000 personnes qui essaient de se remettre et de retrouver une vie normale. Savoir que des entreprises comme Google font leur possible pour supprimer les images représentant les pires moments de leur vie constitue pour elles une grande source de réconfort.

Si vous trouvez des images d'abus sexuels sur des mineurs en ligne, signalez-les au National Center for Missing and Exploited Children (NCMEC), ou à une autorité compétente dans le monde entier

Google s'engage à lutter contre l'exploitation des enfants et les abus sexuels sur mineurs en ligne, et à empêcher l'utilisation de ses services en vue de propager des contenus d'abus sexuels sur des enfants. Pour en savoir plus, consultez notre site Web sur la protection des enfants.

Cybersécurité

Découvrez comment nous protégeons plus d'utilisateurs en ligne que n'importe quelle autre entreprise au monde.

En savoir plus