NCMEC, Google và Công nghệ băm hình ảnh
Tại Hoa Kỳ, Trung tâm quốc gia về Trẻ em mất tích và bị bóc lột (NCMEC) nhận được hàng triệu báo cáo về nội dung xâm hại tình dục trẻ em trên mạng mỗi năm. Phó chủ tịch cấp cao kiêm Giám đốc điều hành của NCMEC, Michelle DeLaune, phát biểu về sự phát triển của tổ chức, những bước tiến mà các công ty công nghệ đang đạt được trong việc giải quyết nội dung xâm hại tình dục trẻ em, cũng như Hash Matching API (API So khớp giá trị băm) của Google.
Vui lòng cho chúng tôi biết về NCMEC và vai trò của bà trong tổ chức này.
Tôi làm việc tại NCMEC hơn 20 năm. Vì vậy, tôi đã tận mắt chứng kiến sự phát triển của tổ chức này cũng như những thách thức và mối đe doạ đối với trẻ em và sự an toàn của trẻ em. Vai trò đầu tiên của tôi ở tổ chức này là chuyên viên phân tích CyberTipline.
Hệ thống CyberTipline được tạo ra và bắt đầu hoạt động từ năm 1998 để người dân có thể báo cáo về những vụ việc mà nạn nhân có thể là trẻ em hoặc về hành vi bóc lột trẻ em. Vào thời điểm đó, chúng tôi nhận được báo cáo của các bậc cha mẹ lo ngại về việc người lớn nói những điều không phù hợp với con họ trên mạng, cũng như những người báo cáo rằng họ bắt gặp các trang web có chứa nội dung xâm hại tình dục trẻ em. Sau đó, một đạo luật liên bang đã được thông qua tại Hoa Kỳ yêu cầu các công ty công nghệ Hoa Kỳ phải báo cáo cho CyberTipline về mọi vụ việc rõ ràng là có liên quan đến nội dung xâm hại tình dục trẻ em trên hệ thống của họ.
Những ngày đầu, có lẽ chúng tôi đã nhận được hơn 100 báo cáo mỗi tuần về việc bóc lột trẻ em. Năm 2001, chúng tôi nhận được báo cáo đầu tiên của một công ty công nghệ. Đến năm 2021, chúng tôi nhận được khoảng 70.000 báo cáo mới mỗi ngày. Một phần trong số báo cáo này đến từ công chúng, nhưng phần lớn báo cáo là do các công ty công nghệ gửi đến cho chúng tôi.
NCMEC giúp các công ty hoạt động trực tuyến chống lại nội dung xâm hại tình dục trẻ em bằng cách nào?
Luật pháp không yêu cầu các công ty phải có biện pháp chủ động chống lại nội dung xâm hại tình dục trẻ em. Mà chỉ là nếu phát hiện hoặc nhận biết được nội dung xâm hại tình dục trẻ em thì các công ty phải báo cáo. Đây là yếu tố then chốt thúc đẩy sự phát triển của công cụ CyberTipline trong những năm qua. Nhưng 5 năm trở lại đây, số lượng báo cáo tăng vọt đáng kể. Sự bùng nổ này có thể là kết quả của những nỗ lực mà nhiều công ty công nghệ đang tự nguyện thực hiện để chủ động phát hiện, loại bỏ và báo cáo nội dung xâm hại tình dục trẻ em.
Một trong những chương trình hàng đầu mà chúng tôi tiến hành tại Trung tâm quốc gia về Trẻ em mất tích và bị bóc lột chính là các nền tảng chia sẻ giá trị băm, để cả các công ty trong ngành công nghệ lẫn các tổ chức phi chính phủ được chọn có thể đóng góp. Thông qua nền tảng chia sẻ giá trị băm dành cho tổ chức phi chính phủ, NCMEC cung cấp cho các công ty công nghệ có quan tâm đến vấn đề này hơn 5 triệu giá trị băm liên quan đến nội dung xâm hại tình dục trẻ em đã được xác nhận và kiểm tra kỹ lưỡng 3 lần để hỗ trợ họ trong nỗ lực chống lại nội dung xâm hại tình dục trẻ em trên mạng của họ. Nhiều công ty lớn, bao gồm cả Google, đã tận dụng danh sách này và chủ động thực hiện các biện pháp để loại bỏ nội dung xâm hại tình dục trẻ em khỏi nền tảng của mình. Danh sách này cũng cho phép các tổ chức phi chính phủ có uy tín khác hoạt động vì quyền lợi của trẻ em cung cấp dữ liệu băm của mình cho các công ty trong ngành công nghệ thông qua nền tảng băm của NCMEC, góp phần hạn chế việc một công ty công nghệ phải làm việc riêng lẻ với từng tổ chức phi chính phủ.
Chúng tôi cũng cung cấp nền tảng Chia sẻ giá trị băm theo ngành, cho phép các công ty được chọn có thể chia sẻ với nhau dữ liệu băm về nội dung xâm hại tình dục trẻ em. Chúng tôi đảm bảo rằng mọi công ty có thiện chí và có thể chủ động phát hiện nội dung xâm hại tình dục trẻ em đều có tất cả công cụ cần thiết để thực hiện, cũng như có thể chia sẻ với nhau dữ liệu băm về loại nội dung này. Google là đơn vị đóng góp lớn nhất cho nền tảng này với khoảng 74% lượng dữ liệu băm trong danh sách.
Với khối lượng báo cáo khổng lồ nhận được hiện nay, chúng tôi nhận thấy có nhiều bức ảnh được báo cáo nhiều lần. Điều này là dễ hiểu vì các công ty đang sử dụng giá trị băm để phát hiện nội dung đã được nhận biết. Nhưng khi số lượng nội dung đã được nhận biết tăng vọt, điều quan trọng hơn đối với NCMEC là có thể xác định được đâu là nội dung mới sản xuất và phát tán trực tuyến.
Hash Matching API (API So khớp giá trị băm) của Google đã giúp NCMEC có thể sắp xếp thứ tự ưu tiên đối với các báo cáo CyberTipline. Bà có thể cho chúng tôi biết thêm thông tin về sự khởi đầu của dự án này được không?
Sự thành công của chương trình chia sẻ giá trị băm đã tạo ra một thử thách hoàn toàn mới: giải quyết một khối lượng dữ liệu khổng lồ. Đó thật sự là một thách thức rất lớn. Một tổ chức phi lợi nhuận như NCMEC không đủ năng lực điện toán để giải quyết khối lượng dữ liệu ở quy mô như vậy. Do đó, chúng tôi rất phấn khởi và biết ơn sự hỗ trợ của Google trong việc giúp xây dựng công cụ Hash Matching API.
Năm 2020, chúng tôi nhận được 21 triệu báo cáo CyberTipline, nhưng mỗi báo cáo lại có thể có nhiều hình ảnh và video. Thực tế là trong 21 triệu báo cáo đó có đến gần 70 triệu hình ảnh và video xâm hại tình dục trẻ em. Rõ ràng là có sự trùng lặp trong khối lượng dữ liệu đó. Mặc dù NCMEC dễ dàng phát hiện các kết quả trùng khớp chính xác, nhưng chúng tôi không thể phát hiện các kết quả tương tự về mặt hình ảnh trên quy mô lớn và theo thời gian thực để xác định và ưu tiên những hình ảnh chưa từng thấy trước đây. Và đó là vấn đề quan trọng mà chúng tôi gặp phải khi cố gắng xác định những đứa trẻ vẫn đang bị xâm hại tình dục.
Hash Matching API mang lại những lợi ích gì cho NCMEC?
Công việc của chúng tôi là thu thập những thông tin quan trọng này và chuyển đến cơ quan thực thi pháp luật càng nhanh càng tốt, việc này thực sự rất quan trọng. Một trong những ưu điểm của công cụ này là nó giúp chúng tôi bổ sung giá trị to lớn cho các báo cáo CyberTipline theo cách mới.
Trong chương trình làm việc của mình, chúng tôi sẽ xem xét từng hình ảnh và video xâm hại tình dục trẻ em rồi gắn nhãn, chẳng hạn như "Đây là nội dung xâm hại tình dục trẻ em", "Đây không phải là nội dung xâm hại tình dục trẻ em" hoặc "Khó xác định tuổi của đứa trẻ hoặc người này". Nhưng, chỉ riêng với 70 triệu tệp trong năm ngoái, chúng tôi sẽ không bao giờ gắn nhãn được hết toàn bộ số này. API này giúp chúng tôi có thể so sánh. Khi chúng tôi gắn thẻ một tệp, API này giúp chúng tôi xác định mọi tệp tương tự về mặt hình ảnh để sau đó chúng tôi có thể gắn thẻ phù hợp theo thời gian thực. Kết quả là chúng tôi có thể gắn thẻ hơn 26 triệu hình ảnh.
Điều này giúp làm tăng giá trị cho các báo cáo mà chúng tôi gửi cho cơ quan thực thi pháp luật để họ có thể sắp xếp thứ tự ưu tiên xem báo cáo nào trước. Công cụ này cũng giúp chúng tôi xác định những hình ảnh chưa từng thấy trước đây. Những hình ảnh đó thường có nội dung về một đứa trẻ đang bị xâm hại tình dục ở đâu đó trên thế giới. Có thể ví như chúng tôi mò kim dưới đáy bể, nhưng trong trường hợp này thì cây kim đó là những đứa trẻ cần được giải cứu. Công cụ của Google cho phép chúng tôi tập trung vào hình ảnh của những đứa trẻ cần được trợ giúp ngay lập tức.
Điều này đã tác động như thế nào đến sức khoẻ của những nhân viên đánh giá của NCMEC, những người xử lý các báo cáo CyberTipline và phân tích nội dung xâm hại tình dục trẻ em?
Công cụ phát hiện nội dung xâm hại tình dục trẻ em này đã giúp giảm thiểu tình trạng nhân viên của chúng tôi phải xem đi xem lại các hình ảnh giống nhau. Một số trẻ bị xâm hại tình dục trong các bức ảnh giờ đây có thể đã bước vào độ tuổi trưởng thành. Những bức ảnh như vậy vẫn tiếp tục tồn tại trên không gian mạng và họ vẫn là nạn nhân. Việc có thể gắn thẻ những hình ảnh như vậy giúp chúng tôi tập trung vào những đứa trẻ trong các vụ xâm hại tình dục mới đây, trong khi vẫn xoá được hình ảnh bất hợp pháp.
Đội ngũ nhân viên của chúng tôi luôn cố gắng hết mình để trợ giúp những trẻ em đó. Đây là một bước tiến đột phá giúp đội ngũ nhân viên của chúng tôi có thể đảm bảo được sức khoẻ và không phải tiếp xúc nhiều lần với cùng một nội dung độc hại đã được nhận diện.
Công cụ này giúp ích gì cho các công ty công nghệ trong cuộc chiến chống lại loại nội dung này trên mạng?
Chúng tôi biết rằng Google cung cấp công nghệ phát hiện nội dung xâm hại tình dục trẻ em cho các công ty để giúp hỗ trợ cuộc chiến toàn cầu chống lại loại nội dung này. Ngay chính Hash Matching API cũng có tác động trực tiếp đến nhiều tổ chức khác ngoài NCMEC. Lợi ích mà tất cả công ty công nghệ đang tận hưởng chính là một quy trình tinh gọn hơn và hiệu quả hơn tại Trung tâm quốc gia. Giờ đây, chúng tôi có thể giải quyết và xử lý các báo cáo CyberTipline kịp thời hơn và mang lại nhiều giá trị hơn so với thời kỳ không có công cụ này.
NCMEC chính là nguồn lực trung tâm cho các công ty công nghệ, cơ quan thực thi pháp luật, cũng như các nạn nhân và gia đình của họ. Chúng tôi hiện có một "lăng kính" đặc biệt, giúp chúng tôi nhìn nhận các vấn đề và đưa ra giải pháp. Nhờ có CyberTipline, chúng tôi nhận biết rõ ràng hơn về nội dung xâm hại tình dục trẻ em mới tạo và nội dung xâm hại tình dục trẻ em cũ đang được phát tán trên mạng. Chúng tôi cung cấp toàn bộ những báo cáo này cho cơ quan thực thi pháp luật. Chúng ta không bao giờ được quên rằng: đằng sau những báo cáo này chính là những đứa trẻ thực sự bị bóc lột và xâm hại tình dục.
Theo chúng tôi biết, có hơn 20.000 trẻ em được xác định là đã bị xâm hại tình dục và những hành vi xâm hại đó bị lưu lại, dù là trong video hay hình ảnh. Những nạn nhân này, một số vẫn còn là trẻ em và một số nay đã trưởng thành, vẫn đang tiếp tục phải gánh chịu tác động của hành vi ngược đãi đó. Do đó, điều quan trọng là chúng ta phải làm mọi việc trong khả năng để hạn chế và giảm thiểu việc phát tán những hình ảnh như vậy.
Một vấn đề mà công chúng có thể chưa nhận thức được rõ ràng chính là: vẫn có thể xảy ra việc bỏ sót nội dung xâm hại tình dục trẻ em đã được nhận biết, bởi vì có thể những hình ảnh đó được xem là “cũ” hoặc “phát tán lại”. Chúng tôi không ngừng gióng lên hồi chuông cảnh tỉnh mọi người rằng: đây là những đứa trẻ thực sự – hơn 20.000 số phận đó vẫn đang cố gắng chữa lành những tổn thương và giành lại quyền kiểm soát cuộc đời mình. Sẽ là một niềm an ủi lớn lao đối với họ khi biết rằng các công ty như Google đang nỗ lực hết sức để loại bỏ những hình ảnh mô tả những khoảnh khắc tồi tệ nhất cuộc đời họ.
Nếu bắt gặp hình ảnh hoặc nội dung xâm hại tình dục trẻ em trên mạng, bạn có thể báo cáo cho Trung tâm quốc gia về Trẻ em mất tích và bị bóc lột (NCMEC), hoặc cho cơ quan có thẩm quyền trên toàn thế giới.
Google cam kết chống lại việc xâm hại tình dục và bóc lột trẻ em trên mạng cũng như cam kết ngăn chặn việc sử dụng các dịch vụ của Google để phát tán nội dung xâm hại tình dục trẻ em. Bạn có thể tìm hiểu thêm trên trang web về bảo vệ trẻ em của chúng tôi.