NCMEC, Google và Công nghệ tạo mã Hash hình ảnh
Tại Hoa Kỳ, Trung tâm quốc gia về Trẻ em mất tích và bị bóc lột (NCMEC) nhận được hàng triệu báo cáo về nội dung xâm hại tình dục trẻ em (CSAM) trên mạng mỗi năm. Phó chủ tịch cấp cao kiêm Giám đốc điều hành của NCMEC, Michelle DeLaune, phát biểu về sự phát triển của tổ chức, những bước tiến mà các công ty công nghệ đang đạt được trong việc giải quyết nội dung xâm hại tình dục trẻ em, cũng như Hash Matching API của Google.
Vui lòng cho chúng tôi biết về NCMEC và vai trò của bà trong tổ chức này.
Tôi đã làm việc tại NCMEC hơn 20 năm, vì vậy, tôi được chứng kiến sự phát triển trực tiếp của tổ chức này cũng như những thách thức và mối đe doạ đối với trẻ em và sự an toàn của các em. Vị trí công việc đầu tiên của tôi ở tổ chức này là chuyên viên phân tích CyberTipline.
Hệ thống CyberTipline được tạo ra và bắt đầu hoạt động từ năm 1998 để người dân có thể báo cáo về những vụ việc mà nạn nhân có thể là trẻ em hoặc về hành vi bóc lột trẻ em. Tại thời điểm đó, chúng tôi nhận được những báo cáo của các bậc cha mẹ lo ngại về việc người lớn nói những điều không phù hợp với con họ trên mạng, cũng như những người báo cáo rằng họ bắt gặp các trang web có chứa nội dung xâm hại tình dục trẻ em. Sau đó, một đạo luật liên bang đã được thông qua tại Hoa Kỳ yêu cầu các công ty công nghệ Hoa Kỳ phải báo cáo cho CyberTipline về mọi vụ việc có liên quan đến nội dung xâm hại tình dục trẻ em trên hệ thống của họ.
Những ngày đầu, chúng tôi đã nhận được hơn 100 báo cáo mỗi tuần về việc bóc lột trẻ em. Năm 2001, chúng tôi nhận được báo cáo đầu tiên từ một công ty công nghệ. Đến năm 2021, chúng tôi nhận được khoảng 70.000 báo cáo mới mỗi ngày. Một phần trong số báo cáo này đến từ công chúng, nhưng phần lớn báo cáo là do các công ty công nghệ gửi đến cho chúng tôi.
NCMEC giúp các công ty hoạt động trực tuyến chống lại Nội dung Xâm hại Tình dục Trẻ em bằng cách nào?
Luật pháp không yêu cầu các công ty phải có biện pháp chủ động chống lại nội dung xâm hại tình dục trẻ em. Chỉ cần đơn giản là, các công ty phải báo cáo khi phát hiện hoặc nhận thấy có Nội dung Xâm hại Tình dục Trẻ em. Đây là yếu tố then chốt thúc đẩy sự phát triển của công cụ CyberTipline mà chúng tôi thấy được trong những năm qua. Thế nhưng trong 5 năm trở lại đây, số lượng báo cáo đã tăng vọt đáng kể. Sự bùng nổ này có thể là kết quả của những nỗ lực mà nhiều công ty công nghệ đang tự nguyện thực hiện để chủ động phát hiện, loại bỏ và báo cáo Nội dung Xâm hại Tình dục Trẻ em.
Một trong những chương trình hàng đầu mà chúng tôi tiến hành tại Trung tâm quốc gia về Trẻ em Mất tích và Bị bóc lột chính là các nền tảng chia sẻ giá trị băm, để cả các công ty trong ngành công nghệ lẫn các Tổ chức Phi Chính phủ được chọn có thể đóng góp. Thông qua nền tảng chia sẻ giá trị băm dành cho tổ chức phi chính phủ, NCMEC cung cấp cho các công ty công nghệ quan tâm đến vấn đề này hơn 5 triệu giá trị băm liên quan đến Nội dung Xâm hại Tình dục Trẻ em, những giá trị này đã được xác nhận và kiểm tra kỹ lưỡng 3 lần để hỗ trợ họ trong nỗ lực chống lại Nội dung Xâm hại Tình dục Trẻ em trên mạng lưới của họ. Nhiều công ty lớn, bao gồm cả Google, đã tận dụng danh sách này và chủ động thực hiện các biện pháp để loại bỏ Nội dung Xâm hại Tình dục Trẻ em khỏi nền tảng của mình. Danh sách này cũng cho phép các Tổ chức Phi Chính phủ có uy tín khác hoạt động vì quyền lợi của trẻ em cung cấp dữ liệu băm của mình cho các công ty trong ngành công nghệ thông qua nền tảng băm của NCMEC, góp phần giảm thiểu việc một công ty công nghệ phải làm việc riêng lẻ với từng Tổ chức Phi Chính phủ.
Chúng tôi cũng cung cấp nền tảng Industry Hash Sharing (Chia sẻ Giá trị năm trong Ngành), cho phép các công ty được chọn có thể chia sẻ với nhau dữ liệu băm về Nội dung Xâm hại Tình dục Trẻ em. Chúng tôi đảm bảo rằng tất cả công ty sẵn sàng và có thể chủ động phát hiện Nội dung Xâm hại Tình dục Trẻ em đều có tất cả các công cụ cần thiết để thực hiện, cũng như có thể chia sẻ dữ liệu băm về loại nội dung này với nhau. Google là đơn vị đóng góp lớn nhất cho nền tảng này với khoảng 74% lượng dữ liệu băm trong danh sách.
Như anh/chị có thể hình dung, với khối lượng báo cáo đang nhận được hiện nay, chúng tôi nhận thấy có nhiều bức ảnh được báo cáo nhiều lần. Điều này hoàn toàn dễ hiểu vì các công ty đang sử dụng giá trị băm để phát hiện nội dung đã được nhận biết, nhưng khi số lượng nội dung đã được nhận biết tăng vọt, điều quan trọng hơn đối với NCMEC là có thể xác định được đâu là nội dung mới được tạo ra và chia sẻ trên không gian mạng.
Tính năng Hash Matching API (giao diện kết hợp tạo mã hash) của Google đã giúp NCMEC có thể sắp xếp thứ tự ưu tiên các báo cáo CyberTipline. Bà có thể cho chúng tôi biết thêm thông tin về cách dự án này được bắt đầu như thế nào được không?
Sự thành công của chương trình chia sẻ mã hash đã tạo ra một thử thách hoàn toàn mới: khối lượng dữ liệu tạo ra những thách thức to lớn. Một Tổ chức Phi Lợi nhuận tương tự như NCMEC không đủ năng lực để giải quyết khối lượng dữ liệu ở quy mô như vậy. Do đó, chúng tôi rất phấn khởi và biết ơn sự hỗ trợ của Google vì đã giúp chúng tôi xây dựng công cụ Hash Matching API.
Năm 2020, chúng tôi nhận được 21 triệu báo cáo CyberTipline, nhưng mỗi báo cáo lại có thể có nhiều hình ảnh và video. Trên thực tế, trong 21 triệu báo cáo này có đến gần 70 triệu hình ảnh và video xâm hại tình dục trẻ em. Rõ ràng là có sự trùng lặp trong khối lượng dữ liệu đó, và mặc dù NCMEC dễ dàng phát hiện chính xác các kết quả trùng khớp, nhưng chúng tôi không thể phát hiện các kết quả tương tự về mặt hình ảnh trên quy mô lớn và theo thời gian thực để xác định và ưu tiên những hình ảnh chưa từng thấy trước đây. Và đó là vấn đề quan trọng mà chúng tôi gặp phải khi cố gắng xác định những đứa trẻ vẫn đang bị xâm hại tình dục.
Hash Matching API mang lại những lợi ích gì cho NCMEC?
Công việc của chúng tôi rất quan trọng vì phải thu thập những thông tin thiết yếu này và chuyển đến cơ quan thực thi pháp luật càng nhanh càng tốt. Một trong những ưu điểm của công cụ này là nó mang lại một phương thức mới giúp chúng tôi bổ sung giá trị to lớn cho các báo cáo CyberTipline theo cách mới.
Chúng tôi có một chương trình làm việc mà ở đó chúng tôi sẽ xem xét từng hình ảnh và video xâm hại tình dục trẻ em rồi gắn nhãn, chẳng hạn như "Đây là Nội dung Xâm hại Tình dục Trẻ em", "Đây không phải là Nội dung Xâm hại Tình dục Trẻ em" hoặc "Khó xác định tuổi của trẻ hoặc người này". Nhưng, như anh/chị có thể hình dung, chỉ với riêng 70 triệu tệp trong năm ngoái, chúng tôi sẽ không bao giờ gắn nhãn được hết toàn bộ số tệp này. API này giúp chúng tôi có thể so sánh. Khi gắn thẻ một tệp, API giúp chúng tôi xác định tất cả các tệp tương tự về mặt hình ảnh để sau đó chúng tôi có thể gắn thẻ phù hợp theo thời gian thực. Kết quả là chúng tôi có thể gắn thẻ hơn 26 triệu hình ảnh.
Điều này giúp làm tăng giá trị cho các báo cáo mà chúng tôi gửi cho cơ quan thực thi pháp luật để họ có thể sắp xếp thứ tự ưu tiên xem báo cáo nào trước. Công cụ này cũng giúp chúng tôi xác định những hình ảnh chưa từng thấy trước đây. Những hình ảnh đó thường có nội dung về một đứa trẻ đang bị xâm hại tình dục ở đâu đó trên thế giới. Có thể ví như chúng tôi mò kim dưới đáy bể, nhưng trong trường hợp này thì cây kim đó là những đứa trẻ cần được giải cứu. Công cụ của Google cho phép chúng tôi tập trung vào hình ảnh của những đứa trẻ cần được trợ giúp ngay lập tức.
Điều này đã tác động như thế nào đến sức khoẻ của những nhân viên đánh giá của NCMEC, những người xử lý các báo cáo CyberTipline và phân tích Nội dung Xâm hại Tình dục Trẻ em?
Công cụ phát hiện Nội dung Xâm hại Tình dục Trẻ em này đã giúp giảm thiểu tình trạng nhân viên của chúng tôi phải xem đi xem lại các hình ảnh giống nhau. Một số trẻ bị xâm hại tình dục trong các bức ảnh giờ đây có thể đã bước vào độ tuổi trưởng thành. Những bức ảnh này vẫn tiếp tục tồn tại trên không gian mạng và những cá nhân này vẫn là nạn nhân. Việc có thể gắn thẻ những hình ảnh như vậy giúp chúng tôi tập trung vào những đứa trẻ trong các vụ xâm hại tình dục mới đây, trong khi vẫn có thể xóa và chặn khả năng xem đối với những hình ảnh bất hợp pháp.
Đội ngũ nhân viên của chúng tôi luôn cố gắng hết mình để trợ giúp những trẻ em đó. Đây là một bước tiến đột phá giúp đội ngũ nhân viên của chúng tôi có thể đảm bảo được sức khỏe và không phải tiếp xúc nhiều lần với cùng một nội dung độc hại đã được nhận diện.
Công cụ này giúp ích gì cho các công ty công nghệ trong cuộc chiến chống lại loại nội dung này trên mạng?
Chúng tôi biết rằng Google cung cấp công nghệ phát hiện Nội dung Xâm hại Tình dục Trẻ em cho các công ty để giúp hỗ trợ cuộc chiến toàn cầu chống lại loại nội dung này và ngay chính Hash Matching API cũng có tác động trực tiếp đến nhiều tổ chức khác ngoài NCMEC. Lợi ích mà tất cả các công ty công nghệ đang thụ hưởng chính là một quy trình tinh gọn hơn và hiệu quả hơn tại Trung tâm Quốc gia. Giờ đây, chúng tôi có thể giải quyết và xử lý các báo cáo CyberTipline kịp thời hơn và mang lại nhiều giá trị hơn so với thời điểm chưa có công cụ này.
NCMEC chính là nguồn lực trung tâm cho các công ty công nghệ, cơ quan thực thi pháp luật, cũng như các nạn nhân và gia đình của họ. Chúng tôi hiện có một "lăng kính" đặc biệt tuyệt vời, giúp chúng tôi nhìn nhận các vấn đề và đưa ra giải pháp. Nhờ có CyberTipline, chúng tôi nhận biết rõ ràng hơn về Nội dung Xâm hại Tình dục Trẻ em mới phát sinh và Nội dung Xâm hại Tình dục Trẻ em cũ đang được phát tán trên mạng. Chúng tôi cung cấp những báo cáo này cho cơ quan thực thi pháp luật. Chúng ta không bao giờ được quên rằng: đằng sau những báo cáo này chính là những đứa trẻ thực sự bị bóc lột và xâm hại tình dục.
Theo chúng tôi biết, có hơn 20.000 trẻ em được xác định là đã bị xâm hại tình dục và những hành vi xâm hại đó bị lưu lại, dù là trong video hay hình ảnh. Những nạn nhân này, một số dĩ nhiên vẫn còn là trẻ em và một số nay đã trưởng thành, vẫn đang tiếp tục phải gánh chịu tác động của hành vi xâm hại đó. Do đó, điều quan trọng là chúng ta phải làm mọi việc trong khả năng để giảm thiểu và đẩy lùi việc phát tán những hình ảnh như vậy.
Một vấn đề mà công chúng có thể chưa nhận thức được rõ ràng chính là vẫn có thể xảy ra việc bỏ sót Nội dung Xâm hại Tình dục Trẻ em đã được nhận biết, bởi vì có thể những hình ảnh đó được xem là “cũ” hoặc “phát tán lại”. Chúng tôi không ngừng gióng lên hồi chuông cảnh tỉnh mọi người rằng: đây là những đứa trẻ thực sự – hơn 20.000 số phận đó vẫn đang cố gắng chữa lành những tổn thương và giành lại quyền kiểm soát cuộc đời mình. Sẽ là một niềm an ủi lớn lao đối với các em khi biết rằng các công ty như Google đang nỗ lực hết sức để loại bỏ những hình ảnh tái hiện những khoảnh khắc tồi tệ nhất cuộc đời họ.
Nếu bắt gặp hình ảnh hoặc nội dung xâm hại tình dục trẻ em trên mạng, bạn có thể báo cáo cho Trung tâm Quốc gia về Trẻ em Mất tích và Bị bóc lột (NCMEC), hoặc cho cơ quan có thẩm quyền trên toàn thế giới.
Google cam kết chống lại việc xâm hại tình dục và bóc lột trẻ em trên mạng cũng như cam kết ngăn chặn việc sử dụng các dịch vụ của Google để phát tán nội dung xâm hại tình dục trẻ em (CSAM). Bạn có thể tìm hiểu thêm thông tin trên trang web về Bảo vệ Trẻ em của chúng tôi.
Những tiến bộ về an ninh mạng
Tìm hiểu cách chúng tôi bảo vệ an toàn cho nhiều người trên mạng hơn mọi cá nhân và tổ chức khác trên toàn thế giới.
Tìm hiểu thêm