Chiến đấu với tội phạm bằng "vũ khí" dữ liệu lớn

Thứ Tư, 03/01/2018, 11:01
Vào thế kỷ 19, bác sĩ Cesare Lombroso người Ý được nhiều người biết đến vì có khả năng nhận diện được bọn tội phạm bằng vẻ bề ngoài của họ. Ðối với bác sĩ Lombroso, trán dốc, tai to, cánh tay rất dài… là những dấu hiệu cho thấy một người đang sống một cuộc sống sai trái với luật pháp.


Tuy nhiên, hiện nay để xác định một tội phạm lại không hề đơn giản mà cần rất nhiều nỗ lực. Và, dữ liệu lớn (big data) đang tỏ ra có hiệu quả trong công việc này.

Tiền phạm pháp?

Thông tin chia sẻ công cộng kết hợp với dữ liệu từ các cơ quan chính quyền địa phương, dịch vụ xã hội và thông tin tình báo thu thập được bởi các sĩ quan cảnh sát đang giúp các lực lượng thực thi phá luật trên thế giới nhận diện rắc rối trước khi nó bắt đầu.

Đây không phải là một kịch bản "tiền-tội phạm" được đưa ra trong bộ phim khoa học viễn tưởng “Minority Report” (Báo cáo thiểu số)  năm 2002, nhưng nó gần như vậy.

Bác sĩ Cesare Lombroso.

Theo cựu cảnh sát Shaun Hipgrave, hiện là chuyên gia tư vấn an ninh của IBM: "Đó là về cách sử dụng dữ liệu lớn và phân tích dữ liệu một cách thông minh hơn, bạn chỉ cần cho chúng tiếp cận thông tin mà chúng chưa từng có trước đây". Nó giúp cảnh sát phản ứng tốt hơn nhiều và dần dần phát hiện rắc rối thực sự và những người gây rối ở khu phố, các tòa nhà hoặc đường phố.

Khi thông tin như thế trở nên rõ ràng, cảnh sát có thể làm gì đó trước khi có ai đó quay số 999. Và điều đó có ý nghĩa đối với mọi người cũng như đối với các quán rượu hay câu lạc bộ.

Phần mềm phân tích dữ liệu kết nối với các sáng kiến của chính phủ về cái gọi là "những gia đình gặp khó khăn" có thể là mối liên hệ của rất nhiều vấn đề ở các thị trấn, thành phố. Nhận ra những người nằm trong các nhóm này có thể giúp bạn giải quyết các vấn đề sắp xảy ra.

"Khi bạn sử dụng dữ liệu lớn, bạn có thể thấy mối quan hệ giữa một gia đình và một gia đình gặp khó khăn. Nó tạo ra một bức tranh đầy đủ hơn, toàn diện hơn", ông Hipgrave nói. "Điều này mang ý nghĩa phòng chống tội phạm, và một phần là hiểu thêm về một cộng đồng và phát hiện cách thức để thay đổi kiến trúc của nó".

Tội phạm súng

Phân tích dữ liệu lớn cũng ngày càng quan trọng trong cuộc chiến chống tội phạm xuyên quốc gia.

Trong cuộc điều tra vụ cô Jill Dando bị bắn chết vào năm 1999, cảnh sát phải mất nhiều thời gian và công sức cho việc tìm lại lịch sử của viên đạn đã giết nạn nhân, theo ông Babak Akhgar, giáo sư về tin học tại Đại học Sheffield Hallam.

Ảnh minh họa.

Vào thời điểm đó, các thám tử phải phối hợp với cảnh sát các nước khác để tìm thông tin về viên đạn và loại súng có thể đã bắn ra. Giáo sư Akhgar nói rằng đó là một nhiệm vụ rất lớn và là một nhiệm vụ khó khăn. Ông nói: "Loại tội phạm này hiện nay có yếu tố đa quốc gia rất cụ thể. Qua nghiên cứu cho thấy tội phạm đang sử dụng súng và đạn như là một hình thức tiền tệ".

Kết quả là, vũ khí và đạn dược của chúng thường xuyên vượt qua biên giới và đi qua tay của nhiều tội phạm chuyên nghiệp và nguy hiểm.

Cơ sở dữ liệu và phân tích có tên là Odyssey chuyên thu thập thông tin về thời điểm các loại vũ khí đã được sử dụng và được bắn ra từ đâu.

Dữ liệu lớn là cần thiết cho dự án này vì có nhiều loại dữ liệu các lực lượng cảnh sát ở các quốc gia châu Âu khác nhau sử dụng để phân loại vũ khí, đạn dược, loại hành vi tội phạm cũng như các loại tội phạm.

Lạm dụng tình dục

Tính chất đa quốc gia vốn có của một tội ác nghiêm trọng khác, lạm dụng tính dục trẻ em, cũng đang được giải quyết bằng sự trợ giúp bởi các công cụ phân tích các tập dữ liệu lớn gồm: các hình ảnh tĩnh, video, HTML và văn bản.

Johann Hoffman làm việc tại Công ty hình ảnh pháp y NetClean cho biết, vấn đề ở đây là số lượng dữ liệu liên quan.

Ảnh minh họa.

Thông thường, lực lượng cảnh sát phải đối mặt với lượng dữ liệu lên đến hàng gigabyte và đôi khi terabyte khi họ bắt giữ một kẻ ấu dâm, hay bố ráp một kẻ điều hành dịch vụ buôn bán hình ảnh lạm dụng tình dục trẻ em.

Ông Hoffman nói: "Số lượng dữ liệu đang tăng lên liên tục. Vấn đề là, làm thế nào mà một cảnh sát có thể lướt qua số lượng dữ liệu khổng lồ này? Khi bạn phải đối mặt với hàng terabytes thì không một ai có thể xem qua được toàn bộ".

Tình hình phức tạp do thực tế là hình ảnh và video lạm dụng được buôn bán rộng rãi. Nếu không có công cụ phân tích dữ liệu lớn, cảnh sát khó có thể dành nhiều thời gian để thực hiện lại các bước mà các lực lượng khác đã thực hiện để tìm ra người đứng sau một bộ hình ảnh hoặc người mà họ miêu tả.

Ông Hoffman cho biết, có một dự án liên châu Âu đang giúp các lực lượng cảnh sát phát hiện tư liệu mới một cách nhanh chóng hơn, và phân tích này đã dẫn tới một loạt thành công chống lại những kẻ lạm dụng.

“Sụp đổ tiền mặt”

Phân tích dữ liệu cũng đang được sử dụng để phát hiện các mẫu hành vi bất thường để chống gian lận tài chính.

Cảnh sát Durham đã ngăn chặn một cuộc lừa đảo "sụp đổ tiền mặt" liên quan đến một nhóm tội phạm có tổ chức lừa đảo các công ty bảo hiểm bằng cách yêu cầu bồi thường nhiều lần cho cùng một tai nạn. Có nhiều tai nạn cho thấy là do được tổ chức để tạo ra một yêu cầu bồi thường. Và không ít tai nạn mà phí bảo hiểm vượt xa mức trung bình quốc gia.

Các phân tích đã được đưa ra với khoảng 1.800 sự cố và nhanh chóng xác định nhóm nòng cốt của cuộc lừa đảo tinh ranh này. Các hoạt động lừa đảo này dẫn đến việc bắt giữ 70 người.

Trong một ví dụ khác, Nationwide Building Society đã giảm 75% thiệt hại do gian lận khi sử dụng phần mềm SAS, theo ông David Parsons, người đứng đầu bộ phận phân tích gian lận.

Ông David nói rằng: "Hiện có lượng dữ liệu lớn mà chúng ta có thể nhìn vào bất kỳ thông số nào để giúp phát hiện hành vi bất thường. Và tốc độ có thể làm được điều này phải gọi là phi thường".

Tuy nhiên, Hitesh Patel, đối tác điều tra pháp y tại KPMG, cảnh báo: "Với khối lượng dữ liệu tăng gấp đôi mỗi 2 năm, thì gian lận tài chính sẽ tồi tệ hơn nhiều trước khi nó được tốt hơn. Chúng tôi có gắng để không bị tụt lại phía sau vào lúc này".

Hòn Rồng
.
.
.