Ứng dụng trí tuệ nhân tạo trong truy tìm tội phạm từ hệ thống Camera giám sát

Thứ Bảy, 01/01/2022, 10:27

Đề tài nghiên cứu khoa học cấp Bộ Công an năm 2020-2021 “Nghiên cứu xây dựng hệ thống tìm kiếm hình ảnh người theo ngôn ngữ mô tả sử dụng mạng học sâu” do Thượng tá, TS. Phạm Thị Thanh Thuỷ và các cán bộ, giảng viên của Khoa An ninh thông tin, Học viện ANND thực hiện đã mở ra hướng ứng dụng trí tuệ nhân tạo trong truy tìm tội phạm từ hệ thống Camera giám sát. Đề tài được kỳ vọng sẽ có những đóng góp tích cực trong Công an nói chung, công tác tìm kiếm đối tượng tình nghi, đối tượng phạm tội nói riêng.

Phát hiện tội phạm qua hệ thống camera giám sát

Chia sẻ về lý do lựa chọn thực hiện đề tài khá mới mẻ này, Thượng tá, TS. Phạm Thị Thanh Thuỷ, Chủ nhiệm đề tài cho biết: Một trong những thành tựu công nghệ nổi bật của cuộc cách mạng 4.0 được quan tâm nghiên cứu, ứng dụng nhiều hiện nay là Trí tuệ nhân tạo, trong đó Học máy (Machine Learning) là một phần quan trọng của trí tuệ nhân tạo, và Học sâu (Deep Learning) là một nhánh của Học máy, được xem là một thành quả tiên tiến nhất hiện nay của trí tuệ nhân tạo. Học máy được hiểu là khả năng một hệ thống máy có thể mô phỏng lại các hoạt động của con người như học tập, suy luận, đánh giá vấn đề. Học sâu chỉ là một kỹ thuật của học máy, được lấy cảm hứng từ cấu trúc của bộ não con người gồm một mạng lưới khổng lồ các nơ-ron thần kinh tiếp nhận và xử lý tín hiệu. Các thuật toán học sâu cố gắng đưa ra các kết luận tương tự như con người bằng cách liên tục phân tích dữ liệu với một cấu trúc logic nhất định. Để đạt được điều này, học sâu sử dụng cấu trúc nhiều lớp của các thuật toán được gọi là mạng nơ-ron.

Ứng dụng trí tuệ nhân tạo trong truy tìm tội phạm từ hệ thống Camera giám sát -0 — Sơ đồ mô phỏng việc tìm kiếm hình ảnh đối tượng từ câu mô tả.

Trong công tác công an có rất nhiều ứng dụng thực tế có thể được phát triển từ việc áp dụng các kỹ thuật học máy, và đặc biệt hiện nay là kỹ thuật học sâu. Các ứng dụng này đã chứng minh hiệu quả đột phá của nó trên nhiều lĩnh vực trong đó có công tác truy tìm tội phạm. Có thể dẫn chứng bằng hệ thống Skynet, một hệ thống giám sát tự động với mạng lưới camera giám sát lớn nhất thế giới được gọi là “thiên la địa võng” của Trung Quốc.

Việc xây dựng và phát triển hệ thống này nằm trong chương trình quốc gia, bắt đầu được triển khai từ năm 2015 và hiện nay đã đưa vào sử dụng ở hàng chục tỉnh thành khắp Trung Quốc. Chương trình này có sự phối hợp của nhiều bộ ngành mà vai trò chủ đạo là Ban Chính pháp và Bộ Công an Trung Quốc. Skynet sử dụng mạng lưới camera khổng lồ gồm hàng trăm triệu camera giám sát đặt tại các nơi trọng yếu như nhà ga, sân bay, ngã tư... kết hợp công nghệ trí tuệ nhân tạo, thực sự đã trở thành công cụ đắc lực giúp cảnh sát Trung Quốc phá được nhiều vụ án lớn. Đây thực sự là những gợi ý để nhóm nghiên cứu bắt tay vào nghiên cứu đề tài này.

Cũng theo Thượng tá Phạm Thị Thanh Thuỷ, đề tài tập trung nghiên cứu, xây dựng một hệ thống tự động tìm kiếm đối tượng từ cơ sở dữ liệu hình ảnh thu nhận từ nhiều camera giám sát dựa trên nguồn thông tin đầu vào là câu mô tả về đối tượng do nhân chứng cung cấp. Ví dụ, đối tượng cần tìm là một bé gái có mô tả diện mạo như sau: “Bé gái cao khoảng 1,2m, tóc buộc cao đeo bờm hồng, mặc váy hoa xanh to nền trắng với đường viền xanh ở eo, chân đi giày búp bê màu trắng”. Khi người dùng hệ thống nhập câu mô tả vào, hệ thống sẽ tự động tìm ra hình ảnh bé gái tương ứng từ cơ sở dữ liệu ảnh thu nhận từ các camera giám sát. Các mô hình học sâu tiên tiến đã được nghiên cứu và ứng dụng thành công để giải quyết bài toán đặt ra trong đề tài.

Hệ thống tìm kiếm được triển khai trong hạ tầng chung của hệ thống giám sát an ninh sử dụng camera gồm các trung tâm giám sát đặt tại các đơn vị công an (ví dụ cấp Quận, Phường..). Trong mỗi trung tâm có các camera IP được kết nối với nhau qua đầu thu NVR, dữ liệu hình ảnh sẽ được lưu trữ trên đầu thu. Các đầu thu được kết nối với nhau và nối vào đầu thu tổng, cho phép chúng ta quản lý dữ liệu tập trung ở một đầu ghi tổng (ở phường, quận..), từ đó dễ dàng trong công tác thu thập, quản lý và truy vấn dữ liệu sau này.

Tại mỗi trung tâm triển khai hệ thống tìm kiếm hình ảnh đối tượng từ camera giám sát dựa trên câu mô tả về đối tượng. Dữ liệu hình ảnh ghi lại được từ các camera được lưu tại Image Server. Khi User (có thể là cán bộ công an hay công dân) có nhu cầu cần trích xuất hình ảnh đối tượng, thay vì phải đến trực tiếp đến cơ quan công an, User có thể tạo tài khoản, điền thông tin tờ khai yêu cầu trích xuất dữ liệu kèm theo câu mô tả về đối tượng cần trích xuất hình ảnh, chọn cơ quan tiếp nhận tờ khai bằng cách tương tác trực tiếp trên giao diện Website.

“Thực tế hiện nay, trinh sát thực hiện tìm kiếm hình ảnh đối tượng một cách thủ công, chúng ta chưa có hệ thống tự động hay công cụ hỗ trợ công tác này. Rõ ràng, nếu làm một cách thủ công như vậy sẽ rất tốn kém về thời gian và công sức và trong nhiều trường hợp là không khả thi và hiệu quả. Trong khi đó, nếu áp dụng các kỹ thuật học máy và đặc biệt là học sâu, cùng với việc sử dụng nguồn dữ liệu lớn có liên quan và năng lực xử lý ngày càng cao của máy tính hiện nay, những bài toán thực tiễn như trên hoàn toàn có thể được xử lý một cách tự động, nhanh chóng và hiệu quả”-TS. Phạm Thị Thanh Thuỷ chia sẻ.

H.Thanh- Thanh Thuỷ