Kích hoạt trí tưởng tượng của trí tuệ nhân tạo

Thứ Ba, 17/05/2022, 20:44

Hãy tưởng tượng một con mèo màu cam. Bây giờ, hãy tưởng tượng cùng một con mèo, nhưng có bộ lông màu đen như than. Bây giờ, hãy tưởng tượng con mèo đang sải bước dọc theo Vạn Lý Trường Thành của Trung Quốc. Khi làm điều này, một loạt kích hoạt tế bào thần kinh nhanh chóng trong não của bạn sẽ tạo ra một số biến thể của bức tranh được trình bày dựa trên kiến thức trước đây của bạn về thế giới.

Nói cách khác, là con người, thật dễ dàng để hình dung một đối tượng có những thuộc tính khác nhau. Hiện nay, một nhóm nghiên cứu Đại học Nam California (USC) bao gồm Giáo sư khoa học máy tính Laurent Itti, Yunhao Ge, Sami Abu-El-Haija và Gan Xin, phát triển một dạng trí tuệ nhân tạo (AI) sử dụng loạt khả năng giống con người để tưởng tượng một vật thể chưa từng thấy với nhiều thuộc tính khác nhau.

Yunhao Ge, tác giả chính của nghiên cứu, cho biết: “Chúng tôi lấy cảm hứng từ khả năng khái quát hóa thị giác con người nhằm cố gắng mô phỏng trí tưởng tượng của con người trong máy móc. Con người có thể phân tích kiến thức đã học của họ theo các thuộc tính - ví dụ, hình dạng, tư thế, vị trí, màu sắc - và sau đó kết hợp chúng lại để tưởng tượng một vật thể mới. Công trình của chúng tôi cố gắng mô phỏng quá trình này bằng mạng nơ-ron”.

Kích hoạt trí tưởng tượng của trí tuệ nhân tạo -0
Nhà khoa học máy tính Yunhao Ge, Đại học Nam California (USC).

Giả sử bạn muốn tạo một hệ thống AI để tạo ra hình ảnh của những chiếc ôtô. Lý tưởng nhất là bạn sẽ cung cấp cho thuật toán một vài hình ảnh về một chiếc ôtô và nó có thể tạo ra nhiều loại ôtô - từ Porsche đến Pontiac cho đến xe bán tải - với bất kỳ màu nào, từ nhiều góc độ. Đây là một trong những mục tiêu được tìm kiếm từ lâu của AI: tạo ra những mô hình có thể ngoại suy.

Điều này có nghĩa là, với một vài ví dụ, mô hình sẽ có thể trích xuất những quy tắc cơ bản và áp dụng chúng cho một loạt ví dụ mới mà nó chưa từng thấy trước đây. Nhưng máy móc thường được đào tạo về các tính năng mẫu, ví dụ như pixel, mà không tính đến thuộc tính của đối tượng.

Trong nghiên cứu mới này, nhóm nhà nghiên cứu cố gắng khắc phục hạn chế bằng cách sử dụng khái niệm được gọi là sự xáo trộn. Ví dụ: khái niệm được sử dụng để tạo ra deepfake bằng cách tách một loạt chuyển động và nhận dạng khuôn mặt con người. Ge cho biết, bằng cách làm này, “mọi người có thể tổng hợp những hình ảnh và video mới thay thế danh tính của một người ban đầu bằng một người khác, nhưng vẫn giữ nguyên chuyển động ban đầu”.

Tương tự như vậy, phương pháp mới sử dụng một nhóm nhiều hình ảnh mẫu - thay vì một hình ảnh mẫu tại một thời điểm như một số thuật toán truyền thống đã thực hiện - và khai thác sự giống nhau giữa chúng để đạt được thứ gọi là “học biểu diễn không phân biệt có thể kiểm soát”. Sau đó, nó kết hợp lại kiến thức này để đạt được “sự tổng hợp hình ảnh mới lạ có thể kiểm soát được” hay bạn có thể gọi là “trí tưởng tượng”.

Kích hoạt trí tưởng tượng của trí tuệ nhân tạo -1
Một nhóm nhà nghiên cứu Đại học Nam California (USC) giúp AI tưởng tượng ra điều chưa từng thấy.

Điều này tương tự như cách chúng ta ngoại suy: khi con người nhìn thấy một màu từ một đối tượng, chúng ta có thể dễ dàng áp dụng nó cho bất kỳ đối tượng nào khác bằng cách thay thế màu gốc bằng màu mới. Sử dụng kỹ thuật này, nhóm nghiên cứu tạo ra một tập dữ liệu mới chứa 1,56 triệu hình ảnh có thể giúp ích cho loạt nghiên cứu trong tương lai về lĩnh vực này.

Mặc dù không phải là một ý tưởng mới, nhưng nhóm nhà nghiên cứu cho biết công trình của họ có thể tương thích với hầu hết mọi loại dữ liệu hoặc kiến thức. Điều này mở rộng cơ hội cho nhiều ứng dụng.

Ví dụ: tách biệt chủng tộc và kiến thức liên quan đến giới tính nhằm mục đích làm cho AI công bằng hơn bằng cách loại bỏ hoàn toàn một số thuộc tính nhạy cảm khỏi phương trình. Trong lĩnh vực y học, nó có thể giúp bác sĩ và nhà sinh học khám phá ra nhiều loại thuốc hữu ích hơn bằng cách tách rời chức năng của thuốc khỏi những đặc tính khác, sau đó kết hợp chúng lại để tổng hợp thuốc mới.

Ví dụ, máy gắn kết với trí tưởng tượng cũng có thể giúp tạo ra AI an toàn hơn bằng cách cho phép các phương tiện tự hành tưởng tượng và tránh những tình huống nguy hiểm chưa từng thấy trong quá trình huấn luyện.

Trang Thuần (Tổng hợp)
.
.
.