Công trình, được công bố trên tạp chí Science Advances, đánh dấu một bước tiến đáng chú ý trong lĩnh vực trí tuệ nhân tạo và khoa học thần kinh, đồng thời mở ra viễn cảnh mới trong việc hiểu cách não bộ con người diễn giải thế giới xung quanh.

Trong hơn một thập kỷ, giới nghiên cứu đã nỗ lực tìm cách dự đoán hình ảnh hoặc âm thanh dựa trên tín hiệu não. Tuy nhiên, việc "dịch" những nội dung phức tạp như video hoặc hình dạng trừu tượng thành ngôn ngữ vẫn là một thách thức lớn. Các phương pháp trước đây chỉ nhận diện được từ khóa đơn lẻ thay vì toàn bộ ngữ cảnh bao gồm chủ thể, hành động và môi trường xung quanh.

Ảnh minh họa
Ảnh minh họa

Theo nhóm nghiên cứu tại Đại học California, Berkeley (Mỹ), kỹ thuật mới này sử dụng công nghệ chụp hình não không xâm lấn để ghi nhận hoạt động thần kinh. Sau đó, các nhà khoa học dùng mô hình ngôn ngữ AI tiên tiến để dự đoán và mô tả chính xác điều mà người tham gia đang nhìn hoặc tưởng tượng.

Để vượt qua giới hạn của phương pháp cũ, nhóm nghiên cứu đã phát triển một mô hình AI ngôn ngữ sâu. Họ sử dụng mô hình này để phân tích phụ đề của hơn 2.000 video, chuyển mỗi đoạn thành một “chữ ký ý nghĩa”—một biểu đồ số thể hiện nội dung video. Tiếp theo, họ huấn luyện một hệ thống AI khác nhận diện mối liên hệ giữa các "chữ ký ý nghĩa" này và hoạt động não của 6 người tham gia khi họ xem video.

Kết quả cho thấy, AI có thể "dịch" chính xác những gì người tham gia đang xem hoặc tưởng tượng thành câu mô tả hoàn chỉnh, chứ không chỉ đơn thuần liệt kê từ khóa. Nhà khoa học thần kinh tính toán Alex Huth khẳng định: “Hệ thống có thể dự đoán ở mức độ chi tiết rất cao những gì một người đang nhìn thấy. Đây là điều chưa từng có tiền lệ”.

Các chuyên gia nhận định, công nghệ “mind-captioning” không chỉ là cột mốc trong nghiên cứu khoa học thần kinh mà còn mở ra khả năng ứng dụng thực tiễn rộng lớn. Trong tương lai, kỹ thuật này có thể hỗ trợ người mất khả năng nói, chẳng hạn như sau đột quỵ, giúp họ giao tiếp thông qua tín hiệu não.

Dù còn ở giai đoạn đầu, “mind-captioning” đánh dấu bước tiến lớn trong hành trình giải mã ngôn ngữ của tư duy con người, đưa viễn cảnh “đọc suy nghĩ” vốn chỉ có trong các bộ phim khoa học viễn tưởng đến gần hơn với thực tế.

Tâm An(t/h)