Lý do 'cha đẻ' AI rời Meta

Nhà khoa học hàng đầu tin rằng mô hình ngôn ngữ lớn sẽ dẫn đến xao nhãng, và có định hướng riêng cho sự phát triển AI trong tương lai.

Yann Lecun, 65 tuổi, là nhà khoa học AI hàng đầu tại Meta. Ảnh: Bloomberg.

Yann LeCun, nhà khoa học trưởng phụ trách mảng nghiên cứu AI nền tảng tại Meta, sẽ sớm rời công ty theo nhiều nguồn đáng tin cậy. Ở tuổi 65, ông là người tiên phong trong giới khoa học AI, sở hữu kho kiến thức đáng nể.

Trong khi đó, CEO Mark Zuckerberg cho biết Meta đang đạt được những bước tiến nội bộ đến mức rất gần siêu trí tuệ, sau khi liên tục săn nhân sự giỏi nhất từ đối thủ. Do đó, sự rời đi của nhà khoa học hàng đầu khỏi một công ty đang chi tiêu mạnh tay cho AI đã khiến dư luận bàn tán.

Thực tế, Lecun trước đó đã cho thấy niềm tin rất khác về AI. Ông gần đây trở nên nổi tiếng vì cho rằng các mô hình ngôn ngữ lớn (LLM) không còn đáng để theo đuổi, sẽ dẫn đến xao nhãng, cuối cùng là một ngõ cụt, dù được đầu tư đến đâu.

Một bài phân tích của WSJ về sự nghiệp của LeCun cho rằng một số khả năng khác đến từ sự khác biệt trong hướng phát triển. Giữa năm nay, Alexandr Wang, 28 tuổi, đã trở thành người đứng đầu mảng AI tại Meta, và làm cấp trên của LeCun. Sau đó, công ty còn đưa về một nhà khoa học trưởng khác cũng khá trẻ là Shengjia Zhao.

Trong thông báo của Meta, vai trò mới của Zhao được nhấn mạnh dựa trên một đột phá liên quan đến khả năng tăng kích thước mô hình anh đạt được. Ngược lại, LeCun đã không còn tin vào điều này.

Theo FT, Lecun sẽ mở một startup tập trung vào “world models”, cho rằng đó mới là thứ trả lời các câu hỏi về AI. Từng tham gia phát triển kính thông minh AI của Meta, ông rất tin tưởng về một tương lai con người sẽ phải tương tác với wearable, chứ không phải LLM, vì chúng không hiểu về thế giới.

Yann Lecun từng đưa ra một thí nghiệm cho thấy độ thiếu nhạy bén của LLM. Ảnh: Shutterstock.

“Chúng ta thậm chí không thể tái tạo được trí thông minh của mèo hay chuột, chưa nói đến trí thông minh của chó”, ông nói. World models là các mô hình AI được thiết kế để hiểu và mô phỏng thế giới, dựa trên cách vật thể và sự kiện vận hành, và hậu quả của hành động.

Nhà khoa học tin rằng world models sẽ cho phép xây dựng các hệ thống có khả năng lập kế hoạch hành động theo dạng phân cấp để đạt được một mục tiêu. Những hệ thống này sẽ có tính năng an toàn mạnh mẽ hơn, bởi vì các cách kiểm soát chúng sẽ được tích hợp ngay vào bên trong.

LeCun đưa ra một thí nghiệm tư duy để minh họa điều world models, hay bất kỳ con người nào cũng làm được, nhưng LLM thì không thể. Nếu tưởng tượng hình lập phương bay lơ lửng trước mặt, và xoay 90 độ quanh trục thẳng đứng sẽ như thế nào. Ông nói rằng LLM có thể viết ra giải thích văn bản, nhưng không giúp người dùng thực sự tương tác với khối lập phương.

LeCun đã bắt đầu làm việc trên world models tại Meta. Trong bài phát biểu tại AI Action Summit, ông mô tả mô hình trong mơ có khả năng ước lượng hiện trạng của thế giới. Thay vì dự đoán theo từng token liên tiếp như LLM, mô hình này dự đoán trạng thái kết quả của thế giới sẽ xảy ra sau khi người dùng thực hiện một chuỗi hành động nhất định.

Tác giả: Nhật Tường

Nguồn tin: znews.vn