Sam Altman khẳng định những người hoài nghi về việc mở rộng quy mô đã kìm hãm sự phát triển của AI
CEO của OpenAI, Sam Altman, đang tiếp tục khẳng định sức mạnh của việc mở rộng quy mô (scaling), lập luận rằng một thế hệ nghiên cứu trước đây đã kìm hãm sự tiến bộ do đánh giá thấp tiềm năng của các Mô hình Ngôn ngữ Lớn (LLMs). Khi cuộc tranh luận về giới hạn của kiến trúc transformer ngày càng trở nên gay gắt, Altman khẳng định rằng các bằng chứng thực nghiệm đang ủng hộ mạnh mẽ việc tiếp tục mở rộng tính toán (compute) và dữ liệu.
Cái giá của sự giáo điều về trí tuệ
Trong một lần xuất hiện gần đây tại Stanford, Altman đã đề cập đến sự mâu thuẫn giữa những người ủng hộ việc mở rộng quy mô và những người hoài nghi, đáng chú ý nhất là nhắc đến các nhà phê bình như Yann LeCun của Meta, người nổi tiếng với việc mô tả LLMs là một "ngõ cụt". Altman cho rằng phần lớn sự phản đối đối với giả thuyết mở rộng quy mô bắt nguồn từ việc các nhà nghiên cứu quá tự tin vào những dự đoán của họ về những gì AI không thể làm được.
Ông lập luận rằng một số nhân vật trong ngành đã gắn liền bản sắc chuyên môn của họ với các quan điểm lý thuyết cụ thể, khiến họ trở nên kháng cự trước những dữ liệu mới mâu thuẫn với niềm tin lâu đời của mình. Mặc dù thừa nhận rằng "mô hình thế giới" (world models) là thiết yếu cho những tiến bộ trong các lĩnh vực như robot, Altman vẫn khẳng định rằng quỹ đạo hiện tại của LLMs không phải là một sự chệch hướng, mà là động cơ chính của trí tuệ.
Bằng chứng thực nghiệm: Vượt xa khỏi việc khớp mẫu (pattern matching)
Một trong những điểm quan trọng nhất trong lập luận bảo vệ việc mở rộng quy mô của Altman là sự chuyển đổi của LLMs từ những công cụ dự đoán văn bản thuần túy thành các công cụ có khả năng suy luận nguyên bản. Ông đã dẫn chứng một cột mốc gần đây khi một mô hình của OpenAI đã bác bỏ thành công một giả thuyết toán học vốn chưa được các chuyên gia con người giải quyết trong một thời gian dài.
Sự phát triển này rất quan trọng vì nó thách thức quan điểm cho rằng LLMs chỉ đơn thuần là những "con vẹt ngẫu nhiên" (stochastic parrots) không có khả năng khám phá thực sự. "Vì vậy, rõ ràng là LLMs có khả năng tìm ra kiến thức mới," Altman tuyên bố, đồng thời lưu ý rằng cộng đồng toán học hiện đang tích cực giải quyết các hệ quả từ những chứng minh do AI thúc đẩy. Sự chuyển dịch này cho thấy việc mở rộng quy mô không chỉ cải thiện khả năng trôi chảy; nó còn mở rộng chân trời của năng lực nhận thức.
Ranh giới mới: Suy luận so với các tác vụ dài hạn (long-horizon tasks)
Bất chấp sự lạc quan, Altman vẫn giữ thái độ thực tế về những hạn chế hiện tại của công nghệ. Ông lưu ý về một khoảng cách hiệu suất rõ rệt khi nói đến các "tác vụ dài hạn" (long-horizon tasks)—những quy trình làm việc phức tạp đòi hỏi sự phán đoán cấp cao liên tục và lập kế hoạch đa bước trong thời gian dài. Trong các lĩnh vực cụ thể này, ông thừa nhận rằng LLMs vẫn "có vẻ kém hơn nhiều so với con người."
Đối với bức tranh AI rộng lớn hơn, sự phân biệt này xác định ranh giới nghiên cứu tiếp theo. Ngành công nghiệp đang chuyển từ giai đoạn "mở rộng quy mô để lấy kiến thức" sang "mở rộng quy mô để suy luận và thực thi" (reasoning and agency). Khi các công ty như OpenAI và Anthropic (được dẫn dắt bởi CEO Dario Amodei, người cũng có niềm tin vào việc mở rộng quy mô giống như Altman) tiếp tục đổ hàng tỷ đô la vào tính toán, mục tiêu là thu hẹp khoảng cách giữa trí thông minh nhất thời và khả năng tự chủ lâu dài, đáng tin cậy.
Các điểm chính cần lưu ý
- Mở rộng quy mô là động lực chính: Altman lập luận rằng việc đánh giá thấp tác động của việc tăng cường tính toán và dữ liệu trong lịch sử đã làm chậm tốc độ của các đột phá AI.
- Khám phá thay vì bắt chước: Khả năng giải quyết các giả thuyết toán học phức tạp của các mô hình OpenAI chứng minh rằng LLMs đang tiến tới việc tạo ra kiến thức thực sự.
- Nút thắt tiếp theo: Mặc dù việc mở rộng quy mô giải quyết được nhiều vấn đề, nhưng hiệu suất ở cấp độ con người trong các tác vụ dài hạn và đòi hỏi phán đoán cao vẫn là rào cản lớn tiếp theo của ngành.