Xây dựng các Mô-đun AI cho Tòa soạn bằng PHP

Hầu hết mọi người đều nghĩ AI trong một tòa soạn chỉ là một khung chat lớn. Đây là một sai lầm. Mô hình đó dẫn đến những tính năng mà người dùng chỉ dùng một lần rồi bỏ qua.

Một tòa soạn có hàng tá nhu cầu nhỏ và cụ thể. Bạn cần các phương án tiêu đề. Bạn cần các đoạn giới thiệu ngắn cho mạng xã hội. Bạn cần tiêu đề SEO. Bạn cần gắn thẻ thực thể (entity tagging). Mỗi công việc tuy nhỏ nhưng đều có những quy tắc riêng.

Sau khi làm việc với 200 trang tin tức, tôi đã tìm ra cách đúng đắn để xây dựng điều này. Đừng xây dựng một "tính năng AI" duy nhất. Hãy xây dựng một danh mục các quy trình làm việc (workflows) nhỏ và chuyên biệt.

Dưới đây là cách thực hiện trong PHP:

  • Sử dụng các tác vụ (tasks), thay vì chỉ dùng các câu lệnh (prompts). Một tác vụ là một đơn vị có tên gọi với một hợp đồng (contract) cố định. Nó biết mình cần gì và sẽ trả về kết quả gì.
  • Xác thực đầu ra ngay trong tác vụ. Các mô hình thường trả về văn bản trong khi bạn lại muốn định dạng JSON. Nếu tác vụ tự xác thực đầu ra của chính nó, bạn có thể thử lại hoặc xử lý lỗi một cách mượt mà mà không làm hỏng trình biên tập của mình.
  • Sử dụng bộ định tuyến dựa trên phân cấp (tier-based router). Chạy các tác vụ đơn giản trên các mô hình giá rẻ. Chạy các tác vụ về pháp lý hoặc rủi ro trên các mô hình cao cấp.
  • Lưu bộ nhớ đệm (cache) theo tác vụ và đầu vào. Nếu một biên tập viên nhấn nút hai lần trên cùng một bài viết, bạn không nên phải trả tiền cho lần gọi AI thứ hai. Caching là cách kiểm soát chi phí tốt nhất của bạn.
  • Giữ các quy tắc trong mã nguồn và giữ "gu" thẩm mỹ trong các câu lệnh. Đừng yêu cầu mô hình kiểm tra xem tiêu đề có dưới 70 ký tự hay không. Hãy dùng PHP để làm việc đó. Hãy dùng mô hình để quyết định xem tiêu đề đó có hay hay không. Mã nguồn xử lý các quy tắc. Mô hình xử lý sự đánh giá.

Nhóm các tác vụ của bạn để giữ mọi thứ ngăn nắp:

• Tiêu đề: Tiêu đề SEO, đoạn giới thiệu mạng xã hội, thông báo đẩy. • Cấu trúc: Tóm tắt, các ý chính, gợi ý đọc thêm. • Phân loại: Gợi ý danh mục, trích xuất thẻ. • Phương tiện: Văn bản thay thế (alt text), chú thích, gợi ý cắt ảnh. • Chất lượng: Kiểm tra giọng văn, cảnh báo rủi ro, bộ lọc ngôn từ tục tĩu.

Mục tiêu là sự tin cậy trong vận hành. Nếu một nhà cung cấp AI gặp sự cố trong một ngày tin tức bận rộn, bạn chỉ cần thay đổi một tệp cấu hình chứ không phải viết lại toàn bộ mã nguồn.

Hai quy tắc cuối cùng để thành công:

  1. Các gợi ý chỉ là bản nháp. Đừng bao giờ để AI viết trực tiếp vào một trường đã xuất bản. Con người luôn phải xem xét và chấp nhận kết quả đầu ra.
  2. Làm việc ở chế độ nền. Nếu một tác vụ mất hơn một giây, hãy chạy nó như một công việc bất đồng bộ (async job). Đừng bắt các biên tập viên của bạn phải chờ đợi màn hình tải dữ liệu.

Hãy xây dựng kiến trúc trước. Mô hình chỉ là yếu tố thứ yếu.

Nguồn: https://dev.to/mahmut_gndzalp_c736ac4b/building-newsroom-ai-modules-in-php-50-specialized-workflows-2co1