Dự đoán trước, Dữ liệu sau

Liệu một tác nhân AI có thể đọc được website của bạn không?

Tôi đã xây dựng một công cụ có tên là Agentis Lux để trả lời câu hỏi này. Nó cho bạn thấy chính xác những gì một tác nhân nhìn thấy khi truy cập vào một trang web.

Trước khi chạy công cụ của mình trên 50 website khác nhau, tôi sẽ đưa ra bảy dự đoán. Tôi viết chúng ra ngay bây giờ để không thể thay đổi chúng sau này nhằm khớp với dữ liệu. Điều này được gọi là đăng ký trước (pre-registration). Nó giúp công việc của tôi đảm bảo tính trung thực.

Tôi sẽ quét 10 trang web từ mỗi nhóm: • Thương mại điện tử • SaaS • Nội dung và Truyền thông • Chính phủ • Các dự án indie

Đây là những dự đoán của tôi:

  1. Rào cản về rendering là yếu tố phân loại chính. Các trang web nặng về phía client sẽ gặp khó khăn nhiều hơn so với các trang được render phía server.
  2. Các trang web chính phủ sẽ vượt qua các startup về mặt cấu trúc.
  3. Dữ liệu có cấu trúc sẽ chủ yếu tồn tại trong thương mại và truyền thông.
  4. Các trang thương mại điện tử sẽ cho thấy dải điểm số rộng nhất.
  5. Một số trang web sẽ vô tình chặn các tác nhân.
  6. Điểm số sẽ biến động rất lớn trên khắp internet.
  7. Nhiều trang web có thông số kỹ thuật tốt nhưng lại đặt chúng sai chỗ.

Tôi đang quét phần công khai của các trang web này. Tôi đang xem xét các trang marketing, tài liệu (docs) và thông số API. Tôi không xem xét phía sau các màn hình đăng nhập. Tôi đang quét các lối vào chính.

Nếu dữ liệu cho thấy các dự đoán của tôi sai, tôi sẽ báo cáo điều đó. Nếu dữ liệu không có biến động và không cho thấy quy luật nào, tôi cũng sẽ báo cáo như vậy. Một mức cơ sở (baseline) chỉ có giá trị khi nó trung thực.

Tôi sẽ sớm đăng kết quả. Bạn có thể thấy những gì tôi đoán đúng và đoán sai.

Bạn nghĩ dự đoán nào sẽ thất bại đầu tiên?

Source: https://dev.to/earlgreyhot1701d/predictions-first-data-later-seven-hot-takes-on-ai-agent-readiness-before-i-scan-50-sites-599d