Kỹ thuật Prompt cho Dữ liệu Tổng hợp

Sử dụng LLM để tạo dữ liệu tổng hợp là một chiến lược phổ biến cho các đội ngũ QA. Bạn có thể tạo ra hàng trăm bản ghi phức tạp chỉ trong vài giây.

Nhưng các prompt chung chung sẽ dẫn đến một cái bẫy. Nếu bạn yêu cầu LLM "tạo 50 người dùng thử nghiệm", nó sẽ đưa cho bạn dữ liệu dễ đoán và lặp đi lặp lại. Điều này tạo ra một cảm giác giả tạo về độ bao phủ (coverage). Bạn nhận được nhiều bản ghi chỉ kiểm tra "happy path" (luồng xử lý chuẩn) trong khi bỏ lỡ các trường hợp biên (edge cases) và logic nghiệp vụ quan trọng.

Để khắc phục điều này, bạn phải chuyển từ vai trò người yêu cầu sang vai trò người điều phối (orchestrator). Bạn cần áp dụng trực tiếp các nguyên tắc kiểm thử vào kỹ thuật prompt của mình.

Sử dụng ba mô hình sau để cải thiện chất lượng dữ liệu của bạn:

  1. Phân vùng tương đương và Phân tích giá trị biên Thay vì chỉ yêu cầu dữ liệu, hãy buộc LLM phải lập bản đồ các lớp kiểm thử (test classes) trước. Hãy sử dụng kỹ thuật Chain-of-Thought prompting.

Điều này đảm bảo bạn kiểm tra chính xác các điểm chuyển đổi, chẳng hạn như $99.99 so với $100.00, mà không lãng phí không gian cho các bản ghi dư thừa.

  1. Kiểm thử chuyển đổi trạng thái Đối với các hệ thống như luồng thanh toán hoặc quản lý đơn hàng, dữ liệu phải phản ánh các giai đoạn khác nhau của một vòng đời.

Điều này giúp ngăn chặn các bản ghi trùng lặp và buộc phải tạo ra các trường hợp kiểm thử tiêu cực (negative test cases).

  1. Kiểm soát biến thể và Negative Prompting Các LLM thường tạo ra dữ liệu đồng nhất, chẳng hạn như sử dụng cùng một khu vực hoặc nhóm tuổi. Hãy sử dụng Negative Prompting để ngăn chặn điều này.

Điều này loại bỏ sự thiên kiến và đảm bảo backend của bạn xử lý được dữ liệu đa dạng và thực tế.

Tốc độ của AI chỉ mang lại giá trị nếu dữ liệu của bạn có tính chủ đích. Vai trò của bạn với tư cách là một chuyên gia QA là lập trình các ràng buộc để kiểm soát các mô hình tạo sinh này.

Nguồn: https://dev.to/lopesdoamaral/engenharia-de-prompts-para-massa-de-dados-escalando-testes-com-cobertura-e-sem-duplicidade-oba

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi