𝗜𝗻𝗴𝗲𝗻𝗶𝗲𝗿í𝗮 𝗱𝗲 𝗣𝗿𝗼𝗺𝗽𝘁𝘀 𝗽𝗮𝗿𝗮 𝗗𝗮𝘁𝗼𝘀 𝗦𝗶𝗻𝘁é𝘁𝗶𝗰𝗼𝘀
El uso de LLM para crear datos sintéticos es una estrategia popular para los equipos de QA. Puedes generar cientos de registros complejos en segundos.
Pero los prompts genéricos conducen a una trampa. Si le pides a un LLM que "genere 50 usuarios de prueba", te dará datos predecibles y repetitivos. Esto crea una falsa sensación de cobertura. Obtienes muchos registros que solo prueban el "happy path", mientras que se omiten casos de borde críticos y la lógica de negocio.
Para solucionar esto, debes pasar de ser un solicitante a ser un orquestador. Necesitas aplicar principios de prueba directamente a tu ingeniería de prompts.
Utiliza estos tres patrones para mejorar la calidad de tus datos:
- Partición de equivalencia y análisis de valores límite En lugar de pedir datos, obliga al LLM a mapear primero las clases de prueba. Utiliza el prompting de cadena de pensamiento (Chain-of-Thought).
- Define tu rol como Senior QA Engineer.
- Proporciona reglas de negocio específicas (p. ej., límites de cupones o gasto mínimo).
- Instruye al LLM para que enumere todas las clases de equivalencia válidas e inválidas en una tabla.
- Exige exactamente un payload JSON por cada escenario identificado.
Esto asegura que pruebes los puntos de transición exactos, como $99.99 frente a $100.00, sin desperdiciar espacio en registros redundantes.
- Pruebas de transición de estados Para sistemas como flujos de pago o gestión de pedidos, los datos deben reflejar las diferentes etapas de un ciclo de vida.
- Proporciona una lista de todos los estados posibles (p. ej., Created, Paid, Shipped, Delivered).
- Pide al LLM que genere un CSV que cubra una matriz de transición de estados.
- Exige tres tipos de flujos: Lineal (válido), Excepción (desviaciones) y Violación (transiciones inválidas).
- Establece una regla para generar solo una fila por cada combinación de estados única.
Esto evita registros duplicados y obliga a la creación de casos de prueba negativos.
- Control de varianza y prompting negativo Los LLM suelen producir datos homogéneos, como el uso de las mismas regiones o grupos de edad. Utiliza el prompting negativo para evitar esto.
- Establece requisitos explícitos para la distribución (p. ej., rangos de edad específicos o regiones geográficas).
- Añade una sección de "PROHIBICIONES".
- Prohíbe explícitamente nombres genéricos como "John Doe".
- Prohíbe repetir las mismas combinaciones de variables.
- Prohíbe números de ID secuenciales o idénticos.
Esto elimina el sesgo y asegura que tu backend maneje datos diversos y realistas.
La velocidad de la IA solo aporta valor si tus datos son intencionales. Tu papel como profesional de QA es programar las restricciones que rigen estos modelos generativos.
Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi