𝗣𝗿𝗼𝗺𝗽𝘁 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴 𝗳𝗼𝗿 𝗦𝘆𝗻𝘁𝗵𝗲𝘁𝗶𝗰 𝗗𝗮𝘁𝗮

📅3 hours ago⏱2 min read

𝗜𝗻𝗴𝗲𝗻𝗶𝗲𝗿í𝗮 𝗱𝗲 𝗣𝗿𝗼𝗺𝗽𝘁𝘀 𝗽𝗮𝗿𝗮 𝗗𝗮𝘁𝗼𝘀 𝗦𝗶𝗻𝘁é𝘁𝗶𝗰𝗼𝘀

El uso de LLM para crear datos sintéticos es una estrategia popular para los equipos de QA. Puedes generar cientos de registros complejos en segundos.

Pero los prompts genéricos conducen a una trampa. Si le pides a un LLM que "genere 50 usuarios de prueba", te dará datos predecibles y repetitivos. Esto crea una falsa sensación de cobertura. Obtienes muchos registros que solo prueban el "happy path", mientras que se omiten casos de borde críticos y la lógica de negocio.

Para solucionar esto, debes pasar de ser un solicitante a ser un orquestador. Necesitas aplicar principios de prueba directamente a tu ingeniería de prompts.

Utiliza estos tres patrones para mejorar la calidad de tus datos:

Partición de equivalencia y análisis de valores límite En lugar de pedir datos, obliga al LLM a mapear primero las clases de prueba. Utiliza el prompting de cadena de pensamiento (Chain-of-Thought).

Define tu rol como Senior QA Engineer.
Proporciona reglas de negocio específicas (p. ej., límites de cupones o gasto mínimo).
Instruye al LLM para que enumere todas las clases de equivalencia válidas e inválidas en una tabla.
Exige exactamente un payload JSON por cada escenario identificado.

Esto asegura que pruebes los puntos de transición exactos, como $99.99 frente a $100.00, sin desperdiciar espacio en registros redundantes.

Pruebas de transición de estados Para sistemas como flujos de pago o gestión de pedidos, los datos deben reflejar las diferentes etapas de un ciclo de vida.

Proporciona una lista de todos los estados posibles (p. ej., Created, Paid, Shipped, Delivered).
Pide al LLM que genere un CSV que cubra una matriz de transición de estados.
Exige tres tipos de flujos: Lineal (válido), Excepción (desviaciones) y Violación (transiciones inválidas).
Establece una regla para generar solo una fila por cada combinación de estados única.

Esto evita registros duplicados y obliga a la creación de casos de prueba negativos.

Control de varianza y prompting negativo Los LLM suelen producir datos homogéneos, como el uso de las mismas regiones o grupos de edad. Utiliza el prompting negativo para evitar esto.

Establece requisitos explícitos para la distribución (p. ej., rangos de edad específicos o regiones geográficas).
Añade una sección de "PROHIBICIONES".
Prohíbe explícitamente nombres genéricos como "John Doe".
Prohíbe repetir las mismas combinaciones de variables.
Prohíbe números de ID secuenciales o idénticos.

Esto elimina el sesgo y asegura que tu backend maneje datos diversos y realistas.

La velocidad de la IA solo aporta valor si tus datos son intencionales. Tu papel como profesional de QA es programar las restricciones que rigen estos modelos generativos.

Fuente: https://dev.to/lopesdoamaral/engenharia-de-prompts-para-massa-de-dados-escalando-testes-com-cobertura-e-sem-duplicidade-oba

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi

𝗣𝗿𝗼𝗺𝗽𝘁 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴 𝗳𝗼𝗿 𝗦𝘆𝗻𝘁𝗵𝗲𝘁𝗶𝗰 𝗗𝗮𝘁𝗮

Continue reading

𝗬𝗢𝗨𝗥 𝗔𝗚𝗘𝗡𝗧 𝗙𝗔𝗜𝗟𝗘𝗗 𝗜𝗡 𝗣𝗥𝗢𝗗. 𝗚𝗢𝗢𝗗 𝗟𝗨𝗖𝗞 𝗥𝗘𝗣𝗥𝗢𝗗𝗨𝗖𝗜𝗡𝗚 𝗜𝗧.

𝗧𝗵𝗶𝘀 𝗜𝘀 𝗔 𝗚𝗨𝗜𝗗𝗘 𝗧𝗢 𝗖𝗛𝗔𝗧𝗚𝗣𝗧 𝗣𝗥𝗢𝗠𝗣𝗧 𝗘𝗡𝗚𝗜𝗡𝗘𝗘𝗥𝗜𝗡𝗚

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

𝗜𝗻𝘁𝗿𝗼 𝘁𝗼 𝗚𝗲𝗻 𝗔𝗜 𝗳𝗼𝗿 𝗣𝘆𝘁𝗵𝗼𝗻 𝗕𝗲𝗴𝗶𝗻𝗻𝗲𝗿𝘀

Ingeniería de contexto para ingenieros de prompts