𝗩𝗟-𝗖𝗵𝗲𝗰𝗸𝗟𝗶𝘀𝘁: 𝗘𝘃𝗮𝗹𝘂𝗮𝗰𝗶ó𝗻 𝗱𝗲 𝗠𝗼𝗱𝗲𝗹𝗼𝘀 𝗱𝗲 𝗩𝗶𝘀𝗶ó𝗻 𝘆 𝗟𝗮𝗻𝗴𝘂𝗮𝗷𝗲
Los modelos de visión y lenguaje preentrenados suelen fallar en los detalles pequeños. Los investigadores crearon VL-CheckList para solucionar esto.
La mayoría de las evaluaciones prueban conceptos generales. Pasan por alto la conexión entre los objetos y sus propiedades. Este nuevo marco de trabajo prueba tres áreas específicas:
- Objetos: ¿Identifica el modelo elementos específicos en una imagen?
- Atributos: ¿Ve el modelo correctamente los colores, formas y tamaños?
- Relaciones: ¿Comprende el modelo cómo interactúan los objetos?
Probar estas capas ayuda a los desarrolladores a construir mejores modelos. Lleva las pruebas de un simple reconocimiento a una comprensión real.
Lee el desglose completo aquí: https://dev.to/paperium/vl-checklist-evaluating-pre-trained-vision-language-models-with-objectsattributes-and-relations-1h2g
Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi