Mi detector de sesgos encontró selección selectiva en "No Info"

📅3 hours ago⏱2 min read

Mi detector de sesgos encontró "cherry-picking" en "no info"

Creé un proyecto llamado Biassemble.

El objetivo es sencillo. Le proporcionas una historia. El sistema hace preguntas. Identifica sesgos cognitivos en tu razonamiento.

Lo probé con una historia sobre una mujer llamada Anna. Su historia contenía solo hechos. Bebió café. Tomó un autobús. Caminó hacia su oficina. No había opiniones ni emociones en el texto.

Mi primer prompt tenía una regla: detectar al menos un sesgo de una lista.

Esta regla obligaba al sistema a encontrar algo. Incluso cuando no existía nada, el sistema intentaba inventar un sesgo.

Actualicé el prompt a la versión 1.0.0. Añadí un requisito de evidencia. El sistema tenía que citar partes específicas de la historia para demostrar que existía un sesgo.

Pensé que esto solucionaría el problema. No fue así.

Cuando respondí "no info" a las preguntas de seguimiento, el sistema me señaló por "cherry-picking". Argumentó que mi negativa a especular era una elección deliberada para omitir datos.

El sistema tenía razón técnica. Dije "no info" cuatro veces. Citó mis palabras exactas. Pero la conclusión era errónea. Convirtió la falta de información en un error de razonamiento.

La fundamentación (grounding) hizo que las citas fueran honestas. No hizo que las conclusiones fueran correctas.

Lancé la versión 1.1.0. Añadí tres nuevas comprobaciones:

Una comprobación de suficiencia al inicio.
Una regla de exclusión de evidencia.
Un umbral de confianza.

Los resultados cambiaron. Con las mismas respuestas de "no info", la versión 1.1.0 no reportó ningún sesgo. Reconoció que mis respuestas eran descriptivas en lugar de interpretativas.

La diferencia entre las dos versiones no es la evidencia. La diferencia es cómo el sistema trata el "no lo sé".

Una versión ve el "no lo sé" como un signo de sesgo. La otra lo ve como una respuesta válida. Debes decirle al modelo cómo manejar esto. No lo decidirá por sí mismo.

Ahora estoy construyendo métricas para probar esto. Necesito saber si el sistema realmente mejoró o si simplemente aprendió a ignorar esta historia específica.

Pensé que estaba construyendo un detector de sesgos. En cambio, aprendí por qué los sistemas de razonamiento tienen dificultades con el "no lo sé".

Fuente: https://dev.to/lemind/my-bias-detector-found-cherry-picking-in-the-answer-no-info-9hf

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi

Mi detector de sesgos encontró selección selectiva en "No Info"

Continue reading

𝗧𝗵𝗲 𝗦𝘁𝗮𝗸𝗶𝗻𝗴 𝗧𝗿𝗮𝗽

El código que la IA no escribirá

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗜𝘀𝗻'𝘁 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗻𝗴. 𝗜𝘁'𝘀 𝗚𝘂𝗲𝘀𝘀𝗶𝗻𝗴.

Deja de usar la IA como un motor de búsqueda

𝗧𝗵𝗲 𝗔𝗹𝗴𝗼𝗿𝗶𝘁𝗵𝗺𝗶𝗰 𝗖𝗼𝗻𝘀𝘁𝗿𝘂𝗰𝘁𝗶𝗼𝗻 𝗼𝗳 𝗘𝗽𝗶𝘀𝘁𝗲𝗺𝗶𝗰 𝗜𝗻𝗷𝘂𝘀𝘁𝗶𝗰𝗲