viernes, 19 de septiembre de 2025

El Cuarteto de Anscombe: La Lección que Nunca Deberíamos Olvidar en la Visualización de Datos


En el mundo de la estadística y la ciencia de datos, pocas lecciones han resultado tan impactantes como la que nos dejó Francis Anscombe en 1973. Su famoso Cuarteto de Anscombe se ha convertido en un referente obligado para cualquiera que quiera comunicar datos con claridad y rigor.

La enseñanza es simple pero poderosa: los números no siempre cuentan toda la historia. Dos conjuntos de datos pueden compartir las mismas medidas estadísticas (media, varianza, correlación), pero revelar patrones completamente distintos cuando los observamos en un gráfico.

En esta entrada exploraremos a fondo el Cuarteto de Anscombe, su relevancia, su relación con principios de percepción visual y diseño de gráficas, y las lecciones que aún hoy, en la era de la inteligencia artificial, seguimos necesitando.

¿Qué es el Cuarteto de Anscombe?


El Cuarteto de Anscombe está compuesto por cuatro conjuntos de datos ficticios. Cada conjunto contiene las mismas estadísticas descriptivas básicas:
  • Misma media en X y en Y.
  • Misma varianza.
  • Misma correlación entre las variables.
  • Mismo ajuste de regresión lineal.
Los datos del cuarteto son:

IIIIIIIV
xyxyxyxy
10.08.0410.09.1410.07.468.06.58
8.06.958.08.148.06.778.05.76
13.07.5813.08.7413.012.748.07.71
9.08.819.08.779.07.118.08.84
11.08.3311.09.2611.07.818.08.47
14.09.9614.08.1014.08.848.07.04
6.07.246.06.136.06.088.05.25
4.04.264.03.104.05.3919.012.50
12.010.8412.09.1312.08.158.05.56
7.04.827.07.267.06.428.07.91
5.05.685.04.745.05.738.06.89



Para los cuatro conjuntos de datos:

PropiedadValor
Media de cada una de las variables x9.0
Varianza de cada una de las variables x11.0
Media de cada una de las variables y7.5
Varianza de cada una de las variables y4.12
Correlación entre cada una de las variables x e y0.816
Recta de regresión


A primera vista, uno pensaría que los cuatro conjuntos representan el mismo fenómeno. Sin embargo, cuando se grafican, el resultado es sorprendente:


Cada uno de los cuatro gráficos muestra un patrón completamente distinto:

  1. Un conjunto con una relación lineal clara.

  2. Un conjunto con una curva no lineal.

  3. Un conjunto influenciado por un outlier que altera la correlación.

  4. Un conjunto en donde un solo punto extremo sostiene la relación aparente.

La lección es clara: las estadísticas resumidas son necesarias, pero no suficientes. Siempre es fundamental visualizar los datos.

El Valor de la Visualización de Datos

Las gráficas no son simples adornos. Son herramientas cognitivas que permiten ver relaciones, patrones y anomalías que los números pueden ocultar .

Mirar datos implica reconocer que:

  • Una tabla puede resumir información, pero un gráfico la hace inteligible de un vistazo.
  • El ojo humano percibe patrones, tendencias y rupturas que una media o un coeficiente de correlación jamás revelan.
  • La percepción no es neutra: nuestro cerebro busca conexiones, clústeres y tendencias, incluso cuando no existen .
  • El Cuarteto de Anscombe ilustra de manera brillante este principio.

Errores Comunes en las Gráficas

Tres formas en que una gráfica puede fallar :

  1. Mal gusto
    • Gráficas sobrecargadas de colores, efectos 3D y adornos que confunden más de lo que aclaran.
  2. Malos datos
    • Incluso con un diseño impecable, si los datos están mal seleccionados o mal procesados, la gráfica será engañosa.
  3. Mala percepción
    • Aun con datos correctos, ciertas elecciones visuales (como escalas truncadas o proporciones distorsionadas) pueden inducir a error.


El Cuarteto de Anscombe cae en la tercera categoría como un ejemplo didáctico: la percepción cambia radicalmente cuando graficamos.

Percepción y Cognición: Lo que el Ojo Ve

No todos los estímulos gráficos se procesan con la misma facilidad .

  • Los humanos somos buenos comparando posiciones en un mismo eje.
  • Nos confundimos cuando debemos comparar áreas, ángulos o volúmenes.
  • Los colores y formas pueden ayudar, pero también distraer si se usan mal.

En otras palabras: diseñar una gráfica no es solo cuestión estética, es cuestión cognitiva.


Lecciones del Cuarteto de Anscombe

  1. Nunca confíes solo en estadísticas resumidas.
    • La media y la varianza son útiles, pero no muestran la historia completa.
  2. Siempre grafica los datos.
    • Incluso una gráfica simple (como un scatterplot) puede revelar patrones ocultos.
  3. Cuidado con los outliers.
    • Un solo dato puede alterar completamente la interpretación.
  4. Diseño consciente.
    • Una buena visualización equilibra claridad, honestidad y simplicida


Si quieres ver cómo se aplica el Cuarteto de Anscombe y otros ejemplos de buenas y malas gráficas, te invito a ver nuestro video en YouTube:

👉 👉 

 



En el video exploramos ejemplos prácticos, errores comunes y principios que todo analista, investigador o estudiante debería conocer.

El Cuarteto de Anscombe es más que un ejercicio estadístico: es una advertencia permanente. Nos recuerda que:

  • Los números pueden engañar.

  • La visualización es un arma poderosa para la comprensión.

  • La percepción humana debe estar en el centro del diseño gráfico.

  • La honestidad en la presentación de datos es un deber ético.

En la era de la sobreinformación, nunca fue tan importante aprender a mirar los datos con ojos críticos y gráficos claros.



miércoles, 22 de enero de 2025

Mi experiencia en el reto "Gana tu Mañana 2025" de Oso Trava

Este inicio de año tuve la oportunidad de participar en el reto Gana tu Mañana 2025, organizado por Oso Trava, conocido por su podcast Cracks Podcast (YouTube

y su libro Haz lo que Importa (hazloqueimporta.com)

Debo decir que me encantó la experiencia. Durante 10 días, trabajamos en desarrollar 10 hábitos clave para el crecimiento personal y profesional. Estos fueron:
  1. Respiración y hormesis
  2. Gratitud y metas
  3. Sueño
  4. Enfoque
  5. Hidratación
  6. Movimiento
  7. Motivación
  8. Visualización
  9. Trascendencia
  10. Intención
Estos hábitos, en mi opinión, son esenciales para transformar nuestra vida de manera integral.

Sin embargo, lo que realmente me sorprendió fue la comunidad que descubrí en el reto. Conocer y convivir con personas que comparten un interés genuino en crecer tanto personal como profesionalmente, a su manera y en sus propios términos, fue una experiencia profundamente enriquecedora. Las afinidades y las diferencias entre los participantes aportaron una riqueza única a cada interacción. Incluso, creo que inicié amistades valiosas que, con el tiempo, podrían convertirse en algo mucho más duradero.

El programa "Achievers"

Al finalizar el reto, me enteré de la continuación de esta experiencia: el programa Achievers (más información aquí). 

Se trata de un programa intensivo de 8 semanas diseñado para maximizar el potencial, superar barreras y alcanzar metas que antes parecían inalcanzables.

Después de estos 10 días de transformación, no tengo dudas de que este programa puede marcar una gran diferencia. Sin embargo, este año he decidido tomarme el tiempo para trabajar en algunas áreas sensibles que surgieron durante el reto. Espero poder inscribirme el próximo año con más claridad y propósito.

Si estás leyendo estas líneas y tienes la oportunidad de participar en Achievers, ¡no lo dudes! Es una inversión en ti mismo que realmente vale la pena.

Un reto que inspira acción

El impacto del reto fue tan grande que incluso me inspiró a componer una canción: D.M.S. (Do Meaningful Shit). Es un recordatorio para mí y para todos de enfocarnos en lo que realmente importa.

Si buscas un cambio positivo en tu vida, Gana tu Mañana 2025 es un excelente punto de partida.
-
Podrias ayudarme suscribiéndote a mi canal de youtube, seguramente habrá algo que te interese.

D.M.S. (Do Meaningful Shit)


Letra:
¡Hey! ¡Ho! ¡Sube el volumen ya!
Día 1, ¡vamos ya! (Hey!)
Rompe límites, sin parar (¡Wuh!).
Acción, motor, ¡no hay que esperar!
¡Boom! La meta va a explotar.

Día 2, agua fría (¡Brr!),
El miedo se derrumba (¡Uh!).
Gratitud en las venas (¡Yeah!),
La escasez se despeña.

¡Salta! ¡Grita! ¡Es tu hora!
El tiempo es de oro, no hay zona de comfort.
¡D.M.S.! ¡D.M.S! (¡Do it!)

Sube, sube, sube (¡Fire!),
Cada día es una herida que cura el sudor.
Gana, gana, gana (¡Higher!),
10 días, 10 pasos... ¡Hoy nace el campeón!

Día 4, ¡honor! (Respect),
Energía sin retro (¡Flex!).
Día 5, gripe ¡No! (Nah!),
Suero y fe, ¡pa’l top! (¡Skat!).

Sábado sin pausa (¡Go!),
Domingo, ¡tribu power! (¡Oh!).
Siete días, ¡transformación! (¡Wow!),
El miedo es ilusión.

¡Salta! ¡Grita! ¡Es tu hora!
El tiempo es de oro, no hay zona de comfort.
¡D.M.S.! ¡D.M.S! (¡Do it!)


¡Salta! ¡Grita! ¡Es tu hora!
El tiempo es de oro, no hay zona de comfort.
¡D.M.S.! ¡D.M.S! (¡Do it!)

Sube, sube, sube (¡Fire!),
Cada día es una herida que cura el sudor.
Gana, gana, gana (¡Higher!),
10 días, 10 pasos... ¡Hoy nace el campeón!

Sube, sube, sube (¡Fire!),
Cada día es una herida que cura el sudor.
Gana, gana, gana (¡Higher!),
10 días, 10 pasos... ¡Hoy nace el campeón!


¡Dale! ¡Dale! ¡Dale! (¡Go! Go! Go!),
El maná del esfuerzo ya late en mi voz.
Día 10, ¡triunfo total! (¡Yeah!),
Brilla, brilla, brilla... ¡Logrado está!

¡Sube, sube, sube! ¡Gana, gana, gana!
¡Esta es la vibra, la tribu se hermana!
#GanaTuMañana2025 (¡Uh-uh!).

jueves, 4 de julio de 2024

DSPy: Framework para optimizar algorítmicamente los prompts



Estoy trabajando con DSPy y puedo afirmar que es una maravilla.

Este framework ha mejorado significativamente la calidad de las aplicaciones de LLMs, facilitando la creación de cadenas de prompts de alta calidad de manera automática vía programación.

DSPy es un framework para optimizar algorítmicamente los prompts y los pesos de modelos de lenguaje (LM), especialmente cuando los LM se utilizan una o más veces dentro de un pipeline.

El artículo que les presento es "A Guide to Large Language Model Abstractions", escrita por expertos de Carnegie Mellon, Stanford, y Berkeley. El artículo presenta el Language Model System Interface Model (LMSI), una nueva abstracción de siete capas inspirada en el modelo OSI.

Este modelo organiza y estratifica los frameworks orientados en trabajar con los modelos de lenguaje (como LangChain, LlamaIndex, etc) en capas. Las capas se ordenan desde la más alta hasta la más baja en términos de nivel de abstracción:
7. Capa de Red Neuronal: Acceso directo a la arquitectura y pesos del LM.
6. Capa de Prompting: Entrada de texto a través de API u otras interfaces.
5. Capa de Restricción de Prompting: Imposición de reglas o estructuras en los prompts.
4. Capa de Control: Soporte de flujo de control como condicionales y bucles.
3. Capa de Optimización: Optimización de algún aspecto del LM o del sistema de LMs basado en una métrica.
2. Capa de Aplicación: Bibliotecas y código de aplicación que proporcionan soluciones configurables.
1. Capa de Usuario: Interacción directa con el usuario para realizar tareas impulsadas por LM.

Por ejemplo, al observar la imagen, LangChain incide en las capas: Capa de Prompting, Capa de Restricción de Prompting, Capa de Control y Capa de Aplicación.

El framework DSPY destaca especialmente en la capa de optimización, siendo el único mencionado que optimiza automáticamente las cadenas de prompts, mejorando significativamente la calidad de las aplicaciones de LLMs. Esto es algo realmente impresionante, optimiza el promting.

Para aquellos interesados en el futuro de la programación y el procesamiento de lenguaje natural, esta guía proporciona una estructura clara y comprensible para el desarrollo y la optimización de frameworks de LMs.