La variabilidad estadística, mi último descubrimiento
¡De contar garbanzos a viajar a Oviedo!
Es increíble cómo una simple pregunta sobre la cantidad de garbanzos en un paquete de 1 kg nos llevó a una aventura inesperada en Oviedo. ¡Hoy os explicaré esta aventura!
Hace unas semanas, mientras diseñábamos una sesión para secundaria, nos surgió la curiosidad de cuántos garbanzos había en un paquete de 1 kg. ¿Tenéis alguna estimación antes de revelar el secreto?
Ahora que tenéis una primera estimación, os proporcionaremos otras imágenes que pueden ayudaros en vuestro cálculo.
¿Y cómo pudimos comprobarlo? Pues bien, una de las estrategias que implementamos con Marcel fue contar uno por uno cada garbanzo.
Aunque llevó su tiempo y paciencia, esta táctica es realmente exacta. ¡Y así confirmamos que había exactamente 1872 garbanzos!
¿Hacemos una visita a Luis José?
Después de esta odisea con los garbanzos, nos propusimos estimar utilizando diversas estrategias para comprobar qué tan cerca estábamos del valor real. Justamente, Luis José Rodríguez, un apasionado de la estadística y la didáctica, me invitó a la Universidad de Oviedo para dar unas charlas sobre educación tanto a alumnado de magisterio como del máster de secundaria. ¡Aprovechamos esta oportunidad para intercambiar muchas ideas!
Luis José me abrió una ventana al fascinante mundo de la didáctica de la estadística. Exploramos el análisis de datos, el diseño de experimentos y la variabilidad (más adelante os lo explicaré), un concepto que no se suele transmitir con claridad.
Decidimos usar el método de captura y recaptura para obtener una aproximación del número total de garbanzos. El método consistía en coger una muestra inicial de garbanzos del paquete, contarlos y marcarlos. Nosotros lo hicimos con 100.
Luego, estos garbanzos marcados se vuelven a mezclar con el resto y se toma una segunda muestra sin mirar para ver cuántos de ellos son rojos.
Por ejemplo, si cojo 50 garbanzos y 3 de ellos están marcados, podemos aplicar proporcionalidad y encontrar una aproximación del número total de garbanzos.
3 / 50 = 100 / N
N= 5000 / 3
N= 1666,66 garbanzos
Sin embargo, no sabemos cuán fiable es este número. Si quisiéramos que fuera más preciso, podríamos considerar diversas ideas. Una de las más comunes es aumentar el tamaño de la muestra. En lugar de seleccionar solo 50 garbanzos y contar cuántos están marcados, podríamos tomar 500.
Al aplicar la proporcionalidad, podemos observar que de los 500 garbanzos, 24 estaban pintados.
24 / 500 = 100 / N
N= 50000 / 24
N= 2083,33
Por lo tanto, esta estrategia nos ofrece una estimación de, aproximadamente, 2083 garbanzos marcados en total.
Pero también, rescatando la idea de variabilidad, podríamos coger los mismos 50 garbanzos, contar cuántos están marcados, devolverlos al saco y repetir este proceso varias veces, digamos, 10 veces. Esto nos proporcionaría una distribución de datos que nos daría una información valiosa. Por ejemplo, después de realizar el proceso, he obtenido estos resultados y los he representado en esta tabla y en el siguiente gráfico:
Cuando revisamos los resultados, notamos que la mayoría de los garbanzos marcados se concentran en el rango entre 2 y 3. Este fenómeno es común cuando se trabaja con muestras más grandes, ya que tienden a ser más representativas de la población total. Es interesante destacar que la mediana de la muestra se sitúa en 2 garbanzos marcados, lo que significa que la mitad de las muestras registraron 2 o menos garbanzos marcados. Por otro lado, la media, que es el promedio de garbanzos marcados cada 50, se encuentra en 2,8. Esto indica que, en promedio, se encontraron aproximadamente 2,8 garbanzos marcados en cada muestra de 50.
¿Podríamos ahora obtener una aproximación más precisa? Si aplicamos la proporcionalidad a los datos que tenemos:
2,8 / 50 = 100 / N
N=5000 / 2,8
N= 1785,71 garbanzos sería la aproximación siguiendo esta estrategia.
¡Recordamos que el número exacto de garbanzos era 1872!
En resumen, desde el conteo de garbanzos hasta la exploración estadística en Oviedo, cada experiencia nos enseña algo nuevo. ¿Quién habría pensado que una simple pregunta nos llevaría a un viaje tan enriquecedor?
Muchas gracias por todo, Luis José.
demasiado bueno, no deja de ser interesante observar cómo es un perfecto caso donde usar la mediana es peor que la media por ser una distribución normal la del experimento
muy muy bueno, me ha encantado, por favor, sigue así!!!!!
Hay algo que no he entendido bien.
Si en lugar de las 10 últimas muestras de 50 hubieras tomado una sola de 500 (com has hecho anteriormente), te habrian salido 28 garbanzos pintados (suma de los garbanzos pintados de las 50 muestras)
28/500 = 100/N
N=50000/28 = 1785
Por lo que el hecho de que sean 10 muestras de 50 no mejora respecto de haber tomado una sola muestra de 500 garbanzos. Al menos así lo veo.
O sea, lo que importa es únicamente aumentar el número de garbanzos observado. ¿O no?