El Teorema del Límite Central: ¿Qué es lo suficientemente grande?

  1. Educación
  2. Matemáticas
  3. Estadísticas
  4. El Teorema del Límite Central: ¿Qué es lo suficientemente grande?

Libro Relacionado

U Can: Estadísticas para tontos

Por Deborah J. Rumsey, David Unger

En pocas palabras, el Teorema del Límite Central dice que se puede usar la distribución normal para describir el comportamiento de la media de una muestra, incluso si los valores individuales que componen la media de la muestra no son normales en sí mismos. Pero esto sólo es posible si el tamaño de la muestra es «suficientemente grande». Muchos libros de texto de estadística le dirían que n tendría que tener al menos 30 años.

Pero, ¿por qué n = 30 es el punto de referencia? Muchas variables en la naturaleza, finanzas y otras aplicaciones tienen una distribución muy cercana a la curva normal. Por ejemplo, al mirar la tabla t, se puede ver que los diversos valores de t comienzan a acercarse realmente a los valores de z para cuando se alcanzan los 30 grados de libertad. Una de las razones es que las distribuciones t y la distribución normal comparten dos características importantes: Son simétricos, y son unimodales (tienen un pico).

Si la distribución de sus valores de datos individuales está lejos de cualquiera de estas cualidades, es posible que necesite más de un tamaño de muestra de 30 para utilizar el Teorema del límite central. Cuanto más lejos estén los datos de ser simétricos y unimodales, más datos necesitará.

Simetría

Si usted sabe o sospecha que su distribución de padres no es simétrica con respecto a la media, entonces puede necesitar un tamaño de muestra que sea significativamente mayor que 30 para obtener el posible medio de muestra para verse normal (y por lo tanto usar el Teorema del Límite Central).

Considere el siguiente histograma sesgado a la derecha, que registra el número de mascotas por hogar.

Ahora bien, supongamos que representa a toda la población de hogares. Repetidamente se toman muestras n = 30 hogares de esa población. A continuación se muestra cómo es la distribución de los posibles medios de muestra.

Se puede ver que esta distribución no es normal porque la cola derecha todavía se extiende más lejos del pico central que la izquierda. No es simétrico. Para esta población, se necesita tomar una muestra de alrededor de n = 100 para obtener los medios de la muestra para asentarse en una curva simétrica.

Unimodal

Si usted sabe o sospecha que su distribución parental no es unimodal y tiene más de un pico, entonces podría necesitar más de 30 en su muestra para sentirse bien sobre el uso del Teorema del Límite Central.

Considere el siguiente histograma de población multimodal con tres picos distintos.

Si sólo se toma una muestra de n = 30 de esa población, se obtiene una distribución unimodal, pero todavía no es bastante simétrica.

Para esta población, es necesario tomar una muestra de al menos n = 50 para sentirse cómodo de que la distribución media de la muestra sea más o menos normal.

Post Your Thoughts