Aprende a construir e interpretar histogramas en estadistica. Con la diferencia entre histograma y grafica de barras, clases, frecuencias y distribuciones.
Un histograma es una grafica de barras especial para datos numericos continuos agrupados en intervalos (clases). A diferencia de la grafica de barras normal, las barras del histograma son adyacentes (sin espacio entre ellas) porque los intervalos son continuos. El eje X muestra los intervalos, el eje Y muestra la frecuencia (cuantos datos caen en cada intervalo).
Distribucion simetrica: la moda esta en el centro, media≈mediana≈moda. Sesgo positivo (cola a la derecha): hay valores extremos altos, media>mediana. Ejemplo: salarios. Sesgo negativo (cola a la izquierda): hay valores extremos bajos, media
La frecuencia relativa es la frecuencia de cada clase dividida entre el total (expresada en %). La frecuencia acumulada es la suma de frecuencias hasta ese punto. Si las clases tienen frecuencias 5, 8, 12, 10, 5 (total 40): las frecuencias relativas son 12.5%, 20%, 30%, 25%, 12.5%. Las acumuladas son 12.5%, 32.5%, 62.5%, 87.5%, 100%. El percentil 50 (mediana) esta en la clase donde la acumulada cruza el 50% — aqui en la tercera clase.
Los histogramas son la herramienta visual fundamental del control de calidad industrial. Un proceso bien controlado produce un histograma simetrico y estrecho (baja variabilidad). Un histograma sesgado o con dos picos indica un problema en el proceso. En medicina, los histogramas de hemoglobina, presion arterial o indice de masa corporal permiten identificar rapidamente que porcentaje de la poblacion esta fuera del rango normal. La forma del histograma dice mas sobre los datos que cualquier estadistica resumida.
Los histogramas son la base del analisis de imagenes digitales. El histograma de una imagen grafica la distribucion de brillos de sus pixeles: el eje X va de 0 (negro) a 255 (blanco) y el eje Y muestra cuantos pixeles tienen cada brillo. Una imagen correctamente expuesta tiene pixeles distribuidos por todo el rango. Una imagen sobreexpuesta tiene el histograma apilado a la derecha (muchos pixeles muy brillantes). Una subexpuesta lo tiene a la izquierda. Los fotografos profesionales usan el histograma de la camara (no la imagen en pantalla, que puede engañar) para verificar la exposicion correcta. La estadistica descriptiva y la fotografia digital usan exactamente el mismo concepto.