sábado, 9 de julio de 2011
miércoles, 29 de junio de 2011
MEDIDAS DE DISPERSIÓN. (RANGO, VARIANZA, DESVIACIÒN MEDIA, DESVIACIÓN TÍPICA) CHI CUADRADO
RANGO, VARIANZA, DESVIACIÓN MEDIA, DESVIACIÓN TÍPICA
Realizamos los cálculos:
Que nos indica que hay Asociación entre las variables estudiadas, pues está lejano de cero.Pero la Asociación, no es muy fuerte, se podria decir, que es una asociación débil, o moderada.
RANGO
VARIANZA
DESVIACIÓN MEDIA
DESVIACIÓN TÍPICA
En la unidad anterior se estudiaron las medidas de la tendencia central en lo que se refiere a su cálculo, significado y empleo. Sin embargo, como se pondrá de manifiesto en esta unidad, dichas medidas, por sí mismas, no son suficientes para describir la distribución.
Los promedios determinan el centro de la distribución, pero nada indican acerca de cómo están situados los datos, medidas o puntuaciones respecto al centro.
Veamos dos ejemplos:
Al presentar estas dos distribuciones de las puntuaciones obtenidas en un mismo test; vemos que cada una tiene de media el valor 67. En la primera, la puntuación mayor es 72 y la menor es 62. En la segunda distribución, la puntuación más alta es 107 y la más baja 25. El recorrido de la primera distribución es 11, mientras que el correspondiente de la segunda es 83.
Atención
Por esta razón, y para obtener una imagen más nítida de una distribución, se necesita conocer tanto una medida de la tendencia central como otra de la variabilidad Es decir su dispersión y su forma.
En estadística se expresa que la primera distribución del ejemplo es de un grupo homogéneo. Los elementos dentro del mismo son muy parecidos en cuanto a la cualidad medida. La otra distribución corresponde a un grupo heterogéneo, porque la variabilidad es grande. Estos dos términos se usan mucho en sicología, sociología y pedagogía, comunicación, etc.
¿ QUÉ MEDIDAS NOS AYUDANA EFECTUAR UNA DISTRIBUCIÓN?
EL RANGO O RECORRIDO
El recorrido se define como la diferencia entre las puntuaciones mayor y menor . Algunos a este valor aumentan la unidad. Recuerde que utilizamos cuando se trató de la representación de una distribución de frecuencias.
De todos las mediadas de dispersión, el recorrido es la más inestable. Esto quiere decir que de una muestra a otra, el recorrido varía más que cualquiera de las otras medidas.
Un ejemplo aclarará lo dicho. Supongamos una distribución de puntuaciones, siendo 30 la menor y 103 la mayor. La puntuación inmediatamente inferior a 103 es 90. Teniendo en cuenta la definición, el recorrido es 74; sin embargo, 13 de los puntos que integran este recorrido corresponden a la puntación más alta 103. La posibilidad de que la muestra siguiente no contenga esta puntuación alta y desviada es grande y, por tanto, el recorrido será mucho menor. El recorrido, lo mismo que la moda, es un estadígrafo muy inestable, ya que puede variar considerablemente de una muestra a otra.
El empleo del recorrido puede estas justificado cuando se precise rápidamente una medida de dispersión y no haya tiempo de calcular alguna de las otras. No obstante, si se considera la población en lugar de una muestra, el recorrido sería mucho más útil.
En el siguiente cuadro ¿Cuál es el rango?. Usted ya lo encontró es 22. Por que 26-04 = 22
El rango en el cuadro 17.1 de su texto básico es .......?
LA DESVIACION MEDIA
Vamos a la unidad 18 del texto básico para descubrir a esta medida.
La desviación media, también llamada desviación promedio, apenas se emplea en estadística, habiendo sido sustituida por la desviación típica. Sin embargo, un breve examen de este estadígrafo hará más fácil comprender el significado de la desviación típica. Antes de proseguir definiremos con el símbolo (d) la desviación (diferencia) de una puntuación cualquiera respecto de la media aritmética. Matemáticamente.
d =
siendo d = desviación
X = puntuación bruta
En cualquier distribución, la suma de las desviaciones respecto de la media es nula.
Como se observó anteriormente, constituye una propiedad muy importante de la media.
Cálculo de la
desviación media
Puesto que la suma de las desviaciones respecto de la media es cero, se deduce que no es posible calcular la desviación media a menos que se modifique en algo el procedimiento de cálculo. En la práctica, la desviación media, es la media aritmética de las desviaciones consideradas en valor absoluto (prescindiendo del signo). La definición matemática de la desviación media es.
El cálculo ordenado de la desviación media muestra en el ejemplo. Para dicha distribución, las puntuaciones se desvían, en promedio, 6 unidades de la media.
¿Cómo calcular las distribuciones en una serie de frecuencias y de intervalos?
Su fórmula será igual. ¿Por qué?. Analice la página 95 cuadro 18.1 y verifique su desarrollo.
LA DESVIACIÓN TÌPICA
De todas las medidas de dispersión, la desviación típica es la medida que más se utiliza en la práctica. Empezaremos por indicar cómo se calcula, tanto en el caso de datos agrupados como no agrupados.
Con datos no agrupados, el proceso se inicia de la misma forma que si se tratara de hallar la desviación media. Es decir, en primer lugar, se calcula la media. Luego se hallan las desviaciones de cada puntuación respecto de dicha media. Después se elevan al cuadrado cada una de estas desviaciones y se suman los resultados obtenidos.
Tenga presente que una forma de ir comprobando la bondad de los cálculos consiste en observar que la suma de las desviaciones respecto de la media (suma de las x) es cero.
En nuestro caso en Estadística descriptiva solo interesa conocer cómo se distribuyen, respecto de la media de la muestra, un conjunto de datos o puntuaciones.
Cálculo de la desviación típica en el caso de datos no agrupados : = 12.4
En el ejemplo la desviación típica (s) es 4.5.
Algunos autores la representan por
Otros ejemplos usted encontrará en su texto básico página 90.
Si se dispone de una máquina de calcular, es más cómodo aplicar la fórmula que se llama de las puntuaciones brutas para obtener la suma de los cuadrados de las
desviaciones. En la misma, se han escrito las puntuaciones y la primera columna se encabeza por la letra X. La segunda columna es, sencillamente, el cuadrado de cada
d. (Luego se suman los valores en ambas columnas. Debe observarse que si se emplea una máquina de calcular, no es necesario escribir las puntuaciones originales o sus cuadrados, como aparecen a continuación.
Se registran las puntuaciones en la máquina una a una, y en la misma se acumula la suma.
Al final, ambos valores se leen directamente en la máquina. Con este modo de proceder, la suma de cuadrados (de las desviaciones) viene dada por la siguiente fórmula:
Este valor de la suma de cuadrados es el mismo que se obtiene al sumar los cuadrados de las desviaciones de cada puntuación respecto de la media. Aún sin máquina de calcular, el método anterior puede resultar más cómodo que el primero. Obtenida la suma de cuadrados, se sustituyen los valores en la fórmula dada.
Cálculo directo de la desviación típica a partir de las puntuaciones brutas
Otros ejemplos usted encontrará en su texto básico página 90, a fin de que desarrolle este ejercicio.
A veces, se abrevia la expresión calculando por medio de la fórmula que plantea su texto básico en la unidad 19.
¿Cuál le parece más fácil?
Cómo se podrá cuenta la combinación de este cálculo da lugar a la desviación típica a partir de las puntuaciones brutas:
¿Qué sucede si la serie es de frecuencias o tipo II?
Tendremos que incluir este dato. Así:
s=
LA DESVIACIÓN TÍPICA EN EL CASO DE DATOS AGRUPADOS.
El ejemplo que plantea su texto básico en la página 98. Puede usted calcular de manera más abreviada. Siguiendo el mismo procedimiento anterior.
Recuerde:
Que para calcular la desviación típica: primero encontramos la media aritmética, luego las desviaciones al cuadrado y finalmente sumamos el producto de las frecuencias por las desviaciones elevadas al cuadrado.
Por lo tanto necesitamos obtener las siguientes columnas
X | f | Xm | d | d2 | fd2 |
La misma fórmula resume este cálculo:
OTRA MEDIDA DE VARIABILIDAD O DE DISPERSIÓN ES LA VARIANZA Su cálculo es similar a la desviación típica..
Observe y analice su representación puesto que es el mismo valor de la desviación típica elevada al cuadrado.
Tenga presente que el recorrido intercuartílico, que presentaremos por la letra Q, se llama a veces desviación cuartílica. En la unidad siguiente hablamos de cuartiles, Q1 o centil veinticinco, y Q3 o centil setenta y cinco. El recorrido intercuartílico es la mitad de la distancia entre estos dos cuarteles. Matemáticamente se puede escribir:
Su texto básico presenta una amplia información al respecto.
Esta medida es muy fácil de calcular. Para explicarlo de una manera sencilla se ha realizado la siguiente serie con la distribución de las puntuaciones de un test de Estadística. En primer lugar se han de calcular Q1 y Q3. Por definición, Q1 es el punto de la distribución que deja un 25 por 100 de las puntuaciones por debajo de él. El 25 por 100 de 40 casos es 10.
----------------------------------------------------------------------------------------------------------------
CHI CUADRADO
Las variables, que utilizaremos para el ejemplo son:
1) Taller de capacitación
2) Actitud empresarial
Las dos variables, tienen dos categorías. Los datos del primer cuadro se llaman "Valores observados", pues fueron obtenidos, u observados en el experimento.
Los datos del segundo cuadro, se llaman "Valores esperados". Estos valores se obtienen multiplicando el total de cada fila por el total de cada columna, y dividiendo entre el total general (200)
Luego, corresponde aplicar la fórmula de chi cuadrado:
1) Taller de capacitación
2) Actitud empresarial
Las dos variables, tienen dos categorías. Los datos del primer cuadro se llaman "Valores observados", pues fueron obtenidos, u observados en el experimento.
Los datos del segundo cuadro, se llaman "Valores esperados". Estos valores se obtienen multiplicando el total de cada fila por el total de cada columna, y dividiendo entre el total general (200)
Luego, corresponde aplicar la fórmula de chi cuadrado:
Realizamos los cálculos:
Que nos indica que hay Asociación entre las variables estudiadas, pues está lejano de cero.Pero la Asociación, no es muy fuerte, se podria decir, que es una asociación débil, o moderada.
También hemos hablado, de chi cuadrado, en los post, de: 18/10/08,y 20/10/08 .
Puede ser útil consultarlos.
Publicado por Carina Stella Meneguzzi en 01:18 0 comentarios
Etiquetas: Chi Cuadrado
viernes 18 de diciembre de 2009
Uno de nuestros lectores, nos ha pedido ayuda para la realización de un ejemplo de Chi Cuadrado.
Nos ha facilitado los datos, y nosostros hemos realizado los cálculos, y las explicaciones.
Se trata de ver la asociación de dos variables cualitativas nominales, ambas con dos categorías. Tendríamos que calcular el coeficiente de Cramer, o el coeficiente de Contingencia, para ver exactamente el grado de asociación de las variables
Recordamos que los Coeficientes mencionados, varian entre cero y uno. Indicando, falta de asociación, o asociación muy débil cuando se acerca a cero. Y asociación fuerte cuando se acerca a la unidad.
Si se quiere realizar el cálculo solo de Chi Cuadrado, la interpretación es similar. Si chi cuadrado es un número próximo a cero, la asociación será muy débil, y al ir creciendo, la asociación se hará más fuerte.
Cabe recordar, que Chi Cuadrado, no tiene rango de variación.
Las variables involucradas, en este estudio, son:
1) Taller de capacitación
2) Actitud empresarial, o Formación Empresarial
Intuitivamente diríamos que hay relación o asociación, entre capacitarse, y la actitud, o la formación que luego tenga la persona.
Bien, haremos los cálculos.
Nos ha facilitado los datos, y nosostros hemos realizado los cálculos, y las explicaciones.
Se trata de ver la asociación de dos variables cualitativas nominales, ambas con dos categorías. Tendríamos que calcular el coeficiente de Cramer, o el coeficiente de Contingencia, para ver exactamente el grado de asociación de las variables
Recordamos que los Coeficientes mencionados, varian entre cero y uno. Indicando, falta de asociación, o asociación muy débil cuando se acerca a cero. Y asociación fuerte cuando se acerca a la unidad.
Si se quiere realizar el cálculo solo de Chi Cuadrado, la interpretación es similar. Si chi cuadrado es un número próximo a cero, la asociación será muy débil, y al ir creciendo, la asociación se hará más fuerte.
Cabe recordar, que Chi Cuadrado, no tiene rango de variación.
Las variables involucradas, en este estudio, son:
1) Taller de capacitación
2) Actitud empresarial, o Formación Empresarial
Intuitivamente diríamos que hay relación o asociación, entre capacitarse, y la actitud, o la formación que luego tenga la persona.
Bien, haremos los cálculos.
Publicado por Carina Stella Meneguzzi en 10:45 0 comentarios
Etiquetas: Chi Cuadrado
miércoles 18 de marzo de 2009
Esta es la gráfica de la distribución Chi Cuadrado, es una curva asimétrica a la derecha; también se dice que tiene sesgo positivo.
Es muy utilizada en Estadística Inferencial para realizar pruebas de hipótesis, relativas a variables cualitativas.
Se pueden realizar pruebas de hipótesis de independencia , de homogeneidad, y también de bondad de ajuste.
Todos estos temas los trataremos en sucesivos post.
Publicado por Carina Stella Meneguzzi en 00:24 2 comentarios
Etiquetas: Chi Cuadrado
lunes 16 de marzo de 2009
El estadístico Chi Cuadrado, es muy utilizado para ver la asociación de las variables cualitativas nominales.
Este estadístico relaciona los valores observados, con los valores esperados.
Los valores observados, son los que obtenemos de la investigación realizada, es "lo observado" .
Los valores esperados, es lo que se espera que suceda, y se calculan haciendo el supuesto, de que las variables pertenecen a una distribución independiente.
La tabla de contingencia original, es la que contiene los valores observados; y los valores esperados se calculan multiplicando el total de cada fila por el total de cada columna y dividiendo entre el número de observaciones(n). Así queda construida otra tabla de contingencia.
Luego se restan los valores observados y los esperados, y se elevan al cuadrado, para luego dividir cada resta entre el correspondiente valor esperado.
Al sumar todos los números tenemos calculado el estadístico Chi Cuadrado.
Cuanto más grande chi cuadrado, más dependientes son las variables.
Cuanto más próximo a cero chi cuadrado, más independientes son las variables.
Peo chi cuadrado no varía entre cero y uno.
Publicado por Carina Stella Meneguzzi en 00:10 2 comentarios
Etiquetas: Chi Cuadrado
miércoles 25 de febrero de 2009
El coeficiente de contingencia se utiliza para saber la asociación de variables cualitativas nominales, que tienen dos o más categorías.
Este coeficiente require del cálculo previo del estadístico Chi Cuadrado.
Chi cuadrado relaciona los valores observados ( que son los datos recabados para la investigación) , y los valores esperados.
Éstos últimos ( los valores esperados) se calculan haciendo el supuesto de que los valores pertenecen a una distribución independiente.
Por lo que se multiplica el total de cada fila por el total de cada columna de la tabla de contingencia y luego se divide por el total de las observaciones (n).
Por lo que , si fuera cierto que los valores son independientes, todos los valores calculados para cada casillero de la tabla de contingencia deberían dar el mismo número.
Por lo tanto Chi Cuadrado debe debería dar cero.Generalmente, esto no sucede.
El coeficiente de contingencia, toma valores comprendidos entre cero y uno.
Cuando está próximo a cero, indica asociación nula o muy débil entre las variables involucradas.
Los datos sin agrupar, son los datos originales.
Como vienen dados de la encuesta que se realizó para obtenerlos.
En este post supondremos que la cantidad de datos es una cantidad par :
10, 2, 2, 4, 4, 8
Lo primero a realizar, es ordenarlos: 2, 2, 4, 4, 8, 10
Calcularemos la media:
El procedimiento es el mismo que si la cantidad de datos fuera impar.
Se suman todos los valores, y se divide entre la "n"
Para calcular la moda, o modo, se ve cual valor se repite más veces.
En este ejercicio, hay dos modas, el 2 y el 4 .
Se dice que la distribución es bimodal.
Para el cálculo de la mediana, utilizaremos dos fórmulas para los lugares de posicionamiento.
Buscamos los valores que ocupan el lugar 3, y el lugar 4 , que son respectivamente:4 y 4.
Como vienen dados de la encuesta que se realizó para obtenerlos.
En este post supondremos que la cantidad de datos es una cantidad par :
10, 2, 2, 4, 4, 8
Lo primero a realizar, es ordenarlos: 2, 2, 4, 4, 8, 10
Calcularemos la media:
El procedimiento es el mismo que si la cantidad de datos fuera impar.
Se suman todos los valores, y se divide entre la "n"
Para calcular la moda, o modo, se ve cual valor se repite más veces.
En este ejercicio, hay dos modas, el 2 y el 4 .
Se dice que la distribución es bimodal.
Para el cálculo de la mediana, utilizaremos dos fórmulas para los lugares de posicionamiento.
Buscamos los valores que ocupan el lugar 3, y el lugar 4 , que son respectivamente:4 y 4.
Luego se suman y se dividen entre 2.
Suscribirse a:
Entradas (Atom)