Estadística Descriptiva
Tablas de contingencia
12/6/2020
Las tablas de contingencia,
son utilizadas en la estadística para determinar y analizar el grado de
relación o asociación que existe entre dos o más variables; variables cualitativas o variables cuantitativas.
Las variables nominales; contienen por lo menos dos categorías, sin un orden específico. Ej. El género (femenino, masculino), estado civil (soltero, casado, viudo, divorciado) color de ojos (verde, azul, café). Variables ordinales; es factible su agrupación en algún orden y tipo de escala específica. Ej. Calificación (aprobado, no aprobado, sobresaliente, excelente), grado de satisfacción (totalmente en desacuerdo, en desacuerdo, ni de acuerdo ni en desacuerdo, de acuerdo, totalmente de acuerdo). Fecha de la última modificación: 12/06/2020 Bibliografía. Hernández, Fernández, Baptista. (2014), Metodología de la Investigación. México: McGraw-Hill
La estadística descriptiva, es una
ciencia de la rama de las matemáticas encargada de la recolección de datos de
una muestra e incluso de una población. Desde la antigüedad diversas culturas compendiaban datos de la población por medio de censos.
Por medio de la estadística descriptiva. Se presenta y caracteriza un conjunto
de datos, con la finalidad de describir las particularidades del conjunto.
Media; conocida como promedio o valor
medio de la suma de datos cuantitativos en una muestra de una variable
específica. Representa el cociente entre la suma de los datos dividida entre el
número de ellos.
Desviación típica; definida como la
raíz cuadrada de la varianza; 20.68. Varianza;
promedio del cuadrado de las diferencias de los datos (427.61) con respecto a
la media aritmética. En este ejemplo 52.3 es la media del conjunto de datos,
15, 21, 80 forman parte del conjunto de datos.
Error típico; desviación promedio en los intervalos de una
distribución de la muestra.
Límite inferior; valor inferior que se tomó para determinar el rango de datos con el nivel de confianza establecido, en este ejemplo fue de 95% dicho nivel de confianza. Límite superior: valor superior que se tomó para determinar el rango de datos con el nivel de confianza establecido, en este ejemplo fue de 95% dicho nivel de confianza. Mínimo; es el valor mínimo que se encontró en el conjunto de datos objeto del análisis. Máximo; es el valor máximo que se encontró en el conjunto de datos objeto del análisis. Coeficiente de Pearson
30/5/2020
El
coeficiente de Pearson es el coeficiente más utilizado en las ciencias
sociales. Se determina con el cociente entre la desviación típica y el
valor determinado en la media aritmética. En este tipo de análisis se
presume el uso de variables ordinales o continuas y que su distribución
está cercana a la normal o curva de campana. El valor más acercado a la
unidad; estará reflejando un mayor grado de correlación. El factor uno
se interpretaría como 1 = 100% de correlación.
La
interpretación general del coeficiente de correlación de Pearson; se
maneja de manera genérica de acuerdo con su valor en relación con la unidad.
Uso e interpretación de la información estadística
22/5/2020
La mediana,
se define como el valor central entre el menor y mayor de ellos en una
escala de datos. Cuando los valores de los datos son impares, la mediana
se ubica en la parte central, cuando es par esta información; se ubica
en la posición que represente la media aritmética de los dos valores
centrales.
La moda;
es el valor de una variable que se repite en un mayor número de
ocasiones. Dicha frecuencia no necesariamente debe ser única, por lo que
dependiendo de su grado de importancia, se puede clasificar como
unimodal, bimonal o multimodal. Mide la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis: Distribución mesocúrtica; presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica; presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable. Ejemplo completo. El número de días necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Se procederá a calcular la media, mediana, moda, varianza y desviación típica. Solución: La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone: m = 21+32+ 15 + 59 + 60 + 61 + 64 + 60 + 71 + 80 / 10 = 52.3 días. La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia: 15, 21, 32, 59, 60, 60,61, 64, 71, 80. En este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana. La moda: el valor de la variable que presenta una mayor frecuencia es 60. La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución:
La desviación típica S: es la raíz cuadrada de la varianza. S = √ 427,61 = 20.67 El rango: diferencia entre el valor de las observaciones mayor y el menor 80 - 15 = 65 días El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética: CV = 20,67/52,3 = 0,39 Ejercicio 1. El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son: 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Hallar la media, moda, mediana; presentar en un diagrama de barras. Fecha de la última modificación: 12/06/2018 Bibliografía. Hernández, Fernández, Baptista. (2014), Metodología de la Investigación. México: McGraw-Hill |
No hay comentarios.:
Publicar un comentario
En breve nos podremos en contacto contigo.