Determinar el coeficiente de correlación

Autor: Morris Wright
Fecha De Creación: 28 Abril 2021
Fecha De Actualización: 19 Junio 2024
Anonim
Coeficiente de Correlacion
Video: Coeficiente de Correlacion

Contenido

El coeficiente de correlación, denotado ro ρ, es la medida de la correlación lineal (la relación, tanto en fuerza como en dirección) entre dos variables. Varía de -1 a +1, utilizando signos más y menos para representar la correlación positiva y negativa. Si el coeficiente de correlación es exactamente -1, entonces la relación entre las dos variables es completamente negativa; si el coeficiente de correlación es exactamente +1, entonces la relación es completamente positiva. Dos variables pueden tener una correlación positiva, una correlación negativa o ninguna correlación. Puede calcular la correlación a mano, utilizando algunos de los cálculos de correlación gratuitos disponibles en línea, o utilizando las funciones estadísticas de una buena calculadora gráfica.

Al paso

Método 1 de 4: Calcule el coeficiente de correlación a mano

  1. Primero recopile sus datos. Para comenzar a calcular una correlación eficiente, primero examine los pares de datos. Es útil ponerlos en una mesa, tanto en vertical como en horizontal. Etiqueta cada fila o columna xey.
    • Por ejemplo, suponga que tiene cuatro pares de datos para X y y. La tabla puede verse así:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Calcule la media de X. Para calcular la media, necesita todos los valores de X sumar y luego dividir por el número de valores.
    • Usando el ejemplo anterior, observe que tiene cuatro valores para X. Para calcular la media, suma todos los valores X y dividirlo por 4. El cálculo se ve así:
    • μX=(1+2+4+5)/4{ Displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Encuentra la media de y. Al promedio de y Para encontrarlo, siga los mismos pasos, sumando todos los valores de y y luego dividiendo por el número de valores.
      • En el ejemplo anterior, también tiene cuatro valores para y. Sume todos estos valores y luego divídalos por 4. Los cálculos se verán así:
      • μy=(1+3+5+7)/4{ Displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Determine la desviación estándar de X. Una vez que tenga sus medias, puede calcular la desviación estándar. Para hacer esto, use la fórmula:
        • σX=1norte1Σ(XμX)2{ Displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Calcule la desviación estándar de y. Usando los mismos pasos básicos, encuentre la desviación estándar de y. Vas a usar la misma fórmula, usando los puntos de datos para y.
          • Con los datos de muestra, sus cálculos se verán así:
          • σy=141((14)2+(34)2+(54)2+(74)2){ Displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Revise la fórmula básica para determinar un coeficiente de correlación. La fórmula para calcular un coeficiente de correlación usa medias, desviaciones estándar y el número de pares en un conjunto de datos (representado por norte). El coeficiente de correlación en sí está representado por la letra minúscula r o la letra griega ρ (rho). Para este artículo, usaremos la fórmula conocida como coeficiente de correlación de Pearson como se muestra a continuación:
            • ρ=(1norte1)Σ(XμXσX)(yμyσy){ Displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } derecha) * izquierda ({ frac {y- mu _ {y}} { sigma _ {y}}} derecha)}Determine el coeficiente de correlación. Ahora tiene las medias y las desviaciones estándar de sus variables, por lo que puede pasar a la fórmula del coeficiente de correlación. Recuérdalo norte representa el número de valores que tiene. Ya ha resuelto la otra información relevante en los pasos anteriores.
              • Con los datos de muestra, puede ingresar los datos en la fórmula del coeficiente de correlación y calcularlo de la siguiente manera:
              • ρ=(1norte1)Σ(XμXσX)(yμyσy){ Displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } derecha) * izquierda ({ frac {y- mu _ {y}} { sigma _ {y}}} derecha)}Interprete el resultado. Para este conjunto de datos, el coeficiente de correlación es 0,988. Este número le dice dos cosas sobre los datos. Mira el signo del número y el tamaño del número.
                • Dado que el coeficiente de correlación es positivo, se puede decir que existe una correlación positiva entre los datos xy los datos y. Esto significa que si los valores de x aumentan, se espera que los valores de y también aumenten.
                • Dado que el coeficiente de correlación está muy cerca de +1, los datos xey están muy relacionados. Si graficara estos puntos, vería que son una muy buena aproximación a una línea recta.

Método 2 de 4: uso de calculadoras de correlación en línea

  1. Busque calculadoras de correlación en línea. Medir la correlación es un cálculo bastante estándar para los estadísticos. El cálculo puede resultar muy tedioso para grandes conjuntos de datos si se realiza a mano. Por lo tanto, muchas fuentes han hecho disponibles en línea cálculos de correlación comunes. Utilice cualquier motor de búsqueda e introduzca el término de búsqueda "calculadora de correlación".
  2. Ingrese los datos. Lea atentamente las instrucciones del sitio web para que pueda ingresar los datos correctamente. Es importante que los pares de datos se mantengan en orden o obtendrá un resultado de correlación incorrecto. Los diferentes sitios web utilizan diferentes formatos para ingresar datos.
    • Por ejemplo, en el sitio web http://ncalculators.com/statistics/correlation-coefficient-calculator.htm encontrará un cuadro horizontal para ingresar valores x y un segundo cuadro horizontal para ingresar valores y. Ingresa los términos, separados solo por comas. Por lo tanto, el conjunto de datos x calculado anteriormente en este artículo debe ingresarse como 1, 2, 4, 5. El conjunto de datos y se ingresa como 1,3,5,7.
    • En otro sitio, http://www.alcula.com/calculators/statistics/correlation-coefficient/, puede ingresar datos horizontal o verticalmente, siempre que mantenga los puntos de datos en orden.
  3. Calcule los resultados. Estos sitios de cálculo son populares porque después de ingresar los datos, generalmente solo necesita hacer clic en el botón "Calcular"; el resultado aparecerá automáticamente.

Método 3 de 4: usar una calculadora gráfica

  1. Introduce tus detalles. En su calculadora gráfica, habilite la función de estadísticas y luego seleccione el comando "Editar".
    • Cada calculadora tiene comandos de teclado ligeramente diferentes. Este artículo proporciona las instrucciones específicas para la TI-86 de Texas Instruments.
    • Para acceder a la función Stat, presione [2nd] -Stat (encima de la tecla "+") y luego presione F2-Edit.
  2. Elimina todos los datos antiguos almacenados. La mayoría de las calculadoras conservarán los datos estadísticos hasta que se borren. Para asegurarse de no confundir los datos antiguos con los nuevos, primero debe borrar toda la información guardada anteriormente.
    • Utilice las teclas de flecha para mover el cursor y resaltar la categoría "xStat". Luego presione "Borrar" y "Enter". Esto debería borrar todos los valores en la columna xStat.
    • Utilice las teclas de flecha para resaltar la categoría "yStat". Presione "Borrar" y "Entrar" para borrar también los datos de esa columna.
  3. Ingrese sus valores de datos. Utilice las teclas de flecha para mover el cursor al primer espacio debajo del encabezado xStat. Escriba su primer valor de datos y luego presione Entrar. Debería ver el espacio en la parte inferior de la pantalla "xStat (1) = __", donde su valor llena el espacio vacío. Cuando presione Entrar, los datos llenarán la tabla, el cursor se moverá a la siguiente línea y la línea en la parte inferior de la pantalla ahora debería leer "xStat (2) = __".
    • Continúe ingresando todos los valores de x.
    • Cuando haya ingresado los valores de x, use las teclas de flecha para moverse a la columna yStat e ingrese los valores de y.
    • Cuando se hayan ingresado todos los datos, presione Salir para borrar la pantalla y salir del menú Estadísticas.
  4. Calcule las estadísticas de regresión lineal. El coeficiente de correlación es una medida de qué tan cerca se aproximan los datos a una línea recta. Una calculadora gráfica con funciones estadísticas puede calcular la línea de mejor ajuste y el coeficiente de correlación muy rápidamente.
    • Ingrese a la función Stat y luego presione el botón Calc. En la TI-86, esto es [2nd] [Stat] [F1].
    • Elija los cálculos de regresión lineal. En la TI-86, esto es [F3], etiquetado "LinR". La pantalla gráfica mostrará la línea "LinR _" con un cursor parpadeante.
    • Ahora debe ingresar los nombres de las dos variables que desea calcular. Estos son xStat e yStat.
      • En la TI-86, seleccione la lista de nombres ("Nombres") presionando [2nd] [List] [F3].
      • La línea inferior de su pantalla ahora debería mostrar las variables disponibles. Elija [xStat] (probablemente sea el botón F1 o F2), luego ingrese una coma y luego [yStat].
      • Presione Enter para calcular los datos
  5. Interprete los resultados. Cuando presione Entrar, la calculadora calculará inmediatamente la siguiente información para los datos que ingresó:
    • y=a+BX{ Displaystyle y = a + bx}Comprende el concepto de correlación. La correlación se refiere a la relación estadística entre dos cantidades. El coeficiente de correlación es un número único que puede calcular para dos conjuntos de puntos de datos. El número es siempre algo entre -1 y +1, e indica qué tan cerca están los dos conjuntos de datos.
      • Por ejemplo, si midiera la altura y la edad de niños de hasta aproximadamente 12 años, esperaría encontrar una fuerte correlación positiva. A medida que los niños crecen, tienden a ser más altos.
      • Un ejemplo de correlación negativa es comparar el tiempo que alguien pasa practicando golf con el puntaje de golf de esa persona. A medida que avanza la práctica, la puntuación debería bajar.
      • En última instancia, esperaría poca correlación, positiva o negativa, entre la talla de zapato de una persona, por ejemplo, y sus calificaciones en los exámenes.
    • Calcule la media. La media aritmética, o "media", de un conjunto de datos se calcula sumando todos los valores de los datos y luego dividiendo por el número de valores del conjunto. Para determinar el coeficiente de correlación de sus datos, debe calcular el promedio de cada conjunto de datos.
      • La media de una variable se indica mediante la variable con una línea horizontal encima. Esto a menudo se denomina "barra x" o "barra y" para los conjuntos de datos de x e y. Alternativamente, la media se puede denotar con la letra griega minúscula μ (mu). Por ejemplo, para indicar la media de los puntos de datos de x, podría usar μX o μ (x).
      • Por ejemplo, si tiene un conjunto de x (1, 2, 5, 6, 9, 10), el promedio de estos datos se calcula de la siguiente manera:
        • μX=(1+2+5+6+9+10)/6{ Displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Conoce la importancia de la desviación estándar. En estadística, la desviación estándar mide la variación, mostrando la dispersión de los números de la media. Un grupo de números con una desviación estándar baja está bastante cerca unos de otros. Un grupo de números con una desviación estándar alta está más disperso.
          • Como símbolo, la desviación estándar se expresa utilizando la letra minúscula s o la letra griega σ (sigma). Por lo tanto, la desviación estándar de los datos x se escribe como sX o σX.
        • Reconoce la notación de suma. El operador de suma es uno de los operadores más comunes en matemáticas e indica una suma de valores. Está representado por la letra mayúscula griega, sigma o ∑.
          • Por ejemplo, si tiene una colección de puntos de datos x (1,2,5,6,9,10), entonces ∑x significa:
            • 1+2+5+6+9+10 = 33

Consejos

  • El coeficiente de correlación a veces se denomina "coeficiente de correlación producto-momento de Pearson" en honor a Karl Pearson, su desarrollador.
  • En general, un coeficiente de correlación superior a 0,8 (positivo o negativo) representa una fuerte correlación; un coeficiente de correlación inferior a 0,5 (positivo o negativo de nuevo) representa un coeficiente de correlación débil.

Advertencias

  • La correlación muestra que dos conjuntos de datos están conectados de alguna manera. Sin embargo, tenga cuidado de no interpretar esto como una relación causal. Por ejemplo, si compara las tallas de calzado de las personas y su altura, es probable que encuentre una fuerte correlación positiva. Las personas más grandes generalmente tienen pies más grandes. Sin embargo, esto no significa que crecer hará que tus pies crezcan, o que los pies grandes te harán crecer. Simplemente suceden juntos.