Calcular la suma de cuadrados (SSE)

Autor: Charles Brown
Fecha De Creación: 9 Febrero 2021
Fecha De Actualización: 1 Mes De Julio 2024
Anonim
Suma de Cuadrados de la Regresión Lineal Simple: SCR, SCE y SCT
Video: Suma de Cuadrados de la Regresión Lineal Simple: SCR, SCE y SCT

Contenido

La suma de cuadrados, o SSE, es un cálculo estadístico preliminar que conduce a diferentes valores de datos. Cuando tiene un conjunto de valores de datos, es útil poder determinar cuán estrechamente relacionados están estos valores. Tienes que organizar tus datos en una tabla y luego realizar cálculos bastante simples. Una vez que encuentre el SSE para un conjunto de datos, puede encontrar la varianza y la desviación estándar.

Al paso

Método 1 de 3: Calcule el SSE a mano

  1. Crea una tabla de tres columnas. La forma más clara de calcular SSE es comenzar con una tabla de tres columnas. Etiqueta las tres columnas Valor{ displaystyle { text {Value}}}Complete los detalles. La primera columna contiene los valores de sus medidas. Llenar la columna Valor{ displaystyle { text {Value}}}Calcule la media. Antes de poder calcular el error para cada medición, debe calcular la media de todo el conjunto de datos.
    • La media de un conjunto de datos es la suma de los valores dividida por el número de valores del conjunto. Esto se puede representar simbólicamente, con la variable μ{ Displaystyle mu}Calcule los valores de error individuales. En la segunda columna de su tabla, debe ingresar los valores de error para cada valor de datos. El error es la diferencia entre la medición y el promedio.
      • Para el conjunto de datos dado, reste la media, 98,87, de cada valor medido y complete la segunda columna con los resultados. Estos diez cálculos son los siguientes:
        • 99,098,87=0,13{ Displaystyle 99.0-98.87 = 0.13}Calcule el SSE. En la tercera columna de la tabla, encuentre el cuadrado de cada uno de los valores resultantes en la columna del medio. Estos representan los cuadrados de la desviación de la media para cada valor de datos medidos.
          • Para cada valor en la columna del medio, use una calculadora para calcular el cuadrado. Registre los resultados en la tercera columna, de la siguiente manera:
            • 0,132=0,0169{ Displaystyle 0.13 ^ {2} = 0.0169}Sume los cuadrados de los errores. El último paso es encontrar la suma de los valores en la tercera columna. El resultado deseado es el SSE, o la suma de los cuadrados de los errores.
              • Para este conjunto de datos, el SSE se calcula sumando los diez valores en la tercera columna:
              • S.S.mi=6,921{ displaystyle SSE = 6,921}Etiqueta las columnas de la hoja de cálculo. Crea una tabla con tres columnas en Excel, con los mismos tres encabezados que arriba.
                • En la celda A1, escriba "Valor" como título.
                • En el cuadro B1, escriba "Desviación" como título.
                • En el cuadro C1, escriba "Desviación al cuadrado" como título.
              • Introduce tus detalles. En la primera columna debe ingresar los valores de sus medidas. Si el conjunto es pequeño, puede escribirlo fácilmente a mano. Si tiene un gran conjunto de datos, es posible que deba copiar y pegar los datos en la columna.
              • Determine el promedio de los puntos de datos. Excel tiene una función que calcula el promedio por ti. En una celda vacía debajo de su tabla de datos (no importa qué celda elija), ingrese lo siguiente:
                • = Promedio (A2: ___)
                • No ingrese espacios en blanco. Complete ese espacio con el nombre de la celda de su último punto de datos. Por ejemplo, si tiene 100 puntos de datos, usaría la función:
                  • = Promedio (A2: A101)
                  • Esta función contiene los datos de las celdas A2 a A101, porque la fila superior contiene los encabezados de las columnas.
                • Cuando presiona Enter o cuando hace clic en otra celda de la tabla, la celda recién programada se llena automáticamente con el promedio de sus valores de datos.
              • Ingrese la función para las medidas de error. En la primera celda vacía de la columna "Desviación", ingrese una función para calcular la diferencia entre cada punto de datos y la media. Para hacer esto, use el nombre de la celda donde se encuentra la media. Supongamos que ha utilizado la celda A104 por ahora.
                • La función de cálculo de error que ingresa en la celda B2 es:
                  • = A2- $ A $ 104. Los signos de dólar son necesarios para asegurarse de cerrar la casilla A104 para cualquier cálculo.
              • Ingrese la función para los errores al cuadrado. En la tercera columna, puede indicarle a Excel que calcule el cuadrado deseado.
                • En la celda C2, ingrese la siguiente función:
                  • = B2 ^ 2
              • Copie las funciones para llenar toda la tabla. Después de ingresar las funciones en la celda superior de cada columna, B2 y C2 respectivamente, debe completar toda la tabla. Puede volver a escribir la función en cualquier línea de la tabla, pero esto llevaría demasiado tiempo. Con el mouse, resalte las celdas B2 y C2 juntas, y sin soltar el botón del mouse, arrastre a la celda inferior de cada columna.
                • Suponiendo que tiene 100 puntos de datos en su tabla, arrastre el mouse a las celdas B101 y C101.
                • Cuando suelta el botón del mouse, las fórmulas se copian en todas las celdas de la tabla. La tabla debe llenarse automáticamente con los valores calculados.
              • Encuentra el SSE. La columna C de su tabla contiene todos los valores de error al cuadrado. El último paso es dejar que Excel calcule la suma de estos valores.
                • En una celda debajo de la tabla, probablemente C102 en este ejemplo, ingrese la siguiente función:
                  • = Suma (C2: C101)
                • Si hace clic en Entrar o hace clic en otra celda de la tabla, obtendrá el valor SSE de sus datos.

Método 3 de 3: relacionar la SSE con otras estadísticas

  1. Calcule la desviación del SSE. Encontrar el SSE para un conjunto de datos es generalmente un componente básico para encontrar otros valores más útiles. El primero de ellos es la varianza. La varianza es una medida de cuánto se desvían los datos medidos de la media. En realidad, es la media de las diferencias al cuadrado de la media.
    • Dado que el SSE es la suma de los errores al cuadrado, puede encontrar la media (esa es la varianza) simplemente dividiendo por el número de valores. Sin embargo, si calcula la varianza de una serie de muestra, en lugar de una población completa, divide la varianza por (n-1) en lugar de por n. Entonces:
      • Varianza = SSE / n, si calcula la varianza de una población completa.
      • Varianza = SSE / (n-1), al calcular la varianza de una muestra de datos.
    • Para el problema de muestreo de la temperatura de los pacientes, podemos asumir que 10 pacientes son solo una muestra. Por lo tanto, la varianza se calcula de la siguiente manera:
      • Diferencia=SSE(norte1){ displaystyle { text {Varianza}} = { frac { text {SSE}} {(n-1)}}}Calcule la desviación estándar del SSE. La desviación estándar es un valor de uso común que indica cuánto se desvían de la media los valores de un conjunto de datos. La desviación estándar es la raíz cuadrada de la varianza. Recuerde que la varianza es la media de las medidas del error al cuadrado.
        • Por lo tanto, después de calcular el SSE, puede encontrar la desviación estándar de esta manera:
          • Desviación Estándar=SSEnorte1{ displaystyle { text {Desviación estándar}} = { sqrt { frac { text {SSE}} {n-1}}}}Utilice SSE para determinar la covarianza. Este artículo se ha centrado en conjuntos de datos que miden solo un valor a la vez. Sin embargo, en muchos estudios puede comparar dos valores separados. Por ejemplo, desea saber cómo se relacionan esos dos valores entre sí, no solo con la media del conjunto de datos. Este valor es la covarianza.
            • Los cálculos de covarianza son demasiado detallados para ser descritos aquí, excepto para tener en cuenta que usará el SSE para cada tipo de datos y luego lo comparará. Para obtener una descripción más detallada de la covarianza y los cálculos involucrados, puede encontrar artículos sobre este tema en wikiHow.
            • Como ejemplo del uso de la covarianza, podría comparar la edad de los pacientes en un estudio médico con la efectividad de un medicamento para bajar la temperatura de la fiebre. Luego, tiene un conjunto de datos de edades y un segundo conjunto de datos de temperaturas. Luego encontrará la SSE para cada conjunto de datos y, a partir de ahí, la varianza, las desviaciones estándar y la covarianza.