Cómo calcular las emisiones

Autor: Janice Evans
Fecha De Creación: 23 Mes De Julio 2021
Fecha De Actualización: 1 Mes De Julio 2024
Anonim
Exponential equations - Exercises 1 and 2
Video: Exponential equations - Exercises 1 and 2

Contenido

En las estadísticas, los valores atípicos son valores que difieren marcadamente de otros valores en el conjunto de datos recopilados. Un valor atípico puede indicar anomalías en la distribución de datos o errores de medición, por lo que los valores atípicos a menudo se excluyen del conjunto de datos. Al eliminar los valores atípicos del conjunto de datos, puede llegar a conclusiones inesperadas o más precisas. Por lo tanto, es necesario poder calcular y estimar valores atípicos para garantizar una comprensión adecuada de las estadísticas.

Pasos

  1. 1 Aprenda a reconocer posibles valores atípicos. Los valores atípicos potenciales deben identificarse antes de excluir los valores atípicos del conjunto de datos. Los valores atípicos son valores que son muy diferentes de la mayoría de los valores del conjunto de datos; en otras palabras, los valores atípicos están fuera de la tendencia de la mayoría de los valores. Esto es fácil de encontrar en tablas de valores o (especialmente) en gráficos. Si se grafican los valores del conjunto de datos, los valores atípicos estarán lejos de la mayoría de los demás valores. Si, por ejemplo, la mayoría de los valores caen en una línea recta, los valores atípicos se encuentran a ambos lados de dicha línea recta.
    • Por ejemplo, considere un conjunto de datos que represente las temperaturas de 12 objetos diferentes en una habitación. Si 11 objetos están aproximadamente a 70 grados, pero el duodécimo objeto (posiblemente un horno) está a 300 grados, entonces una mirada rápida a los valores puede indicar que es probable que el horno se haya roto.
  2. 2 Ordene los datos en orden ascendente. El primer paso para determinar los valores atípicos es calcular la mediana del conjunto de datos. Esta tarea se simplifica enormemente si los valores del conjunto de datos se organizan en orden ascendente (de menor a mayor).
    • Continuando con el ejemplo anterior, considere el siguiente conjunto de datos que representa las temperaturas de varios objetos: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Este conjunto debe ordenarse de la siguiente manera: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Calcule la mediana del conjunto de datos. La mediana de un conjunto de datos es el valor en el medio del conjunto de datos. Si el conjunto de datos contiene un número impar de valores, la mediana es el valor antes y después del cual hay el mismo número de valores en el conjunto de datos. Pero si el conjunto de datos contiene un número par de valores, entonces necesita encontrar la media aritmética de las dos medias. Tenga en cuenta que al calcular los valores atípicos, la mediana generalmente se denomina Q2, ya que se encuentra entre Q1 y Q3, los cuartiles inferior y superior, que definiremos más adelante.
    • No tema trabajar con conjuntos de datos que tengan un número par de valores: la media aritmética de las dos medias será un número que no se encuentra en el conjunto de datos; esto es normal. Pero si los dos valores medios son el mismo número, entonces la media aritmética es igual a este número; esto también está en el orden de las cosas.
    • En el ejemplo anterior, los 2 valores del medio son 70 y 71, por lo que la mediana es ((70 + 71) / 2) = 70,5.
  4. 4 Calcula el cuartil inferior. Este valor, denominado Q1, está por debajo del cual se encuentra el 25% de los valores del conjunto de datos. En otras palabras, es la mitad de los valores hasta la mediana. Si hay un número par de valores del conjunto de datos antes de la mediana, debe encontrar la media aritmética de las dos medias para calcular Q1 (esto es similar a calcular la mediana).
    • En nuestro ejemplo, 6 valores se encuentran después de la mediana y 6 valores, antes. Esto significa que para calcular el cuartil inferior, necesitamos encontrar la media aritmética de las dos medias de los seis valores que se encuentran antes de la mediana. Aquí los valores promedio son 70 y 70. Por lo tanto, Q1 = ((70 + 70) / 2) = 70.
  5. 5 Calcula el cuartil superior. Este valor, denominado Q3, está por encima del cual se encuentra el 25% de los valores del conjunto de datos. El proceso para calcular Q3 es similar al proceso para calcular Q1, pero aquí se consideran los valores después de la mediana.
    • En el ejemplo anterior, los dos promedios de los seis después de la mediana son 71 y 72. Entonces Q3 = ((71 + 72) / 2) = 71.5.
  6. 6 Calcula el rango intercuartílico. Habiendo calculado Q1 y Q3, es necesario encontrar la distancia entre estos valores. Para hacer esto, reste Q1 de Q3. El valor del rango intercuartílico es extremadamente importante para determinar los límites de los valores que no son valores atípicos.
    • En nuestro ejemplo, Q1 = 70 y Q3 = 71,5. El rango intercuartílico es 71,5 - 70 = 1,5.
    • Tenga en cuenta que esto también se aplica a los valores negativos de Q1 y Q3. Por ejemplo, si Q1 = -70, entonces el rango intercuartílico es 71,5 - (-70) = 141,5.
  7. 7 Encuentre los "límites internos" de los valores en el conjunto de datos. Los valores atípicos se determinan analizando los valores, ya sea que se encuentren o no dentro de los llamados "límites internos" y "límites externos". Un valor fuera de los "límites internos" se clasifica como un "valor atípico menor", mientras que un valor fuera de los "límites externos" se clasifica como un "valor atípico significativo". Para encontrar los límites internos, debe multiplicar el rango intercuartil por 1,5; el resultado debe sumarse a Q3 y restarse de Q1. Los dos números encontrados son los límites internos del conjunto de datos.
    • En nuestro ejemplo, el rango intercuartílico es (71,5 - 70) = 1,5. Más: 1,5 * 1,5 = 2,25. Este número debe sumarse a Q3 y restarse de Q1 para encontrar los límites internos:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Por lo tanto, los límites internos son 67,75 y 73,75.
    • En nuestro ejemplo, solo la temperatura del horno (300 grados) se encuentra fuera de estos límites y puede considerarse una emisión insignificante. Pero no saque conclusiones precipitadas, tenemos que determinar si esta temperatura es un valor atípico significativo.
  8. 8 Encuentra los "límites exteriores" del conjunto de datos. Esto se hace de la misma manera que para los límites interiores, excepto que el rango intercuartílico se multiplica por 3 en lugar de 1,5. El resultado debe sumarse a Q3 y restarse de Q1. Los dos números encontrados son los límites exteriores del conjunto de datos.
    • En nuestro ejemplo, multiplique el rango intercuartil por 3: 1.5 * 3 = 4.5. Calcule los límites exteriores:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Entonces los límites externos son 65.5 y 76.
    • Cualquier valor que caiga fuera de los límites exteriores se considera una emisión significativa. En nuestro ejemplo, una temperatura del horno de 300 grados se considera un reventón significativo.
  9. 9 Utilice una estimación cualitativa para determinar si los valores atípicos deben excluirse del conjunto de datos. El método descrito anteriormente le permite determinar si algunos valores son valores atípicos (menores o significativos). Sin embargo, no se equivoque: un valor que se clasifica como un valor atípico es solo un "candidato" para una excepción, lo que significa que no tiene que excluirlo. La causa del valor atípico es el factor principal que influye en la decisión de excluir el valor atípico. Como regla general, se excluyen los valores atípicos que se producen debido a errores (en mediciones, registros, etc.). Por otro lado, los valores atípicos asociados no con errores sino con nueva información o tendencia generalmente se dejan en el conjunto de datos.
    • Es igualmente importante evaluar el efecto de los valores atípicos en la mediana del conjunto de datos (ya sea que lo distorsionen o no). Esto es especialmente importante cuando extrae conclusiones de la mediana de un conjunto de datos.
    • En nuestro ejemplo, es extremadamente improbable que el horno se caliente a una temperatura de 300 grados (a menos que tengamos en cuenta las anomalías naturales). Por lo tanto, se puede concluir (con un alto grado de certeza) que dicha temperatura es un error de medición que debe excluirse del conjunto de datos. Además, si no descarta el valor atípico, la mediana del conjunto de datos será (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 grados, pero si excluye el valor atípico, la mediana será (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 grados.
      • Los valores atípicos suelen ser el resultado de un error humano, por lo que los valores atípicos deben excluirse de los conjuntos de datos.
  10. 10 Comprenda la importancia de los (a veces) valores atípicos que quedan en el conjunto de datos. Algunos valores atípicos deben excluirse del conjunto de datos porque se deben a errores y problemas técnicos; otros valores atípicos deben dejarse en el conjunto de datos. Si, por ejemplo, un valor atípico no es el resultado de un error y / o proporciona una nueva comprensión del fenómeno bajo prueba, entonces debe dejarse en el conjunto de datos. Los experimentos científicos son especialmente sensibles a los valores atípicos: al eliminar por error un valor atípico, es posible que se esté perdiendo una nueva tendencia o descubrimiento.
    • Por ejemplo, estamos desarrollando un nuevo fármaco para aumentar el tamaño de los peces en las pesquerías. Usaremos el antiguo conjunto de datos ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), pero esta vez cada valor representará el peso del pescado (en gramos) después de la ingestión del fármaco experimental. En otras palabras, el primer medicamento conduce a un aumento en el peso de los peces hasta 71 g, el segundo medicamento, hasta 70 g, y así sucesivamente. En esta situación, 300 es un valor atípico significativo, pero no debemos descartarlo; si asumimos que no hubo errores de medición, entonces ese valor atípico es un éxito significativo en el experimento. El medicamento, que aumentó el peso del pescado a 300 gramos, funciona mucho mejor que otros medicamentos; por tanto, 300 es el valor más importante del conjunto de datos.

Consejos

  • Cuando se encuentren valores atípicos, intente explicar su presencia antes de excluirlos del conjunto de datos. Pueden indicar errores de medición o anomalías de distribución.

Qué necesitas

  • Calculadora