Cómo Rechazar Los valores atípicos en los datos

January 29

Los datos recogidos durante los experimentos, encuestas y otros procedimientos de recogida de información suele ser objeto de una cierta cantidad de aleatoriedad. En algunos casos, las mediciones o las respuestas individuales pueden parecer muy lejos el resultado esperado; estos son valores atípicos. Cuando se encuentra con un valor atípico, usted debe comprobar para determinar si debe rechazarla por completo.

instrucciones

1 Inspeccionar el valor extremo para asegurarse de que encaja cualitativamente con el resto de los datos. Por ejemplo, si le preguntas a 20 personas para medir la anchura de una moneda de diez centavos, pero uno de ellos realmente mide la anchura de una cuarta parte, es posible que tenga un valor atípico en los datos. Usted debe rechazar este valor atípico, ya que no se ajusta cualitativamente con el experimento.

2 Use prueba Q de Dixon si no rechaza el valor atípico basado en el criterio en el paso 1. La prueba Q es una medida cuantitativa en las estadísticas de la importancia de un valor particular en relación con un conjunto de datos.

3 Determinar el nivel de confianza para la prueba Q. Si usted quiere estar seguro de que el 90 por ciento del valor atípico debe o no debe ser rechazada, elegir un nivel de confianza del 90 por ciento.

4 Encontrar el valor Q crítico (Qcrit) usando una tabla. Usted necesita saber el número de valores en el conjunto de datos (por ejemplo, N) y el nivel de confianza que se elige en el paso 3.

5 Para organizar el conjunto de datos en orden ascendente. Por lo tanto, para cada valor en el conjunto, X (i), organizar los datos de manera que X (1) <X (2) <... <X (N - 1) <X (N).

6 Calcular el valor de Q experimental (Qexp) del valor atípico. Para los valores atípicos individuales, el resultado aislado es o bien X (1) o X (N) en la disposición de los datos de la Etapa 5. Los respectivos valores de Q para estos dos casos son [X (2) - X (1)] / [X (N ) - X (1)] y [X (N) - X (N - 1)] / [X (N) - X (1)].

7 Comparar el valor Q experimental del paso 6 al valor crítico Q desde el paso 4. Si Qexp es mayor que Qcrit, entonces debería rechazar el valor atípico. Si es menor de Qexp Qcrit, a continuación, usted debe tener el valor atípico en los datos. Su aceptación o rechazo del valor extremo tiene un nivel de confianza de acuerdo con lo que usted eligió en el paso 3 (por ejemplo, que son el 90 por ciento seguro de que debe rechazar el valor atípico).

Consejos y advertencias

  • los niveles de confianza más altos conducen a valores de Q alta crítica. Como resultado, si quieres estar más seguro de que se debe rechazar un valor atípico en particular, que debe ser más atípico, obviamente, fuera de lugar con respecto al resto de los datos.
  • Q-test de Dixon funciona mejor para los pequeños tamaños de muestra. Muestras de mayor tamaño pueden requerir otras pruebas estadísticas.
  • Si usted tiene múltiples valores atípicos, se debe utilizar una prueba estadística diferente que el Q-test.