Agrupamiento Chi-Cuadrado

La prueba Chi-cuadrado es un método para determinar la "bondad de ajuste" de una distribución estimada; la prueba Chi-cuadrado es una alternativa a las pruebas Kolmogorov-Smirnov (K-S) y Anderson-Darling (A-D). Todas estas estadísticas se utilizan para analizar la calidad de un ajuste. Sin embargo, a diferencia de las pruebas K-S y A-D, la prueba de Chi-cuadrado depende de la clasificación de los datos, por lo que es fundamental una categorización adecuada.

Si no está seguro del número de intervalos para el conjunto de datos, elija 'Auto' para el 'Número de intervalos' y establezca el 'Arreglo de intervalos' en 'Probabilidades iguales'.

Configuración 'Agrupamiento Chi-Cuadrado'

Figura 1 - Ajustar distribuciones datos - Pestaña 'Agrupamiento Chi-cuadrado'

La pestaña 'Agrupamiento Chi-cuadrado' de la ventana 'Ajustar distribuciones a datos' (Figura 1, derecha) incluye las opciones de configuración para las pruebas Chi-cuadrado que se ejecutan durante el proceso de ajuste. La pestaña incluye dos secciones:

  • Arreglo de intervalos - Configura cómo se deben clasificar los datos, o categorizarlos.
  • Opciones de agrupamiento de intervalos iguales - Estas opciones sólo se activan si se selecciona 'Intervalos iguales' en la sección 'Arreglo de intervalos'.

Arreglo de intervalos

El Arreglo de intervalos determina cómo se clasificarán los valores de los datos para la prueba de Chi-cuadrado; los valores del conjunto de datos se pueden clasificar en las siguientes maneras:

  • Intervalos iguales - Especifica que los intervalos serán de igual longitud en todo el conjunto de datos; al seleccionar esta opción se activa la sección 'Opciones de agrupamiento de intervalos iguales'. Véase más abajo para más detalles.
  • Probabilidades iguales - Especifica que los grupos se harán en intervalos de igual probabilidad a través de la distribución ajustada. Normalmente, esto dará lugar a longitudes de intervalo desiguales en términos de valores reales, ya que @RISK se ajustará para que todos los intervalos tengan la misma probabilidad. En el caso de las distribuciones continuas, esto es relativamente sencillo; en el caso de las distribuciones discretas, @RISK sólo podrá hacer que los intervalos sean aproximadamente iguales.
  • Personalizado - Establece manualmente el valor inicial de cada intervalo; para más información, consulte la sección 'Intervalos personalizados'.

El 'Número de intervalos' tiene por defecto el valor 'Auto'; para introducir un valor diferente, haga doble clic en el campo y escriba el número de intervalos que deben utilizarse en la prueba.

Opciones de agrupamiento a intervalos iguales

Si se elige 'Intervalos iguales' para la disposición de los recipientes, esta sección se activa. Cualquiera (o todas) de las siguientes opciones pueden ser establecidas para configurar los contenedores de intervalos iguales:

  • Mínimo y máximo automáticos basados en datos de entrada - Establezca los valores mínimos y máximos de los intervalos a los valores mínimos y máximos del conjunto de datos. Desmarque esta casilla para introducir valores mínimos y máximos diferentes; esto permite utilizar un rango específico para el agrupamiento sin tener en cuenta el mínimo y el máximo real del conjunto de datos.
    • Mínimo - Establezca un valor manual para el primer intervalo.
    • Máximo - Establezca un valor manual para el último intervalo.
  • Extender el primer intervalo del valor mínimo hasta -infinito - Especifica que el primer intervalo utilizado se extenderá desde menos infinito hasta el mínimo especificado. Todos los demás intervalos tendrán la misma longitud. En algunas situaciones, esto mejora el ajuste de conjuntos de datos con límites inferiores desconocidos.
  • Extender el último intervalo del valor máximo hasta +Infinito - Especifica que el último intervalo utilizado se extenderá desde el máximo especificado hasta más infinito. Todos los demás intervalos tendrán la misma longitud. En ciertas situaciones, esto mejora el ajuste de conjuntos de datos con límites superiores desconocidos.

Tanto si está marcada la opción 'Mínimo y máximo automáticos basados en datos de entrada' como si se fijan manualmente los valores mínimo y máximo, el primer y el último intervalo se seguirán configurando de acuerdo con las opciones establecidas para los ajustes 'Extender el primer intervalo del valor mínimo hasta -infinito' y 'Extender el último intervalo del valor máximo hasta +infinito'.

Intervalos personalizados

Figura 2 - Intervalos personalizados

En situaciones en las que los intervalos deben tener longitudes desiguales (es decir, cuando existen agrupaciones naturales), se pueden configurar intervalos personalizados (Figura 2, derecha). Al configurar el primer intervalo, introduzca el valor inicial de ese intervalo; para cada intervalo posterior, introduzca el valor final. A medida que se introducen los valores en los campos de los límites de los intervalos, la descripción de los intervalos se completará con la fórmula lógica de ese intervalo.

De forma similar a los grupos de igual tamaño, el primero y el último intervalo pueden configurarse para que se extiendan hasta menos y más infinito cuando se trabaja con un conjunto de datos con límites desconocidos. Por ejemplo, la figura 2 ilustra una configuración de intervalos en la que el primer intervalo se extiende desde "menos infinito hasta menos de 10", y el último intervalo se extiende desde "mayor o igual a 70 hasta más infinito".