real time web analytics

Scipy Chi-Cuadrado

Python es un conocido lenguaje de programación de alto rendimiento que permite diversas funciones y operaciones de ingeniería, técnicas, orientadas a objetos y matemáticas. Python proporciona numerosas bibliotecas para sus usuarios y uno de los lenguajes de programación de código abierto más reconocidos es “Scipy”. La biblioteca de Scipy contiene información y aplica sus operaciones a diferentes métodos de aprendizaje automático, por ejemplo, algoritmos de aprendizaje automático y los optimizadores que usamos en sistemas de inteligencia artificial. Usamos un módulo chi-cuadrado de la biblioteca Scipy para sacar las diversas pruebas para los datos categóricos.

Procedimiento

En el artículo, usaremos la función chi-cuadrado de la biblioteca scipy y realizaremos varias pruebas para los datos. La información sobre el uso de esta función en el script de python también se discutirá y aplicará a varios ejemplos en este artículo.

Sintaxis

Dado que realizaremos las dos pruebas para verificar la relación entre las variables utilizando el método chi-cuadrado, analizaremos las dos sintaxis diferentes para esta función.

Prueba chi cuadrado -> $ chicuadrado(f_obs, ddof=1, f_exp=Ninguno, eje=1)

Prueba de independencia de chi cuadrado -> $ chi2_contingency(observado, lambda_= Ninguno corrección=Falso)

Valor de retorno

Esta función devuelve el valor p y el valor estadístico de prueba de chi cuadrado en su salida.

Ejemplo # 01

Realizaremos la primera prueba usando el chi cuadrado que hemos discutido en la sintaxis como la prueba chi_square. Esta prueba nos habla de la relación entre las variables categóricas. Esta función utiliza el módulo de atributos “stats” de scipy. Las estadísticas calculan la prueba donde tenemos que asumir una hipótesis nula y el chi cuadrado prueba esta hipótesis nula ya sea que los datos contengan o no las frecuencias especificadas. Toma las frecuencias observadas y esperadas como sus parámetros y si estas dos frecuencias son menores o no al menos “cinco”, entonces la prueba se considera inválida.

Ejecutaremos la misma prueba en el ejemplo, el compilador que usaremos para implementar el ejemplo es “Google Collab”, que sirve como un compilador de código abierto. Ejecuta el programa sin ninguna instalación de los paquetes de la biblioteca, ya que ya tiene los paquetes instalados. Después de abrir el compilador, simplemente cree un proyecto con un nombre único y luego avance al siguiente paso donde importaremos los paquetes de la biblioteca para ejecutar la prueba de chi cuadrado.

La prueba de chi cuadrado se proporciona en el módulo de estadísticas de scipy de python, por lo que importaremos las “estadísticas” de scipy a nuestro proyecto. Una vez que hayamos importado esta biblioteca, definiremos una matriz que tenga los elementos como las frecuencias al menos mayores o iguales a cinco. Entonces, vamos a definir el arreglo con el nombre “arreglo” con las frecuencias observadas como “ [ 3, 4, 6, 8, 10, 2] “. Después de crear con éxito esta matriz, llamaremos a la función chi cuadrado con el prefijo “stats” como “stats. chicuadrado ()”. Al argumento de entrada de esta función, le pasaremos la matriz que es f_obs (frecuencia observada) el parámetro de la función chi cuadrado.

Después de ejecutar el código mencionado en el fragmento a continuación, obtendremos el resultado como la estadística chi cuadrada y el valor p. Esta prueba de chi cuadrado será válida ya que hemos definido al menos cinco frecuencias observadas en el parámetro de esta función.

de espía importar estadísticas
formación= [3,4,8,10,12]
estadísticaschi cuadrado(formación)

Ejemplo # 02

La función chi cuadrado tiene otra prueba para las variables categóricas con el nombre de “prueba chi_cuadrado para la Independencia”. Ahora, esta prueba es ligeramente diferente de la prueba de chi-cuadrado que hemos discutido en el ejemplo anterior, ya que esta prueba verifica si existe alguna relación significativa entre las dos variables de la clase categórica. Para esta prueba, chi_square utiliza la función del módulo de estadísticas “contingencia chisquare” de scipy de Python. La prueba se lleva a cabo para mostrar si las variables son independientes entre sí o no. Para trabajar con esta función, creemos otra matriz nueva. Para crear y definir esta nueva matriz, tendremos que importar el numpy con el nombre “np” para que podamos llamar al “np” en el código más adelante en lugar del numpy.

Otro paquete de biblioteca importante que debe importarse para el correcto funcionamiento de la prueba de contingencia de chi cuadrado son las “estadísticas”. Importaremos el módulo de estadísticas de la biblioteca scipy del lenguaje python. Con la importación exitosa de las bibliotecas requeridas para el proyecto o la prueba de independencia de chi cuadrado, en el siguiente paso, definiremos una matriz con el nombre “obs_array”. Usaremos “np. array ()” para crear esta matriz y las dimensiones de la matriz se establecerán en 2 dimensiones y los elementos que contendrá esta matriz serán como “([2, 2, 2],[8, 8, 8])”. Esta matriz se utilizará como la observación, que es el parámetro de entrada para la función de contingencia () chi_2.

Para llamar a la prueba de contingencia para la independencia de las dos variables pertenecientes a las clases categóricas, usaremos el prefijo stats y llamaremos a la función chi_2contingency como “stats.chi2_contingency(obs_array)”. Ejecutaremos el siguiente código que se muestra en la figura para obtener los resultados de la prueba de independencia de la función de contingencia chi cuadrado.

importar entumecido como notario público
de espía importar estadísticas
matriz_obs= notario público.formación([[2, 2, 2],[8, 8, 8]])
estadísticaschi2_contingencia(matriz_obs)

Esta función devuelve el valor estadístico de la prueba de chi cuadrado, el valor p de la prueba y los valores de aquellas frecuencias que son las esperadas para las observaciones que pasamos en los parámetros de la función. La salida de la función se muestra en la siguiente figura.

Conclusión

El artículo brinda información detallada sobre el método chi cuadrado que utiliza el módulo “stats” de la biblioteca scipy. Hemos realizado dos tipos de pruebas para los métodos de chi cuadrado implementando los dos ejemplos diferentes en el script de python y hemos mostrado cómo se ve la salida o los valores devueltos de esta función y qué significan en el contexto de scipy chi cuadrado ( ) método.

Leave a Comment