Indice de gini formula
australia
Los árboles de decisión son algoritmos de aprendizaje automático supervisado que se adaptan mejor a los problemas de clasificación y regresión. Estos algoritmos se construyen aplicando las condiciones particulares de división en cada nodo, dividiendo los datos de entrenamiento en subconjuntos de variables de salida de la misma clase.
El «conocimiento» aprendido por un árbol de decisión a través del entrenamiento se formula directamente en una estructura jerárquica. Esta estructura mantiene y muestra el conocimiento de tal manera que puede ser fácilmente entendido, incluso por personas no expertas». (De)
Sin embargo, no es posible conseguir subconjuntos puros y homogéneos, por lo que al construir un árbol de decisión, cada nodo se centra en la identificación de un atributo y una condición de división en ese atributo que disminuye la mezcla de etiquetas de clase, dando así subconjuntos relativamente puros.
Se calcula entre 0 y 1, sin embargo, dependiendo en gran medida del número de grupos o clases presentes en el conjunto de datos, puede ser más de 1, pero representando el mismo significado, es decir, un nivel extremo de desorden.
índice de gini por países
El índice de Gini, o coeficiente de Gini, es una medida de la distribución de la renta en una población desarrollada por el estadístico italiano Corrado Gini en 1912. Se utiliza a menudo como indicador de la desigualdad económica, midiendo la distribución de la renta o, menos comúnmente, la distribución de la riqueza entre una población. El coeficiente oscila entre 0 (o 0%) y 1 (o 100%), donde 0 representa la igualdad perfecta y 1 la desigualdad perfecta. Los valores superiores a 1 son teóricamente posibles debido a los ingresos o la riqueza negativos.
Un país en el que todos los residentes tienen los mismos ingresos tendría un coeficiente de Gini de ingresos de 0. Un país en el que un residente ganara todos los ingresos, mientras que todos los demás no ganaran nada, tendría un coeficiente de Gini de ingresos de 1.
El mismo análisis puede aplicarse a la distribución de la riqueza (el «coeficiente de Gini de la riqueza»), pero como la riqueza es más difícil de medir que la renta, los coeficientes de Gini suelen referirse a la renta y aparecen simplemente como «coeficiente de Gini» o «índice de Gini», sin especificar que se refieren a la renta. Los coeficientes de Gini de la riqueza suelen ser mucho más altos que los de la renta.
canadá
ResumenEl índice de Gini es bien conocido por ser una medida única de desigualdad. El propósito de este artículo es explorar una estructura matricial del índice de Gini en un entorno de ingresos de múltiples fuentes. Mediante el uso de matrices, analizamos la descomposición del índice de Gini por fuente de ingresos y derivamos una fórmula explícita para los factores en términos de los niveles percentiles asociados, basada en la presentación de datos agregados. Se demuestra que cada factor es la suma de las dos partes divididas de la renta dentro de un tramo percentil. Ambas tienen una contribución desigualadora e igualadora a la desigualdad total, respectivamente. Utilizamos un código R y aplicamos la metodología a varios conjuntos de datos, incluida una muestra de informes de ingresos agregados europeos en 2014 a modo de ilustración. Un subproducto de la descomposición de Gini proporciona un enfoque matricial para la descomposición de la curva de Lorenz asociada en términos de la matriz de distribución de la densidad y una matriz de Toeplitz.
Aquí la matriz de transposición \(\mathbf {X}^\mathbf {\intercal }\) puede interpretarse como la matriz de distribución de la renta, ya que su acción sobre el vector de los hogares produce un vector de los componentes de la renta total. Llamamos \(\mathbf {\eta }\) y \(\varvec{\Theta }\) al vector de distribución de la renta y al vector del índice de centralización de la renta, respectivamente. Las interpretaciones de sus componentes se darán en la Sec. 3, que se dedica principalmente a una discusión detallada sobre el resultado principal que apoya el teorema anterior mediante el siguiente lema clave.
estados unidos
El índice de Gini, o coeficiente de Gini, es una medida de la distribución de la renta en una población desarrollada por el estadístico italiano Corrado Gini en 1912. Se utiliza a menudo como indicador de la desigualdad económica, midiendo la distribución de la renta o, menos comúnmente, la distribución de la riqueza entre una población. El coeficiente oscila entre 0 (o 0%) y 1 (o 100%), donde 0 representa la igualdad perfecta y 1 la desigualdad perfecta. Los valores superiores a 1 son teóricamente posibles debido a los ingresos o la riqueza negativos.
Un país en el que todos los residentes tienen los mismos ingresos tendría un coeficiente de Gini de ingresos de 0. Un país en el que un residente ganara todos los ingresos, mientras que todos los demás no ganaran nada, tendría un coeficiente de Gini de ingresos de 1.
El mismo análisis puede aplicarse a la distribución de la riqueza (el «coeficiente de Gini de la riqueza»), pero como la riqueza es más difícil de medir que la renta, los coeficientes de Gini suelen referirse a la renta y aparecen simplemente como «coeficiente de Gini» o «índice de Gini», sin especificar que se refieren a la renta. Los coeficientes de Gini de la riqueza suelen ser mucho más altos que los de la renta.