Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ LAReferencia - Red F...arrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
addClaim

Comparación de particiones en aprendizaje automático no supervisado

Authors: González, Meliza;

Comparación de particiones en aprendizaje automático no supervisado

Abstract

En esta tesis se presenta un estudio sobre índices de comparación de particiones de un mismo conjunto de datos, utilizados para la evaluación externa de los resultados de métodos de clasificación no supervisada. Se elabora un estado del arte en cuanto a los índices existentes y sus propiedades y se calculan algunos de los más conocidos sobre datos simulados a modo de ejemplo. Este trabajo se centra en el índice Mínimo Error de Clasificación (MCE, por su sigla en inglés), medida basada en la tabla de contingencia de dos particiones. Se estudia y profundiza sobre sus propiedades y en especial su distribución. Se establece la expresión analítica de la función de distribución teórica para el caso de la comparación de dos particiones independientes, con dos clases balanceadas. Algunas propiedades demostradas pudieron extenderse para el caso de tres clases y para el caso general. También se estudian las propiedades de la distribución empírica sobre datos simulados, variando algunos parámetros experimentales, y mostramos una aplicación sobre un conjunto de datos supervisados reales de imágenes de dígitos escritos a manos, conocido como MNIST. En este último caso, planteamos el problema de clasificación no supervisada y la validación externa de los resultados basada en nuestro índice se realiza comparándolos con la verdadera etiqueta de los datos. Los resultados del MCE se comparan con otros índices de validación externa mediante correlaciones y en distintos escenarios. Finalmente, a partir de la distribución del índice, se diseña un test de hipótesis que permite contrastar si dos particiones son independientes. El desempeño de la prueba se evalúa calculando los errores de tipo I y II obtenidos con datos simulados artificialmente.

Keywords

Comparación de particiones, Error de clasificación, Aprendizaje no supervisado, Índices de valoración externa, Análisis de cluster

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    0
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Average
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
0
Average
Average
Average
Green