
handle: 2238/8810
<p class="p1">Hoy en día se recogen datos de muy diversa índole y a un bajo costo, como no se había visto antes en la historia de la humanidad; por ejemplo, sensores que registran datos a cada minuto, páginas <em>web </em>que almacenan todas las acciones que realiza el usuario, supermercados que guardan todo lo que sus clientes compran y en qué momento lo hacen. Pero estas grandes bases de datos presentan un gran reto a sus propietarios ¿Cómo sacarles provecho?, ¿cómo convertir datos en información para la toma de decisiones? </p><p class="p1">Este artículo presenta una estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados utilizando conjuntos aproximados y/o ganancia de información. Se propone una estrategia para agrupar los datos utilizando <em>k-means</em>, considerando cuánta información aporta un atributo (ganancia de información), además de poder seleccionar cuáles atributos son realmente indispensables para clasificar nuevos datos y cuáles son dispensables (conjuntos aproximados), lo cual es muy beneficioso pues permite tomar decisiones en menor tiempo. </p>
Technology, reducción de atributos, Information Gain, Entropy, T, Aprendizaje de máquina; minería de datos; conjuntos aproximados; entropía; ganancia de información; reducción de atributos, entropía, minería de datos, Machine Learning; Data Mining; Rough Sets; Entropy; Information Gain; Feature Reduction, Machine Learning, Data Mining, Aprendizaje de máquina, Feature Reduction, Rough Sets, conjuntos aproximados, ganancia de información
Technology, reducción de atributos, Information Gain, Entropy, T, Aprendizaje de máquina; minería de datos; conjuntos aproximados; entropía; ganancia de información; reducción de atributos, entropía, minería de datos, Machine Learning; Data Mining; Rough Sets; Entropy; Information Gain; Feature Reduction, Machine Learning, Data Mining, Aprendizaje de máquina, Feature Reduction, Rough Sets, conjuntos aproximados, ganancia de información
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
