
handle: 10486/688997
Con este trabajo de fin de grado pretendemos mostrar como implementar modelos generativos profundos utilizando técnicas de inferencia aproximada para realizar aprendizaje semi supervisado. Al tratarse de aprendizaje semi supervisado, solo contamos con un pequeño porcentaje de las etiquetas de los datos de entrenamiento. De esta forma, este tipo de modelos se convierten en una opción muy interesante en la práctica, al reducir en tiempo y recursos el proceso de etiquetado inicial de los datos de entrenamiento, ya que tan solo con un pequeño subconjunto de las etiquetas son capaces de obtener buenos resultados. Nuestro estudio se va a limitar a su aplicación sobre el conjunto de datos de dígitos escritos MNIST, es decir, para realizar clasificación de imágenes. Nuestra red hará uso de modelos probabilísticos para extraer una serie de atributos de la imagen original. De este modo, vamos a crear un codificador (’encoder’) que a partir del dato original, y sin necesidad de conocer la clase, “codificará” la imagen original en una representación de alto nivel y menor dimensionalidad. A su vez, esta representación puede decodificarse a través de un ’decoder’ para generar nuevas imágenes parecidas a la original. Además, en el proceso de aprendizaje de esos atributos ocultos, aprenderemos al mismo tiempo los parámetros del clasificador que llevará a cabo las tareas de discriminación entre las clases. Estos modelos obtienen resultados muy positivos en comparación a otras técnicas del estado del arte. Esta diferencia se torna más abrupta cuanto menor es el porcentaje de datos etiquetados, poniendo de manifiesto que la técnica planteada en este trabajo es una de las mejores opciones a la hora de abordar un problema de aprendizaje semi supervisado. Para el desarrollo de los modelos y las pruebas hemos utilizado Python 3 y el framework Tensorflow. Para comprobar su funcionamiento y rendimiento hemos realizado los experimentos sobre el conjunto de datos MNIST, en los que hemos ido variando el número de datos etiquetados. Todos los modelos basados en redes neuronales descritos en esta memoria han sido implementados desde cero usando los lenguajes y frameworks descritos.
Informática, aprendizaje profundo, Tensorflow, aprendizaje semi supervisado
Informática, aprendizaje profundo, Tensorflow, aprendizaje semi supervisado
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
