Um estudo sobre reconhecimento de padrões: um aprendizado supervisionado com classificador bayesiano

Master thesis Portuguese OPEN
Pedro Henrique Ramos Cerqueira (2011)
  • Publisher: Universidade de São Paulo
  • Subject: Aprendizagem | Classication | Classificação | Estatística computacional | Inferência bayesiana | Learning | Marcador molecular | Mineração de dados | Molecular marker | Pattern Recognition | Probabilidade | Reconhecimento de padrões | Softwares. | Statistical nnnnadaaaaacomputing. | Estatística e Experimentação Agronômica

A facilidade que temos para reconhecer um rosto, compreender palavras faladas, ler manuscritos, identicar chaves do carro no bolso e decidir se uma maçã está madura pelo seu cheiro, desmentem os processos complexos que estão por trás desses atos de reconhecer estes padrões. Estes reconhecimentos têm sido cruciais para a nossa sobrevivência, e ao longo das últimas dezenas de milhões de anos desenvolvemos sistemas sosticados para a realização dessas tarefas. O reconhecimento de padrões tem por objetivo realizar a classicação de determinado conjunto de dados em determinadas classes ou grupos, considerando os seus padrões e os das classes, permitindo diversas aplicações, como por exemplo: processamento de documentos, leitores de código de barra; identicação de pessoas, leitores óticos ou de impressão digital; automação industrial, processamento de imagens e aplicações agronômicas, análise de marcadores moleculares e classicação de plantas, tornando-se nos últimos anos, uma técnica de grande importância. Para uma melhor classicação é necessário realizar aprendizados, que podem ser elaborados pelo método supervisionado ou não supervisionado, a m de desenvolver os classicadores, tais como o classicador bayesiano e as redes neurais, que permitem a tomada de decisões. Para vericar a qualidade das classicações devem ser utilizadas medições especícas, como o índice kappa ou a probabilidade de erro geral. Deste modo é essencial a utilização de software para a tomada de decisões, entre eles o R e o WEKA, desenvolvido especicamente para resolução de problemas de reconhecimento de padrões. Com o intuito de solucionar os problemas especícos das áreas de automação e agronomia, foi utilizado o método de aprendizado supervisionado, com classicador bayesiano e para vericar a qualidade das classicações foram utilizados o índice de kappa e a probabilidade de erro geral por meio dos software R e WEKA, para as classicações foram utilizados dados de marcadores moleculares, dados de soja e tipos de embalagens de peças de automóvel. The facility we have to recognize a face, to understand spoken words, reading manuscripts, identifying car keys in our pocket and deciding whether an apple is ripe by its smell, belie the complex processes that are behind the act to recognize these patterns. These recognitions have been crucial to our survival, and over the past tens of millions of years sophisticated systems were developed to accomplish these tasks. The pattern recognition has aimed to carry out the rating of a given set of data in certain classes or groups, considering their standards and those of their classes, allowing several applications, such as: document processing, bar code readers, identication of people, optical and ngerprint drivers, industrial automation, image processing and agronomic applications, molecular markers analysis and plant\'s classication, which became a technique of great importance in recent years. For a better rating is necessary to perform some studies, which can be formulated by supervised and unsupervised methods, in order to develop classiers, such as the Bayesian classier and neural networks, which enable the decision-making. To check the quality of ratings, specic measurements must be used, such as the kappa index or the general error probability. Thus it is essential to use software to make a decision, including the R and WEKA, developed specically to solve pattern recognition problems. In order to solve problems of specic areas, as automation and agronomy, the supervised learning method with Bayesian classier was used, and to verify the ratings quality, the kappa index and the general error probability were used. Software R and WEKA were used, in order to perform ratings for molecular markers data, soybean data and types of packaging for auto parts.
Share - Bookmark