Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Universidade do Minh...arrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
addClaim

Análise de componentes principais para variáveis qualitativas: exploração em R

Authors: Gomes, Andreia Filipa Araújo;

Análise de componentes principais para variáveis qualitativas: exploração em R

Abstract

A análise de grandes conjuntos de dados categóricos é um problema recorrente nas ciências sociais, comportamentais e biológicas. Surge por isso a necessidade de diminuir estes dados conseguindo, contudo, que as perdas de informação sejam mínimas. Tendo por base este problema, emergiu o tema desta dissertação, cujo objetivo passa pela análise exploratória do software R em busca de ferramentas para trabalhar com a análise de componentes principais categórica (ACPCAT), que surge como alternativa à tradicional análise de componentes principais (ACP), e permite reduzir a dimensionalidade de variáveis medidas em escalas diferentes. De forma a compreender os princípios fundamentais deste método estatístico, foi feita uma busca de fontes bibliográficas, que permitiu, adicionalmente, destacar o pacote Gifi e pacote Homals como sendo os únicos que possuem funções que permitem aplicar a ACPCAT. Estes pacotes foram explorados utilizando o mesmo dataset de exemplo, sendo feita uma descrição detalhada dos seus argumentos e dos valores e gráficos obtidos como forma de comparação das suas funcionalidades e recursos. O pacote Gifi descende do pacote Homals como sendo uma versão mais fácil de manipular e mais flexível devido a uma diferença na formulação da sua função de perda e ao facto deste utilizar B-splines. De modo a explorar as funcionalidades e limitações da função princals() do pacote Gifi e para estabelecer de que forma dados biológicos podem ser trabalhados, foi também executada a análise de um conjunto de dados sensoriais recolhidos de provas de vinhos. Com o intuito de permitir ao utilizador executar uma ACPCAT de forma simplificada e intuitiva foi criada uma aplicação web, que está disponível no endereço https://andreiagomes.shinyapps.io/Gify/ e pode ser acessada livremente de qualquer dispositivo desde que este tenha acesso à internet. A aplicação, de nome Gify, tem por base a função princals() do pacote Gifi e permite ao utilizador, mesmo que este não tenha nenhum tipo de conhecimento sobre o software R, carregar o seu conjunto de dados, definir os seus parâmetros de análise, executar a ACPCAT e consultar os resultados, sendo tudo isto processado recorrendo a botões de seleção e espaços de preenchimento.

Country
Portugal
Related Organizations
Keywords

Variáveis categóricas, ACP, PCA, ACPCAT, Shiny, CATPCA, R, Categorical variables

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    0
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Average
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
0
Average
Average
Average
Green