
handle: 1822/92802
A análise de grandes conjuntos de dados categóricos é um problema recorrente nas ciências sociais, comportamentais e biológicas. Surge por isso a necessidade de diminuir estes dados conseguindo, contudo, que as perdas de informação sejam mínimas. Tendo por base este problema, emergiu o tema desta dissertação, cujo objetivo passa pela análise exploratória do software R em busca de ferramentas para trabalhar com a análise de componentes principais categórica (ACPCAT), que surge como alternativa à tradicional análise de componentes principais (ACP), e permite reduzir a dimensionalidade de variáveis medidas em escalas diferentes. De forma a compreender os princípios fundamentais deste método estatístico, foi feita uma busca de fontes bibliográficas, que permitiu, adicionalmente, destacar o pacote Gifi e pacote Homals como sendo os únicos que possuem funções que permitem aplicar a ACPCAT. Estes pacotes foram explorados utilizando o mesmo dataset de exemplo, sendo feita uma descrição detalhada dos seus argumentos e dos valores e gráficos obtidos como forma de comparação das suas funcionalidades e recursos. O pacote Gifi descende do pacote Homals como sendo uma versão mais fácil de manipular e mais flexível devido a uma diferença na formulação da sua função de perda e ao facto deste utilizar B-splines. De modo a explorar as funcionalidades e limitações da função princals() do pacote Gifi e para estabelecer de que forma dados biológicos podem ser trabalhados, foi também executada a análise de um conjunto de dados sensoriais recolhidos de provas de vinhos. Com o intuito de permitir ao utilizador executar uma ACPCAT de forma simplificada e intuitiva foi criada uma aplicação web, que está disponível no endereço https://andreiagomes.shinyapps.io/Gify/ e pode ser acessada livremente de qualquer dispositivo desde que este tenha acesso à internet. A aplicação, de nome Gify, tem por base a função princals() do pacote Gifi e permite ao utilizador, mesmo que este não tenha nenhum tipo de conhecimento sobre o software R, carregar o seu conjunto de dados, definir os seus parâmetros de análise, executar a ACPCAT e consultar os resultados, sendo tudo isto processado recorrendo a botões de seleção e espaços de preenchimento.
Variáveis categóricas, ACP, PCA, ACPCAT, Shiny, CATPCA, R, Categorical variables
Variáveis categóricas, ACP, PCA, ACPCAT, Shiny, CATPCA, R, Categorical variables
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
