Aplicación de rutinas en lenguaje R para análisis de componentes principales

Cuando se diposne de una gran cantidad de observaciones para cada individuo, los análisis univariados tienen la limitación de no contemplar las interrelaciones entre todas las variables, ni cómo esas interrelaciones afectan  al conjunto de individuos. Como alternativa fueron desarrolladas las técnic...

Descripción completa

Detalles Bibliográficos
Autores principales: López-Bautista, Ezequiel A., Gónzalez-Ramírez, Byron H.
Formato: Online
Idioma:spa
Publicado: Universidad de San Carlos de Guatemala 2017
Acceso en línea:https://revistas.usac.edu.gt/index.php/cytes/article/view/521
Descripción
Sumario:Cuando se diposne de una gran cantidad de observaciones para cada individuo, los análisis univariados tienen la limitación de no contemplar las interrelaciones entre todas las variables, ni cómo esas interrelaciones afectan  al conjunto de individuos. Como alternativa fueron desarrolladas las técnicas multivariadas, que brindan descripciones de estas interrelaciones, tomando las variables en su conjunto. El análisis de componentes principales (ACP) es la esencia del análisis estadístico multivariado y tiene como objetivo reducir el número de variables, a través de la generación de nuevas variables, que son combinaciones lineales de las variables originales. El objetivo de este trabajo es presentar una serie de rutinas computacionales en el lenguaje R v. 3.10 para el ACP. Este lenguaje es de uso mundial, por ser libre, flexible y con soporte de estadísticos de reconocido prestigio. Para ilustrar su aplicación, se tomó una base de datos referente a los precios de cinco tipos de alimentos (en centavos de dólar): pan, hamburguesa, leche, naranjas y tomates en 23 ciudades de los Estados Unidos. Los datos fueron analizados exploratoriamente seguido del análisis de correlación entre pares de variables. Utilizando la función PRINCOMP y el paquete RCOMMANDER se realizó el ACP y la construcción del biplot. Además fueron utilizadas las bibliotecas: Hmisc, Plotrix, Ellipse, Corrplot, Ggplot2, Devtools y Vqv/ggbiplot. Los resultados fueron comparados con los obtenidos en otros programas, no encontrando diferencias. Se concluye que el lenguaje R es una herramienta poderosa, debiendo divulgar su uso en la docencia de la estadística a nivel universitario.