Estimación de proteína en semolina de arroz, mediante aplicación de regresiones en el infrarrojo cercano.

El objetivo de este trabajo fue la comparación empírica de las técnicas de regresión por mínimos cuadrados parciales (MCP) y por componentes principales (RCP) en la predicción del porcentaje de proteína para la semolina de arroz. Las estimaciones se realizaron utilizando los valores de absorbancia e...

Descripción completa

Detalles Bibliográficos
Autor principal: Centeno-Mora, Oscar
Formato: Online
Idioma:spa
Publicado: Universidad de Costa Rica 2016
Acceso en línea:https://revistas.ucr.ac.cr/index.php/agromeso/article/view/21153
id AGROMESO21153
record_format ojs
institution Universidad de Costa Rica
collection Agronomía Mesoamericana
language spa
format Online
author Centeno-Mora, Oscar
spellingShingle Centeno-Mora, Oscar
Estimación de proteína en semolina de arroz, mediante aplicación de regresiones en el infrarrojo cercano.
author_facet Centeno-Mora, Oscar
author_sort Centeno-Mora, Oscar
description El objetivo de este trabajo fue la comparación empírica de las técnicas de regresión por mínimos cuadrados parciales (MCP) y por componentes principales (RCP) en la predicción del porcentaje de proteína para la semolina de arroz. Las estimaciones se realizaron utilizando los valores de absorbancia en la zona del infrarrojo cercano. Se obtuvieron 135 muestras de semolina de arroz recolectadas entre el 2004 y 2012, procedentes de diversas fábricas para la elaboración de alimentos para animales en Costa Rica. Se validó la convergencia de los resultados mediante técnicas de simulación de Bootstrap. Las observaciones se dividieron en dos grupos: un conjunto de datos para la estimación del mejor modelo de regresión (n=120), y un conjunto de datos de validación (n=15). Para el conjunto de datos de estimación, los modelos presentaron dificultades a nivel de los valores extremos, lo cual produjo la eliminación de un valor para obtener el mejor modelo en el caso del MCP. En la validación de los modelos de regresión, los estadísticos de bondad y de ajuste del error estándar de predicción de medias (EEPM), la raíz del error estándar de predicción de medias (REEPM), el error estándar de predicción (EEP), la razón de desviación de predicción (RDP) y gráficos de valores observados contra predichos, confirmaron mejores ajustes para la regresión por MCP (EEP=0,304) respecto al RPC (EEP=0,312). El método de simulación mostró una mejor convergencia en los resultados de la regresión por MCP para predecir el porcentaje de proteína en la semolina de arroz.
title Estimación de proteína en semolina de arroz, mediante aplicación de regresiones en el infrarrojo cercano.
title_short Estimación de proteína en semolina de arroz, mediante aplicación de regresiones en el infrarrojo cercano.
title_full Estimación de proteína en semolina de arroz, mediante aplicación de regresiones en el infrarrojo cercano.
title_fullStr Estimación de proteína en semolina de arroz, mediante aplicación de regresiones en el infrarrojo cercano.
title_full_unstemmed Estimación de proteína en semolina de arroz, mediante aplicación de regresiones en el infrarrojo cercano.
title_sort estimación de proteína en semolina de arroz, mediante aplicación de regresiones en el infrarrojo cercano.
title_alt Estimate of protein content in rice semolina by applying regressions in the near infrared region.
publisher Universidad de Costa Rica
publishDate 2016
url https://revistas.ucr.ac.cr/index.php/agromeso/article/view/21153
work_keys_str_mv AT centenomoraoscar estimateofproteincontentinricesemolinabyapplyingregressionsinthenearinfraredregion
AT centenomoraoscar estimaciondeproteinaensemolinadearrozmedianteaplicacionderegresionesenelinfrarrojocercano
_version_ 1807313635230351360
spelling AGROMESO211532023-06-16T13:49:00Z Estimate of protein content in rice semolina by applying regressions in the near infrared region. Estimación de proteína en semolina de arroz, mediante aplicación de regresiones en el infrarrojo cercano. Centeno-Mora, Oscar regresión por componentes principales mínimos cuadrados parciales espectroscopia del infrarrojo cercano Bootstrap. principal components regression partial least squares near infrared spectroscopy Bootstrap. The objective of this study was the empirically compare the partial least squares (PLS) regression model and the principal components regression (PCR) model to predict the protein percentage in rice semolina. The estimates were carried out using the absorbance values in the near infrared region. 135 samples of rice semolina were collected between 2004 and 2012 from several pet food plants in Costa Rica. The convergence of the results was validated through Bootstrapping techniques. The observations were split in two groups: one data set to estimate the best regression model (n=120) and a data set of validation (n=15). The models estimated in the data set showed difficulties with outliers, consequently an observation was removed to obtain the best PLS model. In the validation of the regression model, the goodness of fit referred to statistics of the mean standard error of prediction (MSEP), the root mean square error of prediction (RMSEP), the standard error of prediction (SEP), the ratio of performance to deviation (RPD), and the graphics of observed against predicted values confirmed better adjustments for the PLS regression (SEP=0.304) in comparison to the PCR model (SEP=0.312). The simulation method showed a better convergence in the results of the PLS regression technique, to predict the percentage of protein in rice semolina. El objetivo de este trabajo fue la comparación empírica de las técnicas de regresión por mínimos cuadrados parciales (MCP) y por componentes principales (RCP) en la predicción del porcentaje de proteína para la semolina de arroz. Las estimaciones se realizaron utilizando los valores de absorbancia en la zona del infrarrojo cercano. Se obtuvieron 135 muestras de semolina de arroz recolectadas entre el 2004 y 2012, procedentes de diversas fábricas para la elaboración de alimentos para animales en Costa Rica. Se validó la convergencia de los resultados mediante técnicas de simulación de Bootstrap. Las observaciones se dividieron en dos grupos: un conjunto de datos para la estimación del mejor modelo de regresión (n=120), y un conjunto de datos de validación (n=15). Para el conjunto de datos de estimación, los modelos presentaron dificultades a nivel de los valores extremos, lo cual produjo la eliminación de un valor para obtener el mejor modelo en el caso del MCP. En la validación de los modelos de regresión, los estadísticos de bondad y de ajuste del error estándar de predicción de medias (EEPM), la raíz del error estándar de predicción de medias (REEPM), el error estándar de predicción (EEP), la razón de desviación de predicción (RDP) y gráficos de valores observados contra predichos, confirmaron mejores ajustes para la regresión por MCP (EEP=0,304) respecto al RPC (EEP=0,312). El método de simulación mostró una mejor convergencia en los resultados de la regresión por MCP para predecir el porcentaje de proteína en la semolina de arroz. Universidad de Costa Rica 2016-06-20 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Article application/pdf text/html application/octet-stream https://revistas.ucr.ac.cr/index.php/agromeso/article/view/21153 10.15517/am.v27i2.21153 Agronomía Mesoamericana; 2016: Agronomía Mesoamericana: Vol. 27, Issue 2 (July-December); 367-376 Agronomía Mesoamericana; 2016: Agronomía Mesoamericana: Vol. 27, Nº 2 (Julio-diciembre); 367-376 Agronomía Mesoamericana; 2016: Agronomía Mesoamericana: Vol. 27, Issue 2 (July-December); 367-376 2215-3608 1021-7444 spa https://revistas.ucr.ac.cr/index.php/agromeso/article/view/21153/25359 https://revistas.ucr.ac.cr/index.php/agromeso/article/view/21153/25360 https://revistas.ucr.ac.cr/index.php/agromeso/article/view/21153/27471