Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas
Se presentan dos metodologías para el rellenado de datos ausentes, enfocadas hacia su uso en series de tiempo geofísicas. La primera se basa en la descomposición en componentes principales de la matriz de correlación de datos de una misma variable entre estaciones cercanas y en periodos de tiempo...
Autores principales: | , |
---|---|
Formato: | Online |
Idioma: | spa |
Publicado: |
Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA)
2009
|
Acceso en línea: | https://revistas.ucr.ac.cr/index.php/matematica/article/view/1419 |
id |
RMTA1419 |
---|---|
record_format |
ojs |
institution |
Universidad de Costa Rica |
collection |
Revista de Matemática: Teoría y Aplicaciones |
language |
spa |
format |
Online |
author |
Alfaro, Eric J. Soley, F. Javier |
spellingShingle |
Alfaro, Eric J. Soley, F. Javier Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas |
author_facet |
Alfaro, Eric J. Soley, F. Javier |
author_sort |
Alfaro, Eric J. |
description |
Se presentan dos metodologías para el rellenado de datos ausentes, enfocadas hacia su uso en series de tiempo geofísicas. La primera se basa en la descomposición en componentes principales de la matriz de correlación de datos de una misma variable entre estaciones cercanas y en periodos de tiempo comunes. Este método multivariable permite incorporar en los valores rellenados los fenómenos de mayor escala a partir de la información de las estaciones cercanas. El segundo método es para ser utilizado cuando no hay estaciones cercanas y el rellenado se debe hacer con la información de la misma estación. Consiste en ajustar un modelo autoregresivo a la serie de tiempo y utilizar ese modelo como estimador de los datos ausentes. Se evaluaron dos algoritmos para calcular los coeficientes autoregresivos: el estimador de Burg y el propuesto por Ulrych y Clayton. El primero es apropiado para procesos estocásticos y el segundo para series determinísticas. Las dos metodologías descritos en este trabajo son recursivas: se hace una primera estimación a los datos ausentes corriendo el algoritmo ignorando los datos ausentes si es posible ó aproximándolos de forma grosera. El algoritmo se continúa ejecutando con los nuevos valores sustituyendo los valores estimados en la corrida anterior. La ejecución termina cuando la diferencia máxima de los valores estimados entre dos corridas sucesivas es menor que un valor fijado de antemano por el usuario. Los datos rellenados conservan la media y la desviación estándar original de la serie de tiempo. Estos algoritmos se adaptaron y modificaron, por medio del uso de Interfaces Gráficas con el usuario, para su uso en SCILAB, que es una plataforma similar a MATLAB pero de fuente abierta y que corre indistintamente en Windows y Linux. Ellos fueron elaborados como una actividad de extensión de la Universidad de Costa Rica. |
title |
Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas |
title_short |
Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas |
title_full |
Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas |
title_fullStr |
Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas |
title_full_unstemmed |
Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas |
title_sort |
descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas |
title_alt |
Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas |
publisher |
Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) |
publishDate |
2009 |
url |
https://revistas.ucr.ac.cr/index.php/matematica/article/view/1419 |
work_keys_str_mv |
AT alfaroericj descripciondedosmetodosderellenadodedatosausentesenseriesdetiempometeorologicas AT soleyfjavier descripciondedosmetodosderellenadodedatosausentesenseriesdetiempometeorologicas |
_version_ |
1811744080022994944 |
spelling |
RMTA14192022-01-24T18:43:17Z Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas Alfaro, Eric J. Soley, F. Javier missing data quality control autoregressive filters principal component analysis free software applications datos faltantes control de calidad filtros auto regresivos análisis de componentes principales aplicaciones de software libre Two methods for filling missing data gaps in geophysical time series are presented. The first one is based on the principal component decomposition of the correlation matrix built for close spatial stations with common time series records of the same variable. This multivariate method allows the incorporation in the estimated values of large scale features based on the information shared by the stations. The second method could be used when there are no close station and the missing data must be calculated from the same station historical information. This method adjusts an auto-regressive model to the time series which is then used to estimate the missing data. Two algorithms were used to calculate the auto-regressive coefficients: the Burg estimator and the one proposed by Ulrych and Clayton. The first one is appropriate for stochastic processes and the second for deterministic series. The two methodologies described in this work are recursive: a first estimation of the missing data is done running the algorithms but ignoring or using a crude approximation of them. Then, the algorithm runs again with the new estimated data, replacing the previous run missing data estimations. The run stops when the maximum difference between two successive estimations is smaller than the value fixed by the user. Filled data conserves the mean and standard deviation of the original time series. These algorithms have been adapted and modified for its use in SCILAB using also Graphic User Interfaces. Scilab is an open source platform, similar to MATLAB, and runs indistinctively in Windows and Linux. They were elaborated as an extension activity of the University of Costa Rica. Se presentan dos metodologías para el rellenado de datos ausentes, enfocadas hacia su uso en series de tiempo geofísicas. La primera se basa en la descomposición en componentes principales de la matriz de correlación de datos de una misma variable entre estaciones cercanas y en periodos de tiempo comunes. Este método multivariable permite incorporar en los valores rellenados los fenómenos de mayor escala a partir de la información de las estaciones cercanas. El segundo método es para ser utilizado cuando no hay estaciones cercanas y el rellenado se debe hacer con la información de la misma estación. Consiste en ajustar un modelo autoregresivo a la serie de tiempo y utilizar ese modelo como estimador de los datos ausentes. Se evaluaron dos algoritmos para calcular los coeficientes autoregresivos: el estimador de Burg y el propuesto por Ulrych y Clayton. El primero es apropiado para procesos estocásticos y el segundo para series determinísticas. Las dos metodologías descritos en este trabajo son recursivas: se hace una primera estimación a los datos ausentes corriendo el algoritmo ignorando los datos ausentes si es posible ó aproximándolos de forma grosera. El algoritmo se continúa ejecutando con los nuevos valores sustituyendo los valores estimados en la corrida anterior. La ejecución termina cuando la diferencia máxima de los valores estimados entre dos corridas sucesivas es menor que un valor fijado de antemano por el usuario. Los datos rellenados conservan la media y la desviación estándar original de la serie de tiempo. Estos algoritmos se adaptaron y modificaron, por medio del uso de Interfaces Gráficas con el usuario, para su uso en SCILAB, que es una plataforma similar a MATLAB pero de fuente abierta y que corre indistintamente en Windows y Linux. Ellos fueron elaborados como una actividad de extensión de la Universidad de Costa Rica. Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) 2009-02-27 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Article application/pdf https://revistas.ucr.ac.cr/index.php/matematica/article/view/1419 10.15517/rmta.v16i1.1419 Revista de Matemática: Teoría y Aplicaciones; Vol. 16 No. 1 (2009): Revista de Matemática: Teoría y Aplicaciones; 60-75 Revista de Matemática: Teoría y Aplicaciones; Vol. 16 Núm. 1 (2009): Revista de Matemática: Teoría y Aplicaciones; 60-75 Revista de Matemática; Vol. 16 N.º 1 (2009): Revista de Matemática: Teoría y Aplicaciones; 60-75 2215-3373 1409-2433 spa https://revistas.ucr.ac.cr/index.php/matematica/article/view/1419/1440 Derechos de autor 2009 Revista de Matemática: Teoría y Aplicaciones |