Modeling of air temperatures: preprocessing and trends, reduced stationary process, extremes, simulation

  • Didier Dacunha-Castelle
  • Thi Thu Huong Hoang
  • Sylvie Parey

Résumé

Our first goal is to give a complete methodology to get a simulation model valid for a very large number of air temperature series. Existing simulators have quite good properties for the bulk of the distribution but they are unable to reproduce extreme values as well as cold or hot waves. Thus we focus on this aspect in order to cover both the bulk of the data and extreme values. First we give some new results on preprocessing (the phase during which trends and seasonalities are removed). In this context, the choice of non parametric trends requires some new results on cross validation. Once additive (mean) and multiplicative (variance) trends and seasonality are suppressed, we test the cyclo-stationarity of the reduced series. In almost all cases, there does not remain any trend even for extremes values. To model the observations, we start from non parametric estimates of the expectation and variance from a day conditional to the previous one and from studies of correlations. The best class of model seems the seasonal FARCH class. Then for mathematical improvements supported by physical ones, FARCH process is interpreted as the Euler scheme of continuous-time diffusions and thus as misspecified models and modified by adaptive truncation of innovations using new results of extreme theory on diffusions. These results are plugged in the likelihood of FARCH processes to get a convenient estimation. We detail some results of the application to about 200 stations from Eurasia and United States, including the validation procedures for the model. The comparison to some existing models is also considered. Notre but premier est de donner une méthodologie complète pour construire un simulateur valide pour un très grand nombre de séries de température de l’air. Les simulateurs existants ont un comportement plutôt bon pour le cœur de la distribution mais sont incapables de reproduire les valeurs extrêmes comme les vagues de chaud ou de froid. Nous nous focalisons particulièrement sur cet aspect de qualité tant pour les valeurs ordinaires que pour les valeurs plus extrêmes Nous donnons d’abord des résultats nouveaux sur le prétraitement des séries visant à extraire les saisonnalités et les tendances. Nous obtenons alors un processus réduit cyclostationnaire, la plupart du temps sans tendances résiduelles même pour les extrêmes. Pour bâtir le modèle, nous partons d’une étude non paramétrique des espérances conditionnelles et des variances conditionnelles d’un jour sur les jours précédents. Nous construisions alors un modèle FARCH cyclostationnaire sur l’année. Pour améliorer l’estimation, à partir de considérations physiques faites en temps petit, nous interprétons la chaine FARCH comme le schéma d’Euler d’une diffusion cyclostationnaire. Pour cette diffusion nous obtenons des résultats nouveaux liant le coefficient de diffusion et les paramètres d’extrêmes. Par plug-in dans la vraisemblance du modèle FARCH nous obtenons une bonne estimation de ce coefficient de diffusion. Le plug-in est justifié par l'ergodicité géométrique du FARCH vu comme une chaîne de Markov squelette de la diffusion (bien que le coefficient de diffusion ne soit pas lipchitzien au voisinage des frontières). Nous illustrons les résultats sur 200 stations en Eurasie et aux USA.
Publiée
2015-04-01
Rubrique
Numéro spécial : Génération aléatoire de conditions météorologiques