vendredi 19 novembre 2010

Présentation du 10/12/2010 Théorie de l'apprentissage "à la Vapnik" pour des séries temporelles.

Lieu :
ENGREF
19 avenue du Maine
75732 PARIS
Métro : Montparnasse, Falguière

Salle : amphi 208


Théorie de l'apprentissage "à la Vapnik" pour des séries temporelles.

Présentation par Pierre Alquier (Université Paris 7)

Abstract
L'idée de la théorie de l'apprentissage statistique est d'éviter de formuler un modèle, paramétrique ou non, sur les données. On se donne plutôt une famille de prédicteurs, et on essaie de répondre aux deux questions suivantes: existe-t'il dans cette famille un prédicteur capable d'effectuer de bonnes prévisions? comment "apprendre" (ou estimer) ce prédicteur à partir de données, si possible avec des garanties théoriques et sans faire tendre le nombre d'observations vers l'infini (cadre non-asymptotique).

Cette approche a connu un franc succès dans le traitement de données iid. Tenter de l'étendre au cas des séries temporelles semble donc naturel, il y a plusieurs approches possibles. Dans cet exposé je vais tenter de présenter l'approche qui colle au plus près la version "iid" de la théorie. Pour cela, je me baserai sur 3 articles qui, bien que proposant des résultats différents, visent grosso modo ce même objectif:

1) Modha & Masry, Minimum Complexity Regression Estimation with Weakly Dependent Observations,
1996, IEEE Transactions on Information Theory.

2) Meir, Non-Parametric Time Series Prediction Through Adaptive Model Selection, 2000, Machine
Learning.

3) Alquier & Wintenberger, Model Selection for Weakly Dependent Time Series Forecasting, 2009,
soumis et disponible sur arXiv.

Contrairement au cas iid, des hypothèses techniques sur les données sont nécessaires. On discutera les hypothèses dans ces 3 articles. J'essaierai également de discuter les liens et les différences avec d'autres approches pour la prédiction qui seront présentées plus tard dans ce séminaire (comme l'approche "prédiction de suites individuelles").

jeudi 4 novembre 2010

Présentation du 19/11/10 prévision consommation électrique

Date : 19/11/10 de 12h30 à 14h00

Lieu :
ENGREF
19 avenue du Maine
75732 PARIS
Métro : Montparnasse, Falguière

Salle : amphi 208
Présentation par Yannig Goude (EDF R&D)

Titre : Short-term electricity load forecasting with Adaptive Generalized Additive Model

Abstract
Modeling and forecasting the electricity load at short-term and middle-term horizons is a key activity for electrical companies. The need to maintain the equilibrium between the electricity supply and demand at any time is essential to avoid power systems injuries and blackouts that generate financial penalties or more important drawbacks. The French electrical load company Electricity De France (EDF) has always attached the utmost importance to that issue which stands for a central point in power system scheduling.
The advent of the wholesale electricity market in Europe and in France has brought renewed focus on load forecasting methods as the EDF demand which has been equal to the France is now submitted to customers departures or arrivals. In addition, the emergence of new consumption habits mainly due to new technologies (computers, heat pumps, flat panel displays…) entails slow modifications of the load curves.
Historical EDF models are based on parametric non-linear regression and classical time series modeling (ARIMA models) that needs a large amount of a-priori information from experts. We present a new model based on GAM methods, implemented in R thanks to the mgcv package developed by Simon Wood. This nonparametric model allows us to take into account exogenous predictors like temperature and cloud cover, as well as calendar effects (thanks to cyclic spline projection) or the lag effects of the load itself. We apply it on a part of the EDF portfolio (big customers) and show that this model can face with various situations, needs fewer a-priori information than a parametric model. To deal with the problem of non-stationnarity we propose an online update of this model, based on online recalculation of the coefficients of the projection on the spline basis. We obtain significant improvement of the forecasts, especially when parametric modeling fails.

Télécharger la présentation

Présentation du 8/10/10 conjoncture économique

Présentation par Matthieu Cornec (INSEE, CREST) :
- Résumé l'univers de la conjoncture, en soulignant les contraintes de calendrier et les critères de validation.
- Présentation d'un travail récent "Constructing a conditional GDP fan chart with an application to French business survey data".

Prévision : 0.4% au T3 2004 pour le premier résultat de la croissance trimestriel du PIB français
intervalle de confiance à 90% (0.0%,0.9%)
Parution le 12 novembre du premier résultat

Publication du premier résultat de la croissance au T3 : 0.4% (12/11/2010)

###########################################################################################
Titre : Constructing a conditional GDP fan chart with an application to French business survey data

Matthieu Cornec

Abstract

Among economic forecasters, it has become a more common practice to provide point projection with a density forecast. This realistic view acknowledges that nobody can predict future evolution of the economic outlook with absolute certainty. Interval confidence and density forecasts have thus become useful tools to describe in probability terms the uncertainty inherent to any point forecast (for a review see Tay and Wallis 2000). Since 1996, the Central Bank of England (CBE) has published a density forecast of inflation in its quarterly Inflation Report, so called “fan chart”. More recently, INSEE has also published a fan chart of its Gross Domestic Production (GDP) prediction in the Note de Conjoncture. Both methodologies estimate parameters of exponential families on the sample of past errors. They thus suffer from some drawbacks. First, INSEE fan chart is unconditional which means that whatever the economic outlook is, the magnitude of the displayed uncertainty is the same.

On the contrary, it is common belief among practitioners that the forecasting exercise highly depends on the state of the economy, especially during crisis. A second limitation is that CBE fan chart is not reproducible as it introduces subjectivity. Eventually, another inadequacy is the parametric shape of the ditribution.

In this paper, we tackle those issues to provide a reproducible conditional and non-parametric fan chart. For this, following Taylor 1999, we combine quantile regression approach together with regularization techniques to display a density forecast conditional on the available information. In the same time, we build a Forecasting Risk Index associated to this fan chart to measure the intrinsic difficulty of the forecasting exercise. The proposed methodology is applied to the French economy. Using balances of different business surveys, the GDP fan chart captures efficiently the growth stall during the crisis on an real-time basis. Moreover, our Forecasting Risk Index increased substantially in this period of turbulence, showing signs of growing uncertainty.


Télécharger la présentation

Mise à jour liste des participants


Pierre Alquier, Université Paris 7
Sylvain Arlot, CNRS
Meriam Barhoumi-Sabraoui, Insee
Fabrice Benoudiba, ADP
Claire Borsenberger, La Poste
Stéphane Boucheron, Université Paris 7
Jerome Collet, EDF R&D
Matthieu Cornec, Insee
Christian Derquenne, EDF R&D
Aurelien D'isanto, Insee
Virginie Dordonnat, EDF R&D
Paul Doukhan, Membre senior IUF, Université Cergy et ENGREF
Eric Dubois, Insee
Matthieu Durut, LOKAD
Muriel Epstein,
Laurent Ferrara, Banque de France
Olivier Feron, EDF R&D
Sebastien Gerchinovitz, ENS
Yannig GOUDE, EDF R&D
Mohamed Hebiri, Université Marne la Vallée
Jérémie Jakubowicz, Télécom Paris
Denis Joram, La Poste
Louis-Philippe Kronek, Artelys
Pierre Leblanc, Insee
Sebastien Lecou, La Poste
Guillaume Lecue, CNRS
Edmond Lezmi, Amundi
Fanny Mikol, Insee
Emilie Muzereau, GDFSUEZ
Nicolas Omont, Artelys
Benoît Patra, LOKAD
Paul Poncet, GDFSUEZ
Mehdi Othmani, GDFSUEZ
Cedric Oudiette, astrium eads
Bertrand Pluyaud, Banque de France
Daniel Sallier, ADP
Alexandre Servigne, ADP
Pierre Tavernier, advaluation
Nicolas Urbain, advaluation
Adrien Vinay, ekimetrics
Olivier Winterberger, Paris Dauphine