lundi 19 mars 2012

Vendredi 13 avril : Prediction of Quantiles by Statistical Learning and Application to GDP Forecasting,

Lieu ENGREF
Salle 7
12h30-13h30
Vendredi 13 avril 2012

Pierre Alquier (Paris 7) et X.Li (Université de Cergy)
Prediction of Quantiles by Statistical
Learning and Application to GDP Forecasting

In this paper, we tackle the problem of prediction and confidence intervals for time series using a statistical learning approach and quantile loss functions.
In a first time, we show that the Gibbs estimator (also known as Exponentially Weighted aggregate) is able to predict as well as the best predictor in a given family for a wide set of loss functions.
In particular, using the quantile loss function of Koenker and Bassett (1978), this allows to build confidence intervals. We apply these results to the problem of prediction and confidence regions for the French Gross Domestic Product (GDP) growth, with promising results. 

lundi 13 février 2012

Calendrier 2011 2012

Yannig Goude, EDF
Vendredi 16 mars 2012
ENGREF,

Adaptive GAM models for Day-Ahead and Intra-Day Electricity Consumption Forecasts

Matthieu Cornec, Fanny Mikol
Insee, CREST
DREES

ENSAE, Amphi 1
Jeudi 9 Février 2012
"Nowcasting GDP directional change with an application to French business survey data".



Emile RICHARD
1000mercis (en CIFRE) et au CMLA-ENS Cachan
Vendredi 20 janvier 2012
Prediction in dynamic graph sequences


Jairo Cugliari
Postdoc at SELECT team, INRIA
Travail realise en these à EDF
Lieu ENGREF
12h30-13-30
Amphi 7rdc
16 déc

Titre
Prévision non paramétrique de processus à valeurs fonctionnelles.

amphi b 208 2eme etage


Sylvain Robbiano
Télécom Paristech
4 novembre

Titre
" ranking binaire et agrégation pour le cas multi-classes"

Lieu ENGREF
12h30-13-30
Amphi 7rdc
16 déc

Présentation vendredi 16 mars 2012 : Adaptive GAM models for Day-Ahead and Intra-Day Electricity Consumption Forecasts

Lieu ENGREF
Salle 7
12h30-13h30
Vendredi 16 mars 2012

Yannig Goude
EDF R&D

Adaptive GAM models for Day-Ahead and Intra-Day Electricity Consumption Forecasts

Generalized Additive Models have been investigated recently to forecasts day-ahead electricity consumptions at EDF R&D. These models achieve an interesting trade-off between accuracy of forecasts and adaptation to different data sets thanks to their semi-parametric structures. We propose here a new method based on QR decomposition (joined work with S. Wood) to learn this models on-line as we receive new data. This allows GAM models to react to smooth changes in the data generation process: economic crisis, loss or gain of customers… We illustrate it on different data sets and real forecasts.

lundi 23 janvier 2012

Présentation Jeudi 9/02 : Nowcasting GDP directional change with an application to French business survey data

Matthieu Cornec, Fanny Mikol
Insee, CREST
DREES

ENSAE, Amphi 1
Jeudi 9 Février 2012
"Nowcasting GDP directional change with an application to French business survey data".


Abstract

Despite a rich litterature on GDP growth level forecasting, few studies
have focused on forecasting GDP directional change. This is all the more
suprising that economic outlook analysis is mainly explained in terms of
acceleration or deceleration. We conduct a comparative study between
di erent class of models ranging from econometrics to machine learning.
Empirical investigations on French economy suggest that classi cation
models slightly outperform their level-based counterpart, with the respect
to the sign forecast exercise. We also provide analytical properties for
future model-based predictions. Eventually, we construct a directional
risk index which describes in probability terms the risk of an upcoming
deceleration. Applied to the balances of di erent business surveys, it
appears as a useful tool for economic forecasters


jeudi 6 octobre 2011

Présentation 20/01/2012 Prediction in dynamic graph sequences

Lieu ENGREF
amphi b 208 2eme etage
12h30-13h30
Vendredi 20 janvier 2012

Emile RICHARD
1000mercis (en CIFRE) et au CMLA-ENS Cachan



Prediction in dynamic graph sequences

Nous nous intéressons aux problèmes de prédiction dans les graphes dynamiques. Les données relationnelles générées massivement par les applications internet (telles que les réseaux sociaux, réseaux de collaborations ou les historiques d'achats), ainsi que les données d'interaction des gènes et des protéines étudiées en biologie cellulaire, sont naturellement modélisées par des graphes. Le problème de prédiction dans ces graphes évoluant dans le temps présente un intérêt majeur pour divers types d'applications : par exemple pour la conception de moteurs de recommandation, ou en biologie, pour l'analyse des mécanismes sous-jacents au développement du cancer.
Nous suggérons d'aborder le problème sous forme de minimisation d'un problème régularisé. Après formulation du problème comme un problème d'optimisation, nous suggérons des algorithmes inspirés des récents travaux sur la complétion de matrice ainsi que des méthodes de prédiction de séries temporelles multi-variées pour approcher la solution. Nous étudierons le rôle de différents régulariseurs et présenterons des résultats empiriques.

Présentation 16/12/2011 Prévision non paramétrique de processus à valeurs fonctionnelles.

Lieu ENGREF
12h30 - 13h30
Lieu : Amphi 7 Rdc


Jairo Cugliari
Postdoc at SELECT team, INRIA
Travail réalisé en thèse à EDF


Titre
Prévision non paramétrique de processus à valeurs fonctionnelles.
Résumé
Nous traitons le problème de la prédiction d’un processus stochastique à valeurs fonctionnelles. Nous commençons par étudier le modèle proposé par Antoniadis et al.
(2006) dans le cadre d’une application pratique -la demande d’énergie électrique en France- où l’hypothèse de stationnarité semble ne pas se vérifier. L’écart du cadre stationnaire est double: d’une part, le niveau moyen de la série semble changer dans le temps, d’autre part il existe groupes dans les données qui peuvent être vus comme des classes de stationnarité.

Nous explorons corrections qui améliorent la performance de prédiction. Les corrections
visent à prendre en compte la présence de ces caractéristiques non stationnaires. En particulier, pour traiter l’existence de groupes, nous avons contraint le modèle de prévision à n’utiliser que les données qui appartiennet au même groupe que celui de la dernière observation disponible.

Si le regroupement est connu, un simple post-traitement suffit pour obtenir des meilleures
performances de prédiction. Si le regroupement en blocs est inconnu, nous proposons de découvrir le regroupement en utilisant des algorithmes d’analyse de classification non supervisée. La dimension infinie des trajectoires, pas nécessairement stationnaires, doit être prise en compte par l’algorithme. Nous proposons deux stratégies pour ce faire, toutes les deux basées sur les transformées en ondelettes. La première se base dans l’extraction d’attributs associés à la transformée en ondelettes discrète. L’extraction est suivie par une sélection des caractéristiques le plus significatives pour l’algorithme de classification. La seconde stratégie classifie directement les trajectoires à l’aide d’une mesure de dissimilarité sur les spectres en ondelettes.

Présentation du 4 novembre 2011 Ranking binaire et agrégation pour le cas multi-classes

Lieu : ENGREF
Salle amphi 7 RdC
12h30-13h30
Vendredi 4 novembre 2011

Sylvain Robbiano
Télécom Paristech


"Ranking binaire et agrégation pour le cas multi-classes"

"Dans de nombreuses applications, il ne s’agit pas seulement de classer les observations (‘ pertinent’ vs. ‘ non
pertinent’), mais de les ranger/ordonner de façon adéquate (par degré de pertinence). Des travaux relatifs à la formulation et à la résolution du problème de scoring/ranking ont été réalisés sur le modèle des méthodes utilisées en Machine Learning pour résoudre les problèmes de classification (Arbres de décision, Support Vector Machines, Boosting).
Dans cet exposé, on se focalisera sur l'algorithme TreeRank, qui consiste à approcher la courbe ROC optimale via un algorithme récurcif, puis on mettra en oeuvre une méthode d'agrégation d'ordres, basée sur la distance du tau de Kendall, pour résoudre le problème du ranking multi-classes."



Article de Sylvain Robbiano