Les membres du groupe de travail « Statistique spatiale » du Réseau Interdisciplinaire autour de la Statistique (RIS) organise une journée d’action « Les données à la fois spatiales et spéciales – Présentation et réflexion ». Cette journée aura lieu le jeudi 28 novembre 2019 à l’Université Toulouse 1 – Capitole (ancienne Manufacture des Tabacs, salle MS 001).
Par données spatiales et spéciales, nous avons recensé, entre autre, les données circulaires (par exemple des donnéees sur la vitesse de vent), les données volumineuses, les données spatiales en 3D, les données avec des domaines particuliers nécessitant des effets de bords, les données sur des trajectoires, etc.
* Le matin : 4 interventions de 45 minutes chacune (30 minutes d’exposé + 15 minutes d’échanges) sur des problèmes résolus.
* L’après-midi : ateliers d’entraide et de réflexion autour d’études de cas non résolues qui se feraient en deux temps : 2 heures de discussions par petits groupes et 1 heure de restitution en plénière.
Le programme de la journée est le suivant :
Programme Matinée
• 8:45–9:00 Accueil Café.
• 9:00–9:15 Présentation du réseau RIS (Delphine Grancher, LGP, CNRS).
• 9:15–10:00 “Visualisation de données à la fois spatiales et spéciales avec R” (Timothée Giraud, UMS RIATE, CNRS).
• 10:00–10:45 “Données forestières : état sanitaire des châtaigneraies ; influence des TREMs” (Michel Goulard, Dynafor, INRA).
• 10:45–11:00 Pause Café.
• 11:00–11:45 “Modélisation statistique de flux spatiaux avec R” (Thibaut Laurent, TSE, CNRS)
• 11:45–12:30 “Spatialisation et descente d’échelle de champs de température prévue par le système de Prévision d’Ensemble PEARP” (Olivier Mestre, Direction des Opérations pour la Prévision, Météo-France, CNRM-GAME UMR-3589)
• 12:45–14:00 Pause déjeuner à la brasserie Riquet, 2 boulevard Armand Duportal 31000 Toulouse.
Programme Après-Midi
14:15–17:00 Ateliers d’entraide et de réflexion autour d’études de cas non résolues, animés par Delphine Grancher (LGP, CNRS) et Ornella Malagutti (Observatoire National Interministériel de la Sécurité Routière).
• Atelier 1 : “Apparier (matching) des données de vitesse et de densité de voiture par rue pour créer un Diagramme Fondamentale Macroscopique du Traffic (DFM)” (Nicolás Martínez, TSE).
Problématique : en utilisant des données publiques issues de deux sources différentes, nous souhaitons créer un DFM du traffic pour la ville de Paris. Le DFM établira le lien entre la vitesse des voitures et la densité ou les flux de voitures au niveau de la ville. Nous avons la vitesse moyenne pour 3 millions de pairs origine-destination (iris); ces données sont issues d’Uber Movement. Pour la densité et le débit de voitures, nous avons des données de capteurs issues de la Marie de Paris. Cependant, ces capteurs sont situés dans les principales rues de la ville et ne couvrent pas la ville dans son ensemble. Nous sommes donc confrontés à un problème de matching de données géographiques disponibles à deux échelles différentes. Notre principal problème est d’assigner à chaque paire origine-destination dans les données Uber une densité moyenne sensée représenter le traffic moyen du trajet. Pour cela, il nous faut identifier quels capteurs des données de la Mairie de Paris sont pertinents pour le calcul de la densité moyenne pour chaque trajet. Pour télécharger les données :
https://movement.uber.com/explore/paris/travel-times
https://opendata.paris.fr/explore/dataset/comptages-routiers-permanents-2018/
• Atelier 2 : “Etude du climat urbain à partir de données spatialisées de température” (Eva Marques, Météo-France, CNRM-GMME)
Problématique : de part la forte concentration démographique en milieu urbain et l’évolution technologique des objets connectés, les villes offrent des opportunités uniques d’accès à des données météorologiques de masse. Celles-ci peuvent être collectées par les citoyens et autres vecteurs tels que les systèmes embarqués. En particulier, les voitures récentes mesurent régulièrement la température extérieure, notamment en ville. Ces données opportunes non-conventionnelles, certes peu fiables, présentent malgré tout un grand intérêt aux yeux de la recherche en climat urbain. En effet, un nettoyage de qualité permettrait leur utilisation pour une meilleure caractérisation de l’îlot de chaleur en ville. Les problématiques pour ces données sont multiples : l’application d’un filtrage sans données de référence disponibles, la gestion des fluctuations de densité d’observations dans l’espace mais aussi dans le temps et à terme, l’hétérogénéité entre différentes sources de données (intégration de nouvelles données telles que les stations météo amateurs par exemple, voire fusion avec sorties modèles).
Inscription gratuite mais obligatoire par mail auprès de Thibault.Laurent@tse-fr.eu