Chapter 4 Transport

4.1 La plateforme transport.data.gouv

Les données de transport sont centralisées dans la plateforme transport.data.gouv qui rassemble les données de toute l’offre de mobilité à travers la France. Les autorités organisatrices de la mobilité (AOM), les opérateurs de transport et les fournisseurs de services de mobilité, ainsi que les gestionnaires d’infrastructures sont tenus de mettre à disposition, par l’intermédiaire de cette plateforme numérique, les données de leurs services et réseaux qui sont nécessaires à l’information des voyageurs. En avril 2020, le PAN héberge les données d’horaires théoriques de transport en commun de 200 autorités organisatrices de la mobilité sur 337 et 12 régions sur 18, couvrant 79% de la population bénéficiant d’un réseau de transport local. Les statistiques de déploiement de la plateforme sont disponible via ce lien.

Le Point d’Accès National (PAN) est destiné aux producteurs de données (collectivités territoriales, entreprises de transport…) et aux réutilisateurs de données (développeurs, applications de calcul d’itinéraire, services d’information…). Les usagers en bénificient de manière indirecte grâce à ces services d’information sur les déplacements.

Les données peuvent être téléchargées gratuitement depuis la plateforme et exploitées librement dans le respect de la license OBdL.

4.2 Formats des dononées de transport

  • GTFS (General Transit Feed Specifications): c’est un format informatique standardisé pour communiquer des horaires de transports en commun et les informations géographiques associées (emplacement des arrêts, tracé des lignes…). Les données sont codées dasn plusieurs fichiers: agency, calendar, routes, stops, trips, stop_times, transfers, shapes, frequencies.
  • NEPTUNE: NEPTUNE (Norme d’Échange Profil Transport collectif utilisant la Normalisation Européenne) est le format de référence en France pour l’échange de données d’offre théorique de transport collectif (TC). Un fichier NEPTUNE est un fichier texte .xml. Chaque fichier NEPTUNE (.xml) correspond à la description d’une ligne du réseau de transport. En général, un réseau de transport étant caractérisé par plusieurs lignes de transport, on dispose alors d’un ensemble de fichier .xml regroupés dans un .ZIP.
  • NeTEx: NeTEx (Network Exchange) est un format de référence pour échanger des données d’offre théorique du transport collectif, défini au niveau européen. NeTEx couvre un périmètre fonctionnel plus large que NEPTUNE et GTFS. En plus de définir des règles communes pour travailler sur l’information voyageurs, NeTEx s’intéresse également aux informations utiles pour l’exploitation des transports collectifs.
  • GTFS - Real Time: En complément du format GTFS de description de l’offre théorique, Google propose une extension pour le temps réel : GTFS-realtime (GTFS-RT).
  • SIRI: Il s’agit d’un protocole d’échange XML issu d’une spécification technique européenne. Cet acronyme signifie Service Interface for Realtime Information.

4.3 Données disponibles

La plateforme transport.data.gouv propose un large panel de données de transport catégorisées en différentes thématiques et couvrant différentes couvertures spatiales. Le tableau ci-dessous décrit un échantillon de ces données.

Thématique Jeu de données Description Fournisseur
Horaires transports en commun SNCF TER (National) Horaires des lignes TER au format GTFS. Ces horaires sont les horaires théoriques mis à jour tous les jours. SNCF
Horaires transports en commun Reseau TGV SNCF (National) Horaires des trains de SNCF Voyages (TGV/inOui/Ouigo) au format GTFS. Ces horaires sont les horaires théoriques mis à jour tous les jours. SNCF
Horaires transports en commun Ouibus (National) Liste des arrêts, horaires, et parcours du réseau BlaBlaBus/Ouibus au format GTFS. Ouibus
Horaires transports en commun Eurolines (National) Liste des arrêts, horaires, et parcours du réseau Eurolines / Isilines au format GTFS Eurolines
Temps réel transports en commun Réseau GPSO (National) Horaires théoriques au format GTFS et horaires temps-réel au format GTFS-RT du réseau GPSO. GPSO
Autocars longue distance FlixBus (National) Fichier horaire de l’ensemble du réseau Européen Flixbus. FlixBus
Vélos en libre service Levélo (Marseille) Les données sont disponibles au format GBFS et permettent de connaitre la liste des stations (géolocalisation, nom, adresse, identifiant) et l’état des stations (nombre de vélos disponibles et emplacements libres) JCDecaux
Lieux de covoiturage Base nationale consolidée des lieux de covoiturage Identification et signalétique des lieux de prise en charge en covoiturage ou intermodalité pour homogénéiser la description des zones de rencontre, favoriser leur usage et avoir un meilleur maillage. roulezmalin, Ouihop, covoiturage-libre, blablacar…
Bornes de recharges de véhicules électriques IRVE (National) les données relatives à la localisation géographique et aux caractéristiques techniques des stations et des points de recharge de véhicules électriques Stations Tesla, Métropoles, concessions…
Données aériennes Air France KLM Il s’agit de la présentation d’une semaine représentative du programme d’Air France et de KLM sur toutes les lignes opérées ou vendues en partage de code (marketing) par le groupe Air France KLM Air France, KLM, HOP, Transavia…
Réseaux routiers ROUTE 500 C’est la base de données routières décrivant 500 000 km de routes du réseau classé (autoroutes, nationales, départementales) et des éléments d’habillage à des échelles nationales et régionales. IGN
Adresses Base Adresse Nationale (BAN) C’est une base de données qui a pour but de référencer l’intégralité des adresses du territoire français. Elle contient la position géographique de plus de 24 millions d’adresses. IGN, ETALAB, INSEE
Stationnement hors voirie Base nationale des lieux de stationnement Elle permet de regrouper en un unique fichier consolidé l’ensemble de l’offre de stationnement en France, dans un format standard et unifié. transport.data.gouv.fr

4.4 Exploration des données du réseau TGV SNCF

Nous avons téléchargé les données des transport en commun pour les réseaux TGV et TER disponibles au format gtfs. Le fichier continet 6 datasets qui permettent de caractériser l’offre de transport. La figure ci-dessous décrit la structure des données GTFS et les jointures qui permettent de combiner les différents fichiers:

## [1] "agency.txt"         "calendar.txt"       "calendar_dates.txt"
## [4] "routes.txt"         "stop_times.txt"     "stops.txt"         
## [7] "transfers.txt"      "trips.txt"
route_id agency_id route_short_name route_long_name route_desc route_type route_url route_color route_text_color
OCE137 OCESN NA AQUITAINE NA 2 NA NA NA
OCE1209972 OCESN NA Paris<>Strasbourg/Alsace Allemagne NA 2 NA NA NA
OCE39 OCESN NA BRETAGNE NA 2 NA NA NA
OCESN-87391003-87671008 OCESN NA Paris-Montparnasse 1-2 - Tarbes NA 2 NA NA NA
OCE40 OCESN NA PAYS DE LOIRE NA 2 NA NA NA
OCE150 OCESN NA Paris <> Languedoc-Roussillon NA 2 NA NA NA
stop_id stop_name stop_desc stop_lat stop_lon zone_id stop_url location_type parent_station
StopArea:OCE87391003 Gare de Paris-Montparnasse 1-2 NA 48.84063 2.3198944 NA NA 1 NA
StopArea:OCE87583005 Gare de Angoulême NA 45.65393 0.1645285 NA NA 1 NA
StopArea:OCE87581009 Gare de Bordeaux-St-Jean NA 44.82654 -0.5561941 NA NA 1 NA
StopArea:OCE87582478 Gare de Biganos-Facture NA 44.63748 -0.9660205 NA NA 1 NA
StopArea:OCE87582643 Gare de La Teste NA 44.63696 -1.1429787 NA NA 1 NA
StopArea:OCE87582668 Gare de Arcachon NA 44.65892 -1.1653684 NA NA 1 NA
route_id service_id trip_id trip_headsign direction_id block_id shape_id
OCE137 7539 OCESN008473F1801823167 8473 1 NA NA
OCE137 12261 OCESN008479F0400412668 8479 1 NA NA
OCE137 1241 OCESN008477F0500512295 8477 1 NA NA
OCE137 1524 OCESN008477F0600612296 8477 1 NA NA
OCE137 472 OCESN008471F040043773 8471 1 NA NA
OCE137 12262 OCESN008479F04004~TGA50095 8479 1 NA NA

Nous proposons une visualisation des différents arrêts des réseaux de transport TGV et TER à l’échalle natinale.