En cliquant sur "Accepter", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.

Article de blog

Les 10 commandements des données de mobilité

Comment prendre des décisions intelligentes à partir de données intelligentes

Alexander Pazuchanics
27 octobre 2023

Le monde des données sur les transports est passionnant et se développe chaque jour. Depuis l'avènement des téléphones connectés, des voitures connectées et même des skis connectés, nous avons vu beaucoup de nouvelles données être produites, avec la promesse qu'elles peuvent conduire à une meilleure prise de décision et conduire à des "villes plus intelligentes". Mais il y a toujours quelque chose qui cloche. Pour de nombreuses villes, il semble qu'il y ait un large fossé entre la promesse des données et l'expérience quotidienne d'essayer d'utiliser les données ou même d'essayer de trouver quelles données utiliser.

J'ai eu la chance de passer la majeure partie de ma carrière à me pencher spécifiquement sur la question de savoir comment utiliser cette explosion de données pour rendre nos villes plus sûres et plus vertes. J'ai contribué à l'élaboration des principes de Pittsburgh pour la communication de données par les entreprises de véhicules autonomes qui effectuent des essais dans la ville. Mon équipe a élaboré la politique de la ville de Seattle en matière de partage des données de mobilité. Et maintenant, j'ai passé les trois dernières années à travailler avec des villes du monde entier et à les écouter sur les données qui leur importent. Au cours de cette période, j'ai beaucoup appris et je me suis forgé ma propre opinion.

Bien sûr, je serais ravie si vous pensiez que les solutions de données de mobilité de Vianovasont les bonnes réponses à vos défis. Mais même si ce n'est pas le cas, je veux contribuer à relever le niveau de la demande et de l'utilisation des données par les villes pour prendre de meilleures décisions. À cette fin, j'ai rédigé mes 10 commandements des données de mobilité:

1. Distinguer les données et les informations

De nombreuses organisations sont riches en données, mais pauvres en informations. Elles collectent (ou achètent) de grandes quantités de données, mais ne savent pas comment les exploiter. Ce problème n'est pas l'apanage des pouvoirs publics, il peut se poser à n'importe quelle organisation.

Je passe beaucoup de temps à réfléchir à la manière de rendre les données utiles, pertinentes ou intéressantes. En d'autres termes, j'espère que nous aidons un utilisateur à obtenir les informations que les données peuvent apporter. Dans certains cas, chez Vianova, nous pensons que nous comprenons suffisamment bien le problème de l'utilisateur pour produire l'information directement pour lui, en prenant les données brutes et en les transformant en un "produit de données" raffiné. Nous n'essayons pas de cacher quoi que ce soit, mais nous ne pensons pas qu'il soit utile de passer par toutes les étapes du processus.

Dans d'autres cas, nous essayons de créer des outils qui permettent à l'utilisateur de transformer lui-même les données en informations. Il se peut qu'ils connaissent mieux leurs propres problèmes et qu'ils soient plus créatifs que nous. Il se peut aussi qu'ils ne sachent pas encore exactement ce qu'ils veulent, mais qu'ils "le sauront quand ils le verront". Dans ce cas, nous essayons de rendre l'expérience utilisateur aussi simple que possible au départ et d'ajouter de la complexité au fur et à mesure.

2. N'oubliez pas que personne ne dispose de toutes les données

C'est peut-être une évidence, mais elle mérite d'être répétée. Il manque des données dans presque toutes les sources de données ; ou plutôt, aucune source de données n'est une représentation parfaite de la réalité.

Par exemple, dans le domaine de la sécurité routière, la plupart des villes s'appuient sur un ensemble de données relatives aux collisions signalées pour déterminer les zones les plus à risque. Mais nous oublions parfois que ces données ne représentent pas l'ensemble des collisions, mais l'ensemble des collisions signalées. Il s'agit d'une différence sémantique, mais aussi d'une différence réelle - il existe de nombreuses raisons pour lesquelles les collisions peuvent être sous-déclarées.

Même la collecte de données purement empiriques peut être sujette à des erreurs. Les caméras tombent en panne, l'IA ne reconnaît pas les objets, les compteurs de tubes tombent en panne et les personnes chargées de compter le trafic vont chercher une tasse de café. Les taux d'erreur sont peut-être très faibles, mais ils ne sont pas nuls. Et il est important de reconnaître qu'il y a des risques à supposer que les données représentent une image globale (nous y reviendrons plus tard).

3. Reconnaître le compromis entre plus de données et des données plus riches

En général, les données des véhicules connectés promettent beaucoup plus de données que celles collectées par la plupart des villes aujourd'hui. Plus d'observations uniques, dans plus d'endroits, avec plus de champs distincts que ce à quoi vous aviez accès auparavant. Mais plus le filet de collecte de données est grand, plus vous risquez de collecter les bottes et les pneus métaphoriques des mauvaises données.

Les données empiriques, c'est génial ! Vous pouvez collecter des données de vos propres yeux ou à l'aide d'un appareil photo que vous pourrez examiner ultérieurement. Les données sont probablement très riches, avec beaucoup de contexte supplémentaire sur le monde autour de l'observation. Mais il n'est tout simplement pas possible de collecter autant de données aussi rapidement (ou à moindre coût) qu'avec de vastes ensembles de données sur les véhicules connectés. Même un grand nombre de pêcheurs munis de cannes à pêche prendront moins de poissons au total que ceux qui pêchent au chalut.

Je ne veux pas dire qu'un type de données est toujours meilleur que l'autre. Cela dépend du cas d'utilisation, du budget, du calendrier et d'une foule d'autres facteurs. Mais les techniques doivent être comparées en fonction de leurs mérites - il doit s'agir d'un choix délibéré.

4. Toujours avoir un cas d'utilisation

J'ai souvent entendu des gens dire quelque chose comme "Donnez-nous toutes les données, nous trouverons comment les utiliser une fois que nous les aurons vues" (parfois dans ma propre entreprise, parfois de ma propre bouche). L'exploration des données est très amusante ! Il est très intéressant de découvrir des faits intéressants dans les données ou de voir à quel type de questions on peut répondre.

Mais pour dépasser le stade de l'exploration, les utilisateurs doivent vraiment réfléchir à l'usage qu'ils comptent faire des données avant même d'ouvrir le fichier. C'est une tension : parfois, on ne sait pas ce que l'on ne sait pas. Mais sans une justification claire de la collecte et de l'interprétation des données, il est très facile de se perdre dans un exercice théorique. Il est également très possible d'avoir accès à des données dont on n'a pas besoin, ou même à des données dont on ne veut pas. C'est le principe de la minimisation des données : ne prenez que ce dont vous avez besoin, quand vous en avez besoin.

Avoir un cas d'utilisation n'est pas seulement une bonne pratique, pour les données personnelles, c'est une exigence du GDPR. Vous pouvez en apprendre davantage à ce sujet dans certains de nos autres écrits.

5. Examiner les "débris de données" pour trouver ce qui existe déjà.

Nous discutons fréquemment avec des villes qui tentent d'élargir leur portefeuille de données sans exploiter pleinement le potentiel de leurs données existantes. L'exploitation d'ensembles de données préexistants, en particulier de données qui peuvent exister dans un autre service ou une autre équipe, peut apporter une multitude d'informations. Les champs de données qui sont déjà collectés ou qui pourraient être facilement ajoutés par une équipe pourraient être très utiles à une autre équipe - un concept que j'appelle "débris de données".

Chez Vianova, nous avons donné la priorité aux fonctionnalités permettant aux utilisateurs de télécharger leurs propres données afin de combiner différentes sources et de commencer à identifier des modèles qui auraient pu être cachés autrement. Une meilleure exploration des ensembles de données existants, par un plus grand nombre d'utilisateurs comprenant la raison pour laquelle les données sont précieuses, peut conduire à des idées plus rapidement.

6. Se demander si le jus vaut la peine d'être pressé

La collecte (ou l'acquisition) de données a un coût réel : le traitement, le nettoyage, l'hébergement et la manipulation des données nécessitent du temps, des efforts et de la puissance de calcul. Au minimum, cela crée un coût d'opportunité - le temps ou les ressources que vous auriez pu consacrer à autre chose.

Il se peut qu'il existe (ou que l'on puisse créer) l'ensemble de données exact pour répondre à votre question, mais il est également possible qu'un ensemble de données répondant à 80 % de votre question soit disponible pour un coût deux fois moindre et en deux fois moins de temps. Il en va de même pour l'échantillonnage au sein de l'ensemble de données - peut-être qu'au lieu d'avoir besoin d'une année de données historiques, vous n'aurez besoin que de six mois de données au cours de la dernière année. Lorsque l'on étudie les besoins en données, il est important d'équilibrer l'effort et la valeur pour trouver quelque chose d'exploitable. Il est particulièrement important de ne pas laisser des exigences excessives et le désir de "préparer l'avenir" conduire à une acquisition de données trop importante ou trop complexe.

7. Réfléchir sérieusement à l'objectif de représentativité

On nous pose souvent des questions sur la représentativité des ensembles de données avec lesquels nous travaillons, en particulier avec les données des véhicules connectés. C'est une question juste, mais aussi peut-être imprécise.

Les ensembles de données peuvent représenter une petite partie du nombre de voitures ou de camions dans la rue (nous essayons de viser une couverture de 3 à 5 %, sur la base de notre modélisation). Ce nombre peut sembler faible, mais 1) il est presque certainement plus largement réparti que la collecte de données existante par les caméras de circulation ou les compteurs de tubes, et 2) il peut encore donner lieu à un nombre significatif d'observations. Dans pratiquement tous les domaines (y compris les transports), l'échantillonnage statistique est utilisé pour prendre des décisions et obtenir des résultats.

La question la plus importante, en particulier lorsque votre cas d'utilisation tourne autour de la planification des transports, du développement des infrastructures ou de la modélisation, est de savoir si les données sont représentatives des comportements de l'ensemble de la population. Nous travaillons avec plusieurs fournisseurs qui desservent un large éventail de conducteurs dans le but de représenter au mieux le conducteur moyen.

La représentativité est une variable en constante évolution, sur laquelle les fournisseurs de données et les villes doivent travailler ensemble pour obtenir des résultats.

8. Regarder la tendance, pas seulement le chiffre brut

Il est naturel de vouloir connaître des nombres précis - depuis que nous sommes tout petits, nous apprenons à compter. Mais le "grand nombre" n'est pas toujours le moyen le plus productif de répondre à une question à l'aide de données.

Lorsque l'on utilise de grands ensembles de données sur la mobilité, il est généralement plus utile de les agréger à un certain niveau d'espace et de temps. Dans certains cas, c'est même obligatoire, car sinon, les données peuvent être personnellement identifiables. L'agrégation peut également faciliter l'évaluation des tendances dans le temps, en lissant les anomalies dans les données.

De même, il est plus utile de penser aux variations en pourcentage qu'aux chiffres absolus. De petites valeurs peuvent parfois avoir des effets considérables. Il est important de s'assurer que les données sont lisibles et que les gens comparent des éléments qu'il est logique de comparer.

9. Faites confiance à vos yeux et à vos oreilles

Je travaille dans une start-up qui crée des produits de données sur la mobilité. J'aimerais vous dire que vous n'aurez plus jamais besoin de quitter votre bureau (ou votre maison) et que tout le système de transport peut être géré depuis votre ordinateur portable. Mais ce n'est pas vrai, et ce ne devrait pas être l'objectif.

Pour moi, c'est la différence entre des décisions "guidées par les données" et des décisions "éclairées par les données". Les grands ensembles de données et les produits de données sur mesure peuvent vous aider à trier, à hiérarchiser et à identifier les points chauds ou les domaines d'intérêt. Ils excellent à vous donner une visibilité plus large ou plus profonde que vous n'auriez pu avoir autrement. Mais personne ne dispose d'une machine magique qui produira la bonne réponse 100 % du temps.

Mais ces outils doivent être pris en compte parallèlement à une série d'autres données, telles que les visites de sites et les conversations avec les membres de la communauté. Cela ne signifie pas que les données ne sont pas fiables, mais simplement qu'elles ne sont pas exhaustives.

10. Commencer quelque part, n'importe où

Cela peut sembler évident, mais ce n'est pas toujours le cas. Les villes partent de différents niveaux de données, mais d'un point de vue pratique, il faut bien commencer quelque part, et c'est généralement loin de l'objectif final.

Dans de nombreuses villes, il n'y a pratiquement pas de collecte de données sur des modes de transport tels que le vélo ou la marche. De nouveaux produits de données (et de nouveaux équipements pour générer des informations) sont créés chaque jour pour élargir le pool d'informations disponibles. Mais en toute honnêteté, personne n'est sûr à 100 % de collecter les bonnes données. Les créateurs de données, et les entreprises comme Vianova qui créent des produits de données à partir de ces données, veulent savoir qu'ils contribuent à résoudre les problèmes de la ville. Et la seule façon de le savoir est de travailler ensemble et de modifier les recettes jusqu'à ce que nous obtenions le bon mélange. C'est un voyage dont nous ne sommes qu'au début.

C'est le moment d'innover ! Travaillez rapidement, apprenez quelque chose et construisez sur cette base. L'avantage de la plupart des techniques de collecte de données est qu'elles sont rapides et (comparativement) bon marché. Il est préférable d'essayer et d'apprendre que de souffrir de paralysie analytique, en attendant que l'ensemble de données parfait apparaisse.

À propos de Vianova

Vianova est la solution d'analyse de données pour exploiter le monde de la mobilité. Notre plateforme exploite la puissance des véhicules connectés et des données IoT, afin de fournir des informations exploitables pour planifier des infrastructures de transport plus sûres, plus écologiques et plus efficaces. Qu'il s'agisse de permettre la réglementation de la mobilité partagée, de transformer les livraisons du dernier kilomètre ou de cartographier les points chauds du risque routier, Vianova est au service de plus de 150 villes, opérateurs de flotte et entreprises à travers le monde pour changer la façon dont les personnes et les marchandises se déplacent.
Pour plus d'informations :
www.vianova.io

Si vous souhaitez faire part de vos commentaires à Vianovaveuillez envoyer vos commentaires à hello@vianova.io. Si vous souhaitez en savoir plus sur les conditions de travail chez Vianovaet rejoindre notre équipe talentueuse, visitez notre site d'offres d'emploi ou envoyez directement votre candidature à jobs@vianova.io.

Devenir membre

du mouvement

Inscrivez-vous à notre newsletter et restez au courant de ce qui se passe dans le monde de Vianova.
Abonné !
Oups ! Un problème s'est produit lors de l'envoi du formulaire.

Prenez contact avec nos équipes

Parlons-en ! Nous sommes impatients de savoir comment nous pouvons vous aider à résoudre vos problèmes de mobilité.


Bureaux :

Vianova SAS - Paris, France
Vianova LLC - San Francisco, USA
Vianova - Londres, Royaume-Uni
Vianova - Berlin, Allemagne

Je veux en savoir plus
Ma question est la suivante...
Je suis intéressé par un produit spécifique
Contactez-moi pour une démonstration sur ....
Je souhaite faire une demande d'essai
Montrez-moi ce que vous savez faire...
Partenariat entre les deux parties
Nous pouvons réaliser de belles choses ensemble...
Je souhaite rejoindre votre équipe
Travaillons ensemble pour un avenir meilleur...
Je suis intéressé, mais j'ai d'abord quelques questions à poser. N'hésitez pas à me contacter.
Veuillez remplir le formulaire et nous vous répondrons dans les plus brefs délais.
Je suis intéressé par un produit spécifique.
Veuillez remplir le formulaire et nous vous répondrons dans les plus brefs délais.
Je souhaite faire une demande d'essai
Veuillez remplir le formulaire et nous vous répondrons dans les plus brefs délais.
Faisons équipe !
Veuillez remplir le formulaire et nous vous répondrons dans les plus brefs délais.