MIMathon Porto 2026 : harmoniser les données des villes à l’ère de l’IA
Du 1 au 10 juin 2026, Porto a accueilli le MIMathon, organisé par l’Open & Agile Smart Cities (OASC). Cinq pistes ouvertes, cinq jeux de données réels mis à disposition par Porto Digital, un objectif partagé : prototyper des Minimal Interoperability Mechanisms applicables au quotidien des collectivités.
Deux équipes ont travaillé en parallèle sur l’événement, avec deux angles complémentaires : l’équipe LESL (Lea et Eliott chez Kereval, Sattisvar chez Dolfin, Louis chez Askem) sur trois pistes, et l’équipe GEX (Marwen, Mohamed et Olaf, IFE et GreenEarthXchange) sur la piste énergie.
Le constat de départ
Toutes les villes vivent le même problème : chaque service, chaque fournisseur, chaque standard parle son propre dialecte. Le même arbre s’appelle tree species ou tree name, la même consommation devient energy_kwh, consumption_kWh ou energyConsumed, le même point d’intérêt se retrouve dans un format CitySDK, un autre en NGSI-LD, un troisième en GeoJSON. À chaque nouvelle source son projet, à chaque nouveau standard sa cartographie. Ce sont des dizaines de pipelines fragiles qui dérivent silencieusement.
L’approche LESL : un pivot lisible, des templates, un skill
Nous avons appliqué partout le même schéma. Un modèle canonique unique, écrit en Dolfin, un langage d’ontologie human-friendly que l’expert métier peut lire sans formation. Autour, des adaptateurs qui parsent les sources et des writers qui produisent chaque format cible. N sources entrent, M formats sortent, le pivot reste petit. N+M fichiers au lieu de N×M cartographies.
Trois cas concrets démontrent la méthode :
- UC01, arbres classés de Porto : 238 arbres reliés à la taxonomie GBIF, avec une proposition de modèle Tree à la communauté Smart Data Models.
- UC02, Points of Interest : 58 POIs (Casas de Fado, postes d’abastecimento) alignés aux Smart Data Models, avec ancrage schema.org et Wikidata.
- UC04, mobilité : 2598 observations de trafic TomTom publiées simultanément en Smart Data Models JSON-LD et en DATEX II v3 XML, depuis un seul enregistrement canonique.
L’approche GEX : un pipeline AI-assistée avec 9 rangers
En parallèle, l’équipe GEX a livré CityData Harmonizer, un pipeline de neuf agents spécialisés, appelés rangers et formés dans l’esprit de l’OASC Academy comme MIM Champions. Quatre rangers IA gèrent l’incertitude sémantique sous forme de propositions ; cinq rangers déterministes parsent, vérifient, exécutent et valident. Un Quality Gate rule-based protège la confiance avant écriture. Testé sur cinq sources énergie hétérogènes, puis sur deux sources qualité de l’eau sans modification du pipeline. Avec, à la clé, la proposition d’un nouveau modèle EnergyConsumptionObserved à la communauté.
Pourquoi cela compte maintenant
L’IA accélère beaucoup de choses, mais elle ne règle pas le problème de l’interopérabilité par elle-même. Sans modèle sémantique clair, un LLM hallucine des schémas, les cartographies dérivent, la traçabilité se perd. La vraie question n’est plus l’IA peut-elle résoudre l’interopérabilité ? mais comment lui donner un modèle sur lequel s’appuyer ?
Les deux équipes apportent une réponse cohérente : un pivot canonique d’un côté (LESL), une chaîne d’agents disciplinés de l’autre (GEX). Dans les deux cas, c’est la même intuition : l’IA accélère, le déterministe verrouille la confiance.
Un skill transférable
Au-delà des cas livrés, l’équipe LESL publie sa méthode comme un skill réutilisable : une recette en 10 étapes, un kit de démarrage Python prêt à forker, et trois implémentations de référence en open source. N’importe quelle ville, n’importe quelle équipe peut appliquer le pattern à un nouveau domaine, sans nous.
Tout est en ligne
Pages de résultats des trois UC LESL et de l’UC03 GEX, modèles canoniques en Dolfin, code source des harmonizers, données harmonisées en JSON-LD, GeoJSON et XML, slides de récap et pitchs courts, skill complet et starter kit, plus les documents GEX (findings, pitch deck, glossaire d’architecture) : tout est consultable et téléchargeable.
Une démonstration concrète que l’interopérabilité ne doit plus être un projet récurrent. Elle peut devenir un service que les villes, les hôpitaux et les administrations exploitent au quotidien, avec une IA qui les aide enfin sans les enfermer.
