On pense souvent que pour localiser un bâtiment (en Belgique, mais la situation de nos voisins est très similaire), nous avons besoin d’une adresse, composée d’un nom de rue (qui commence en français par “Rue …”, “Avenue …”, “Chaussée …”, ou qui termine en néerlandais par “…straat”, “… laan”, “… steenweg”, ou un préfixe/suffixe similaire). Il faut ensuite un numéro, pair d’un côté de la rue, impair de l’autre. Si on construit un bâtiment entre le “10” et le “12”, on le numérotera “10A”, et si le 10 est un immeuble avec plusieurs appartements, on les distinguera par “10 boite 1”, “10 boite 2”, etc (ou 10/1, 10/2…). Il nous faudra également préciser une commune, associée à son code postal sur 4 chiffres (5 en France). Avec tout ceci, le facteur n’aura aucun mal à trouver votre boite aux lettres.
Malheureusement, si ceci est vrai pour une grande majorité des adresses, la réalité est parfois bien plus complexe. Nous avons déjà évoqué à plusieurs reprises le fait que les bases de données pouvaient contenir des informations en inadéquation avec la réalité, ce qui peut compliquer le géocodage. Dans cet article, nous allons montrer que la réalité est souvent en inadéquation avec le bon sens ! Et si une réalité manque de cohérence, cela compliquera clairement la gestion des données qui la représentent.
Il existe des “directives et recommandations pour la détermination et l’attribution des adresses (…)” (directive – guide), mais elles ne sont malheureusement pas toujours respectées. Par ailleurs, la plupart des rues et numéros ont été attribués avant ces directives.
Noms de rue
En Belgique francophone, les 10 principaux préfixes (dans l’ordre de fréquence : Rue, Chemin, Avenue, Place, Clos, Route, Allée, Chaussée, Ruelle, Impasse) ne couvrent que 85 % des (62.000) noms de rue. Dans les 15 % restant, on retrouve quelques grands classiques (Drève : 0,4 %, Boulevard : 0,3 %, Square : 0,2 %), mais également d’innombrables noms de rue que l’on aurait du mal à distinguer d’un lieu-dit. Un peu plus de 2000 (3 %) noms de rues ne sont composés que d’un seul mot (comme “Dries” à Watermael-Boitsfort ; à ne pas confondre avec la “Rue Dries” à Woluwé-Saint-Lambert); 1000 commencent par un déterminant (Par exemple “La Chapelle“, et non une des 160 “Rue” ou “Avenue de la Chapelle”, ou “La Chavée” au lieu d’une des 35 variantes de “Rue de la Chavée”). Ces derniers cas sont cependant fortement déconseillés par l’article 8§4 (“Les noms de voies sans type de voie sont à éviter”) de la directive évoquée plus haut.
Le constat est similaire côté néerlandophone (Flandre et dénominations néerlandophones des rues bruxelloises) : les 10 principaux suffixes (straat, laan, weg, dreef, plein, steenweg, baan, hof, veld, berg) ne concernent que 82 % des 88 000 noms de rue. On trouve ensuite une multitudes de noms à l’allure de lieux-dits (Dorp, Tuinwijk, Warande…). On aura 26 “Vogelzang” (chant d’oiseau) à côté des 35 “Vogelzangstraat” (Rue du chant d’oiseau) et autres “laan” ou “dreef”.
Une chose est sûre : les 581 communes belges, responsables de l’attribution des noms de rues, font preuve d’une imagination sans limite ! Sans compter celles qui ont eu la délicieuse idée de donner des noms particulièrement proches à des rues qui se croisent : la “Rue de la Violette” croise, à Bièvre, la “Rue de la Volette” ; dans de nombreuses communes flamandes, la “Berkenlaan” (Avenue du bouleau) croise la “Beukenlaan” (Avenue du hêtre) ; la Burgstraße prolonge la Bergstraße à Raeren. Et si on considère des rues proches sans nécessairement se croiser, on aura des Ange/Angle (Charleroi), Carrière/Barrière (Serain), Ateliers/Bateliers (Châtelet), Beek/Beuk (Ternat), Hekel/Herel (Aalter), etc. Il s’agira de bien écrire sur vos enveloppes, le facteur vous en remerciera ! On ne sera pas surpris que le livreur (voire pire, l’ambulance !) arrive dans la mauvaise rue de temps à autre…
La directive sur l’attribution des adresses demande pourtant d’éviter (8§5) les “voies portant des noms qui ne se distinguent que par une seule lettre”.
On trouve même une situation particulièrement intéressante : à Charleroi, le côté droit d’une rue (Rue de Monseau) n’a pas le même nom que le côté gauche (Rue des chèvres) ! Une décision d’uniformisation a été prise, mais il faudra certainement quelques mois ou années avant que les données cartographiques et officielles soient alignées.
Numéros de maison
Il n’existe malheureusement aucun standard sur la façon de numéroter des maisons d’une rue. On distingue souvent le numéro de la maison (appelés “numéro de police” dans la directive, qui désigne en général l’entrée du bâtiment) et le “numéro de boite” (qui désigne l’étage, l’aile, le bloc…). Si dans une adresse on trouve un “5A”, il n’est pas possible, à moins d’être sur place ou de connaitre l’endroit, de savoir s’il s’agit d’une maison construite à côté du 5 (dans ce cas, numéro = 5A), ou de l’appartement A du numéro 5 (numéro = 5, boite = A). Il en va de même pour le 5/1. En d’autres mots, on ne sait pas si ce qui désigne l’entrée du bâtiment, c’est le 5, le 5A ou le 5/1. Il existe de nombreuses situations où un clos a été construit à la place d’une maison. La façon de numéroter les nouvelles maisons dépendra du bon-vouloir et de l’imagination de la commune :
- Au 13 du Clos du Manoir, à Limal, les nouvelles maisons ont comme numéro 13/1, 13/2, …, 13/17. Il n’y a pas de numéro de boite, les “/x” font intégralement partie du numéro et non de la boite
- Le 1517 de la chaussée de Wavre, Auderghem a plutôt choisi des lettres : 1517A, 1517B…, jusqu’à 1517P
- Au 54 de Dieweg, Uccle a décidé que la vingtaine d’habitations construites auraient le même numéro de maison, mais un numéro de boite entre 1 et 20.
Notons que la division numéro/boite présentée ici est celle que l’on retrouve dans BeSt Address, qui rassemble les informations officielles fournies par les communes (sans être toutefois exempts de problèmes de qualité, nous y reviendrons lors d’un prochain article). Mais elle ne correspond pas toujours à la répartition indiquée par les géocodeurs comme OpenStreetMap, Here WeGo ou autres Google Maps.
Mais le manque de cohérence ne s’arrête pas là : à côté du 10, on peut trouver le 10 A, le 10/2, mais également le 10 bis. Et si on fusionne le 10 et son voisin le 12, on dénommera souvent l’ensemble 10/12 (ou 10-12).
Il n’est donc pas possible, de décomposer (ou parser) correctement dans tous les cas une adresse non structurée (ou mal structurée) en “numéro” et “boite”, à moins de connaitre la décomposition correcte de chaque adresse.
Dans les données de BeSt Address, on peut s’intéresser au format des numéros de maison en étudiant le “masque”, qui consiste à remplacer toute séquence de chiffres par un 0, et toute lettre par un A. Le masque “0” (1, 12, 1977, …) couvre 92,6 % des adresses et “0A” (1A, 5B, 23C …) 7 %. À Bruxelles et en Flandre, on trouve 5 masques différents. Pour la Wallonie… 73 ! Il y a cependant fort à parier qu’il s’agit dans de nombreux cas de problèmes de qualité de données.
Le manque d’uniformité des numéros de boite est encore pire : on trouve plus de 400 formats différents ! Dont 17 000 boites composées d’une seule lettre, difficile à distinguer des numéros de maison au format “0A” évoqué ci-dessus.
En théorie, selon la directive, (16§4) une extension de numéro doit être dénommée par une lettre majuscule suivant directement le numéro (10A, pas de 10/2, 10 bis ou 10 A), et un numéro de boite doit être numérique (19§6 et §7). Mais cela n’est clairement pas suivi des faits. On observe que 99,6 % des numéros de police de BeSt Address sont compatibles avec ces directives, mais seulement 69,8 % des numéros de boite.
En dehors de l’aspect dénomination, le placement des numéros n’est pas toujours cohérent. Si on observe souvent les numéros pairs d’un côté de la rue et les numéros impairs de l’autre, ceux-ci ne sont pas toujours croissants dans la même direction.
La rue François Michoel, à Jalhay, n’a par exemple que des numéros pairs, avec les numéros croissants d’un côté, et décroissants de l’autre (voir illustration ci-dessus, où la ligne bleue suit les numéros dans l’ordre croissant. Selon les données de Best Address, avec OpenStreetMap en fond de carte). On retrouve également cette disposition dans certains clos comme la drève de Trévires à Wavre ou l’avenue Henri Wautier à Saintes.
On pourrait aussi citer la Dennenhof à Tessenderlo, rue composée de plusieurs “secteurs”, dont un avec les numéros 2, 4, 6, …, et un autre avec le 2A, 4A, 6A, 8A… Le 8A n’est donc pas entre le 8 et le 10, mais entre le 6A et le 8A (idem pour le Begijnenwinning dans la même commune).
La situation dans les résidences à chalets ou caravanes est encore plus complexe : au Tulderbos (Ravels), les numéros semblent avoir été tirés complètement au hasard (voir ci-contre) … pauvre facteur !
Code postal et commune
Comme déjà expliqué dans un article précédent, la Belgique est composée, à l’heure d’écrire ces lignes, de 581 communes, chacune étant composée d’une ou plusieurs sous-communes, ou localité. Chaque sous-commune est associée à un code postal, mais celui-ci peut être identique pour chaque sous-commune d’une même commune, distinct pour chaque sous-commune, ou un mixe entre les deux. On peut donc considérer qu’un code postal est attribué soit à une commune, soit à ses sous-communes.
La région de Bruxelles-Capitale comporte cependant quelques anomalies. Elle est composée de 19 communes, 18 n’ayant pas de sous-commune, et une (Bruxelles-ville) qui en a 4 (Bruxelles, Laeken, Haren et Neder-over-Hembeek). Dans la pratique, la commune de Saint-Gilles, par exemple, est dénommée indistinctement “1060 Saint-Gilles” ou “1060 Bruxelles”, comme toutes les autres communes bruxelloises. Dans aucune autre région de Belgique on ne désigne une commune par sa province ou son arrondissement. Ailleurs, on désigne une localité soit par la combinaison du code postal avec le nom de la localité (1301 Bierges), soit avec le nom de la commune (1301 Wavre).
Par ailleurs, la commune de Bruxelles-ville (ou ville de Bruxelles) a au cours du XIXè siècle absorbé plusieurs territoires des communes voisines, qui relèvent donc de l’autorité de la ville de Bruxelles, mais dont le code postal est resté celui de la commune d’origine. Ainsi, si l’essentiel du territoire dépendant de la ville de Bruxelles est sur les codes postaux 1000 (en bleu sur la carte), 1020, 1120 et 1130 (les 4 sous-communes), une partie est sur 1040 (quartier Européen, en vert) et une partie est sur 1050 (Avenues Louise et Franklin Roosevelt, en gris). Etterbeek ne possède donc pas la totalité de 1040 (seulement la partie marron), Ixelles ne gère pas l’entièreté de 1050 (seulement la partie turquoise, coupée en deux par l’Avenue Louise).
En conclusion
Nous consacrons beaucoup de temps chez Smals Research, que ce soit sur ce blog ou lors de nos projets et missions, à sensibiliser sur la complexité de maintenir des données en adéquation avec le monde réel. Dans cet article, nous illustrons le fait que la réalité est parfois fondamentalement compliquée, à cause du fait que la nomenclature (noms des communes, des rues, attribution des numéros) est laissée à la liberté de chaque commune, sans beaucoup de contrainte. Ce qui mène aux aberrations que nous énonçons ici. Si l’on rajoute les évolutions historiques, on a vite fait, si l’on n’agit pas avec beaucoup de rigueur, d’envoyer les pompiers à la mauvaise adresse !
Ce post est une contribution individuelle de Vandy Berten, spécialisé en data science chez Smals Research. Cet article est écrit en son nom propre et n’impacte en rien le point de vue de Smals.
Leave a Reply