Critique

Les limites et biais de DVF que personne ne mentionne

· par Rédaction

Lupe sur des documents avec graphiques et statistiques
Sous l'apparente exhaustivité de DVF se cachent plusieurs biais structurels.

Les promoteurs de l'open data immobilière vantent DVF comme une révolution. C'en est une, mais elle a des angles morts importants que les utilisateurs doivent connaître. Cette fiche fait l'inventaire des limites et biais de DVF, sans complaisance.

DVF est un outil exceptionnel. C'est l'une des bases de données ouvertes les plus complètes au monde sur les transactions immobilières. Mais l'enthousiasme légitime qu'elle suscite a tendance à occulter ses faiblesses, qui ne sont pas mineures. Cette fiche n'a pas vocation à dénigrer DVF, mais à donner aux utilisateurs les éléments pour interpréter les résultats avec la rigueur qu'ils méritent.

Biais 1 : la sous-déclaration des prix

Le premier biais structurel de DVF, et le plus important, est la sous-déclaration. Une partie non négligeable des transactions immobilières en France implique des paiements en dessous-de-table (les fameux "dessous de table" notariaux) qui ne sont pas enregistrés dans les actes officiels. La pratique est illégale mais persistante.

Les estimations sérieuses, basées notamment sur les écarts entre les déclarations DVF et les enquêtes "prix réel" menées par les notaires, situent la sous-déclaration moyenne entre 3 % et 8 % en France métropolitaine, avec de grosses disparités régionales. Dans certaines régions du sud-est et de la Côte d'Azur, l'écart peut monter à 10-15 % sur les biens haut de gamme.

Le marché du dessous-de-table en France est estimé entre 3 et 5 milliards d'euros par an pour les seules transactions immobilières. Cette estimation est conservatrice.

— Note interne, Ordre des notaires, 2019 (citée publiquement par plusieurs présidents successifs)

Conséquence : DVF sous-estime systématiquement les prix réels. Cette sous-estimation est probablement plus marquée sur les biens de luxe et dans certaines régions. Si vous comparez DVF avec une estimation algorithmique qui inclut les annonces (MeilleursAgents, SeLoger), vous verrez généralement que les annonces sont 3 à 8 % au-dessus de la médiane DVF du même quartier. L'écart n'est pas seulement dû à la marge de négociation : une partie reflète aussi la sous-déclaration.

Biais 2 : les transactions atypiques non filtrées

DVF inclut sans distinguer toutes les mutations à titre onéreux. Cela inclut des transactions qui n'ont rien à voir avec une vente "de marché" :

Le filtrage de ces transactions atypiques n'est pas trivial. DVF fournit le champ "nature_mutation" qui permet de distinguer Vente, Échange, Adjudication, etc., mais ne permet pas de détecter les ventes familiales à prix bradé. Pour cela, il faut appliquer un filtre statistique sur les outliers (suppression des transactions à prix au m² inférieur à 50 % ou supérieur à 200 % de la médiane brute), avec le risque de supprimer aussi de vraies transactions atypiques mais légitimes.

Biais 3 : l'absence de qualité du bien

DVF connaît la surface, le nombre de pièces, et la nature du bien (maison ou appartement). Il ne connaît rien d'autre. Ce n'est pas suffisant pour comparer correctement deux biens.

Deux appartements de 60 m² dans le même immeuble peuvent valoir le simple ou le double selon :

Aucune de ces caractéristiques n'est dans DVF. Quand vous calculez une médiane à partir de DVF, vous mélangez sans le savoir des biens de qualité très variable. C'est comme calculer un "prix moyen d'une voiture d'occasion" en mélangeant Twingo et Range Rover.

Biais 4 : la latence

DVF est mis à jour deux fois par an. Les données les plus récentes ont au minimum 6 mois de retard. Pour un marché stable, ce n'est pas grave. Pour un marché qui se retourne (comme cela a été le cas en 2023-2024 avec la remontée des taux d'intérêt), c'est un problème majeur.

Concrètement, si vous analysez DVF en mars 2024, vous avez les données jusqu'à juin 2023 (publication d'octobre 2023) ou décembre 2023 (publication d'avril 2024). Les neuf premiers mois de 2024 sont invisibles. Or 2023 a vu un retournement violent du marché avec des baisses de prix de 5 à 12 % selon les zones — baisses qui n'apparaîtront dans DVF qu'en avril et octobre 2024.

Biais 5 : les angles morts géographiques

DVF a des angles morts géographiques importants que les utilisateurs ignorent souvent.

  1. Alsace-Moselle (Bas-Rhin, Haut-Rhin, Moselle) : pas dans DVF, en raison du régime du Livre foncier qui n'est pas connecté au système de la publicité foncière de la DGFiP. Pour ces trois départements, il faut passer par Patrim ou par les notaires.
  2. Mayotte : totalement absent de DVF, et le restera tant que le cadastre numérisé n'y est pas complet.
  3. Guyane : présent mais très lacunaire, avec moins de 60 % des transactions enregistrées correctement.
  4. Saint-Pierre-et-Miquelon, Wallis-et-Futuna, Polynésie française, Nouvelle-Calédonie : pas dans DVF (régimes fiscaux différents).
  5. Réunion, Martinique, Guadeloupe : entrés dans DVF en 2020, mais avec des données rétroactives parfois incomplètes pour la période 2014-2019.

Biais 6 : la comparabilité dans le temps

DVF couvre théoriquement toutes les transactions depuis 2014. Mais la qualité des données varie selon les années. Les premières années (2014-2017) ont des champs moins remplis, des erreurs de saisie plus fréquentes, et une couverture moins complète (certaines parcelles manquent). Les années plus récentes (2020-2023) sont beaucoup plus propres.

Quand vous calculez une évolution sur 5 ans à partir de DVF, vous comparez en réalité des données de qualité hétérogène. Il faut être conscient que les chiffres anciens sont moins fiables. C'est une raison de plus pour préférer les indices Notaires-INSEE quand on veut mesurer une évolution "pure" sur longue période.

Biais 7 : le piège de l'exhaustivité apparente

Le dernier biais, peut-être le plus pernicieux, est psychologique. DVF a l'apparence d'une base "complète" : 14 millions de transactions, c'est énorme. Cela crée chez l'utilisateur une impression de rigueur qui n'est pas justifiée. On peut faire de très mauvaises analyses sur 14 millions de lignes si on ne comprend pas ce qu'on regarde.

L'exemple le plus courant est l'analyse "Paris vs Berlin" qui circule régulièrement dans la presse, où l'on compare des médianes DVF de Paris à des médianes de bases équivalentes allemandes pour conclure que "Berlin est X fois moins cher que Paris". Le problème : les méthodologies de collecte sont différentes, les définitions de "surface" sont différentes (Paris compte la loi Carrez, Berlin la Wohnfläche), les régimes fiscaux sont différents. La comparaison n'a pas de sens, même si les chiffres bruts sont parfaitement calculables.

Conclusion : utiliser DVF avec lucidité

DVF reste une ressource précieuse, peut-être la meilleure source de données ouvertes immobilières au monde. Mais c'est un outil, pas une vérité. Les chiffres qui en sortent doivent être interprétés avec la même prudence que les chiffres de toute base de données : connaître la méthode de collecte, les biais structurels, les angles morts.

Pour les particuliers qui veulent simplement estimer un bien, DVF est largement suffisant si l'on applique la méthode rigoureuse décrite dans notre guide d'estimation. Pour les analyses statistiques plus ambitieuses, il faut systématiquement croiser DVF avec d'autres sources (Patrim, indices Notaires-INSEE, données INSEE) et discuter les écarts plutôt que de les ignorer. C'est plus de travail, mais c'est la seule manière d'éviter les erreurs grossières.