Le cœur de l'activité d'EurosForDocs est d'améliorer la transparence des liens financiers dans le domaine de la santé. En pratique, cela consiste principalement à corriger la base Transparence Santé. Ce traitement amène potentiellement des différences significatives entre les résultats fournis par chacune des deux plateformes. Dans cet article nous allons analyser en détail les liens d'intérêt de l'association ACTIV (siren: 380061887) selon le point de vue des deux plateformes.
Il est important de noter ici que nous analysons les raisons techniques des différences. Nous ne faisons aucun jugement ou analyse sur les montants en jeu ou les entreprises concernées.
ACTIV n'est pas le nom de l'association mais son acronyme signifiant ASSOCIATION CLINIQUE ET THÉRAPEUTIQUE INFANTILE DU VAL DE MARNE. Puisque le champ nom de Transparence Santé est un texte libre, l'association y apparaît sous de multiples orthographes en plus des deux déjà mentionnées.
Du fait de ces multiples orthographes, il serait plus pertinent de chercher un bénéficiaire grâce à un numéro d'identification national : ici le siren. Le siren n'est malheureusement pas systématiquement renseigné par les entreprises. Il est donc vivement recommandé de coupler une recherche par identifiant avec une recherche par nom, y compris sur la plateforme EurosForDocs. En effet, même sur cette dernière, la déduplication des personnes morales reste limitée. Pour des raisons pédagogiques, nous allons rester sur une recherche basée sur le siren sur les deux plateformes. L'interface de recherche avancée de Transparence Santé nous permet une sélection basée sur cet identifiant. On obtient alors 134 déclarations pour l'association ACTIV, pour un montant total de 11 965 276 euros.
Bien que la plateforme EurosForDocs permette de combiner plusieurs noms différents dans un même tableau de bord, il demeure intrinsèquement compliqué d'identifier toutes les variations à inclure. À titre de comparaison, nous maintenons la stratégie de recherche par siren uniquement. La recherche amène alors à l'identification de 213 déclarations pour 13 180 661 euros.
Comme mentionné précédemment, la déduplication des personnes morales reste limitée sur EurosForDocs. Pour écrire cette étude de cas, nous avons identifié manuellement les doublons. Ils ont ensuite été fusionnés automatiquement par notre système. Nous avons donc un cas idéal où toutes les déclarations peuvent être obtenues à travers la seule recherche par siren. En pratique, la plupart des associations conserveront différents comptes. Un traitement manuel peut être effectué sur demande.
Les sections suivantes auront alors pour rôle d'expliquer certains concepts du traitement de Transparence Santé par EurosForDocs pour permettre de décortiquer la différence de nombre de déclarations et de montant.
La plateforme Transparence Santé est prévue pour déclarer des liens d'intérêt en deux étapes. La première étape consiste à définir une convention entre une entreprise déclarante et un bénéficiaire. Cette première déclaration renseigne un montant prévisionnel de la relation à venir. Dans un deuxième temps les entreprises vont pouvoir déclarer un ensemble de revenus ou d'avantages en nature pour lesquels les montants réels seront documentés. Il existe alors le risque de compter deux fois certains montants : une fois dans la convention et une fois dans la rémunération.
Pour éviter ce problème de double comptage, EurosForDocs déduit du montant de la convention la somme des montants des rémunérations et avantages liés. Sur les 39 conventions identifiées sur les deux plateformes, 30 ont alors des montants différents. Alors que Transparence Santé annonce 6 236 546 euros, EurosForDocs corrige ce montant à 3 014 753 euros. Les 9 conventions restantes n'ont pas de montant prévisionnel ou aucune rémunération liée.
Dans Transparence Santé, les entreprises déclarantes ne semblent pas avoir de contraintes sur les informations qu'elles mentionnent concernant les personnes morales. Chaque déclaration ciblant ACTIV, même provenant d'une même entreprise, peut potentiellement avoir des informations différentes. La tâche la plus compliquée d'EurosForDocs est alors d'identifier toutes ces variations concernant la même entité réelle. Il est ensuite possible d'uniformiser la manière dont cette entité apparaît dans notre base de données.
Après une exploration de cette variabilité, EurosForDocs définit la notion de compte bénéficiaire comme une combinaison :
Nous considérons que si ces informations sont identiques entre deux déclarations, alors l'entreprise déclarante fait référence à la même entité. Ces informations définissent un numéro unique appelé efd_id.
Il est à remarquer qu'il est totalement possible qu'un même efd_id apparaisse avec différents numéros d'identification. Ces numéros peuvent correspondre à différents identifiants légitimes de l'entité : par exemple siren et numéros d'association RNA. Ils peuvent aussi correspondre à deux valeurs différentes du même type d'identifiant. Dans ce cas et sauf cas très particuliers, un des deux identifiants est alors une erreur de déclaration. En comparant les noms déclarés par l'entreprise et celui de l'annuaire officiel, on identifie efficacement les identifiants absurdes. C'est pourquoi nous n'avons pas inclus les identifiants dans la définition des comptes bénéficiaires.
Ce choix technique permet d'identifier 18 déclarations qui ne sont pas identifiées par Transparence Santé. C'est-à-dire, il y a 18 déclarations qui ont la même entreprise et le même nom que des déclarations déjà identifiées, mais pour lesquelles le siren n'est pas renseigné (17 cas) ou le siret est renseigné à la place du siren (1 cas). Ces 18 déclarations représentent 333 009 euros.
Il existe également dans la base Transparence Santé des déclarations pour lesquelles les noms correspondent sans ambiguïté (pour nous humains) à l'association ACTIV mais avec aucun identifiant de déclaré, ou un identifiant dans un format non normalisé. Ce deuxième cas, déjà présent dans la section précédente, est traité de manière automatique par notre traitement quotidien. À travers l'exploration des données, nous avons identifié différents types de variantes pour renseigner le siren que nous sommes capables de normaliser. Par contre, EurosForDocs ne possède pas de traitement automatique pour attribuer un siren à un bénéficiaire. Nous pouvons seulement identifier les différents noms qui correspondent à l'association ACTIV et forcer le siren manuellement sur chaque compte bénéficiaire associé. Ainsi, 8 comptes bénéficiaires ont été liés à ACTIV manuellement. Ces comptes représentent les 61 déclarations restantes pour un total de 4 104 169 euros.
Cette étude de cas montre les différences que l'on peut attendre d'une comparaison entre Transparence Santé et EurosForDocs. Le travail de qualité de données effectué permet de cibler plus efficacement les déclarations, en particulier grâce à la normalisation des différents comptes d'un même bénéficiaire.