Décideurs it

GIP-MDS : quand l’IA permet aux humains de se focaliser sur l’essentiel

Par Bertrand Lemaire | Le | Cas d’usage

Le GIP-MDS (Groupement d’Intérêt Public Modernisation des Déclarations Sociales) contrôle le bon déroulement des traitements des déclarations obligatoires des entreprises avec de l’IA pour éliminer les faux incidents. Youssef Kilany, directeur de l’architecture et de la production de Net-entreprises.fr au GIP-MDS, explique ici les enjeux et les modalités du projet mené avec Splunk.

Youssef Kilany est directeur de l’architecture et de la production de Net-entreprises.fr au GIP-MDS. - © GIP-MDS
Youssef Kilany est directeur de l’architecture et de la production de Net-entreprises.fr au GIP-MDS. - © GIP-MDS

Pouvez-vous, tout d’abord, nous présenter le GIP-MDS (Groupement d’Intérêt Public Modernisation des Déclarations Sociales) que peu de gens connaissent même en utilisant le portail Net-entreprises.fr ?

Notre GIP regroupe une quarantaine d’organismes de la sphère sociale (Urssaf, Pôle Emploi, Unedic, etc.), des organisations patronales, des syndicats de salariés, le Conseil de l’Ordre des Experts-Comptables, etc. Il a été créé en 2000 pour mettre en œuvre le portail Net-entreprises.fr. L’objectif reste de simplifier la vie des entreprises en leur offrant les procédures les plus automatisées possible.

Nous avons notamment mis en œuvre la DSN (Déclaration Sociale Nominative) qui remplace environ 70 procédures.

Nous avons également des conventions avec la DGFiP (pour traiter le prélèvement à la source de l’impôt sur le revenu) et d’autres administrations. Statutairement, les administrations d’Etat ne peuvent pas être membres du GIP, d’où l’existence de conventions dans leur cas. 

Nous recevons environ cinq millions de déclarations par mois (avec des pics à 900 000 par jour). 93 % des déclarations passent désormais par nos API utilisées par les logiciels de gestion de la paie. Les données que nous collectons sont ensuite transmises aux différents organismes sociaux et à la DGFiP selon leurs usages.

Pour effectuer ces traitements, quelle est l’architecture générale de votre SI ?

Notre architecture est distribuée entre trois grands hébergements : notre hébergement propre, celui à la CNAV et celui à l’Urssaf. Nous assurons une maîtrise d’ouvrage de l’ensemble pour garantir que tout fonctionne bien.

De ce fait, que supervisez-vous ?

Au niveau des infrastructures, chaque propriétaire supervise la sienne. Mais, nous, nous faisons ce que nous appelons de l’« hypervision ». Nous devons vérifier que les flux de données qui rentrent arrivent à la bonne destination, à la bonne base de données.

Nous suivons donc en temps réel chaque déclaration avec un état de son traitement. Nous pouvons dire si telle déclaration est bloquée et, si oui, à tel endroit. Un blocage peut être normal, lié à une règle de gestion, ou pas. Nous avons un état des lieux chaque matin de ce qui s’est passé la veille. Et notre équipe vérifie l’état des traitements.

Au lieu d’attendre qu’une entreprise remonte une anomalie, une absence d’accusé de réception, etc., d’être réactif à un appel, nous sommes pro-actifs et nous traitons donc les anomalies au plus tôt.

Rappelons que les déclarations (notamment la DSN) génèrent des droits aux citoyens et qu’un blocage peut avoir des conséquences préjudiciables pour de vrais humains.

Le projet présenté lors du Mois de l’Innovation Publique

La dixième édition du « Mois de l’Innovation Publique » aura lieu du 2 au 30 novembre 2023. Cette manifestation annuelle vise à « partager méthodes, solutions et expérimentations qui transforment durablement l’action et les services publics » dans un but de transparence vis-à-vis des citoyens mais aussi d’exemplarité des bonnes idées.

Dans ce cadre, le GIP-MDS présentera lors d’un webinar en direct l’hypervision de son SI le 22 novembre 2023 à 17h. Ce webinar sera intitulé : « IA dans Hypervision, un exemple réussi pour la collecte et l’usage de millions de données sociales ».

IA dans Hypervision, un exemple réussi pour la collecte et l’usage de millions de données sociales - © GIP MDS
IA dans Hypervision, un exemple réussi pour la collecte et l’usage de millions de données sociales - © GIP MDS

Quelle technologie employez-vous pour cela ?

Nous avons d’abord essayé de tracer les événements dans une base de données relationnelle mais nous avons vite atteint les limites de cette approche. Nous nous sommes donc tournés vers une solution de type Big Data. Nous avons alors procédé à plusieurs tests.

Nous avons finalement choisi la solution de Splunk parce que celle-ci va, en même temps, stocker les événements et permettre de les comparer. Par exemple : telle déclaration est arrivée sur tel serveur à telle heure et, x temps plus tard, son traitement n’est pas achevé alors qu’il aurait dû. Si le temps de traitement est supérieur à ce qui est normal, cela est noté comme un incident. Le moteur de comparaison et le langage approprié pour définir les alertes sont intégrés nativement à Splunk.

Pourquoi avoir ajouté de l’intelligence artificielle pour traiter des incidents qui semblent simples ?

Effectivement, le comparatif est du procédural simple. Mais, le problème est qu’il peut y avoir beaucoup de faux positifs. Le premier système peut estimer qu’une déclaration est bloquée et qu’il faut donc examiner le problème alors qu’en fait il n’y a aucun incident.

Quand on a des pics de 900 000 déclarations par jour, il peut y avoir des milliers d’incidents remontés. Pour nos cinq exploitants, il est impossible de tous les regarder unitairement.

Nous avons donc mis en place une intelligence artificielle pour détecter les vrais et les faux incidents. Et l’apprentissage machine progressif permet d’affiner cette détection de manière de plus en plus fiable. Les exploitants peuvent alors se consacrer d’une part aux vrais incidents et d’autre part à des tâches à plus forte valeur ajoutée.

Quel a été le calendrier du projet ?

Nous avons mis en œuvre Splunk en 2021. Fin 2022, nous avons testé l’IA sur le prélèvement à la source de l’impôt sur le revenu parce que ce traitement est hébergé chez nous. Le test a été jugé concluant et la version 1 a été mise en production au début de l’été 2023. Nous sommes actuellement en train d’étendre cette solution à la DSN.

Quel bilan tirez-vous ?

Tout d’abord, cette approche a permis une approche industrielle du traitement des incidents.

En première analyse, nous pouvons dire que, sur une moyenne de 200 incidents détectés par mois, moins de 5 % sont de vrais incidents.

Quelles sont les prochaines étapes ?

Tout d’abord, nous sommes en train de généraliser cette approche aux centres partenaires. Ensuite, nous utiliserons sans doute celle-ci pour d’autres tâches au sein du GIP-MDS.

DSN : une simplification qui simplifie, c’est mieux…

« Plusieurs mesures ont contribué, depuis 2017, à la simplification de l’activité des entreprises. La plus réussie est incontestablement la Déclaration Sociale Nominative (DSN) » note le Sénat dans un rapport d’information paru le 15 juin 2023. Ce rapport fustige l’inflation normative (c’est à dire le nombre considérable de textes ayant une valeur juridique) subie par les entreprises et les échecs répétés des différents gouvernements à simplifier les pratiques administratives, entraînant des coûts de gestion des procédures importants dans les entreprises. La DSN, elle, bénéficie d’un satisfecit. Elisabeth Humbert-Bottin, directeur général du GIP-MDS, était revenue sur Républik-IT Le Média sur la mise en oeuvre et les apports de la DSN (Déclaration Sociale Nominative).


Sur le même sujet

- Elisabeth Humbert-Bottin (GIP-MDS) : « le numérique, ce n’est pas magique »

- Sur le site du Mois de l’Innovation Publique : IA dans Hypervision, un exemple réussi pour la collecte et l’usage de millions de données sociales.


Interview vidéo de Youssef Kilany

Républik IT a été partenaire, dans le cadre du Mois de l’Innovation Publique, de la présentation de Youssef Kilany.