Intelligence Artificielle : Le Cercle de la Donnée présente 12 propositions pour une meilleure utilisation de la donnée

Etudes et Documents
Outils
TAILLE DU TEXTE

Pour être « intelligente », l’IA doit utiliser les bonnes données. C’est à partir de ce constat que Le Cercle de la Donnée a formulé 12 propositions, pour une meilleure utilisation de la donnée dans le cadre de projets d’intelligence artificielle. 

Les 12 propositions formulées par le Cercle de la donnée sur l'intelligence artificielle ont le point d’orgue d’une étude documentée intitulée : « IA : décider en toute connaissance de donnée ». Cette étude, fruit de plusieurs mois de réflexion de la part des membres du Cercle, s’appuie notamment sur les interviews réalisées par le think tank de Yann LeCun, chercheur en apprentissage machine, lauréat du Prix Turing 2019, et Guillaume Poupard, directeur général de l’ANSSI.

Dans cette étude, le Cercle de la Donnée a souhaité procéder à un rappel contextuel de la notion « d’intelligence », avant de mener une réflexion sur les dimensions technologique, économique, éthique et juridique de la donnée utilisée dans le cadre de projets
d’intelligence artificielle. Cette approche pluridisciplinaire, chère au Cercle, a permis de faire émerger ces 12 propositions.

Cette étude et ses propositions ont vocation à être largement diffusées et à contribuer au débat public sur ces sujets incontournables, à la fois enjeux de liberté, de prospérité, de compétitivité et de souveraineté française et européenne.

Au-delà des bonnes pratiques promues dans ces propositions, c’est l’émergence d’une véritable filière française et européenne de science de la donnée que le Think Tank appelle de ses vœux, assortie de la définition d’une politique commune sur ce sujet. Avec cette nouvelle publication, le Cercle de la Donnée souhaite contribuer à rendre intelligible cette matière que les professionnels de tous horizons doivent s’approprier.

12 propositions pour une meilleure utilisation de la donnée

1. Définir et constitutionnaliser des principes fondamentaux que les technologies d’IA devront respecter (droits numériques de l’Homme).

2. S’engager dans une réflexion visant à définir des règles éthiques qui puissent s’appliquer dans le monde numérique.

3. Travailler à l’élaboration d’un texte général applicable aux données à caractère non personnel, complétant le Règlement communautaire 2018/807.

4. Définir une politique publique d’investissement massif visant à créer un champion étatique ou européen de l’IA, à l’image des succès créés dans les secteurs aéronautique ou énergétique.

5. Structurer une filière de la science de la donnée aboutissant à l’instauration de nouvelles professions
règlementées.

6. Etudier l’opportunité d’une obligation légale imposant aux fournisseurs d’IA de déposer une documentation permettant d’expliquer le mode de fonctionnement et les résultats produits par l’IA, qui sera approuvée par une autorité publique française ou européenne, préalablement à sa mise en production, laquelle sera dotée de moyens suffisants pour attirer des spécialistes chevronnés.

7. Mettre en place des certifications ou labels qui seront gages de transparence et de confiance pour les utilisateurs.

8. Etablir des référentiels (thésaurus et ontologies) caractérisant des typologies de données en fonction de leur nature (dépendant de la façon dont elle a été captée, inférée ou créée), leur usage (finalité) et leur criticité (sous l’angle de la confidentialité et de la continuité d’activité), pour faciliter l’interopérabilité des systèmes et des activités, et en assurer la diffusion notamment à travers l’école et l’université.

9. Avant toute modélisation impliquant des données, définir le périmètre des données nécessaires et légitimes en s’assurant de leur bonne représentativité.

10. Introduire une phase de contrôle à l’issue du pré-traitement des données afin de s’assurer de leur neutralité et de ne pas introduire de biais.

11. Mettre en qualité (standardisation, exactitude ou représentativité) les données pour s’assurer que le
système fonctionne.

12. Documenter de façon précise l’ensemble des données, du contexte et des traitements qui ont permis de construire le jeu de données et rendre cette documentation accessible à toutes les personnes qui ont à en connaître.