Partager:

Classement automatique

Le classement automatique des documents se fait en plusieurs étapes. La première consiste à reconnaître le type de document : Facture, Délibération, Bulletin de paie….

Ceci peut se faire en posant des questions au moteur d’IA tel que : « peux-tu me dire quel est ce type de document en moins de 10 mots ? » Le moteur d’IA va donner un certain nombre de réponses que le logiciel de GED va interpréter et rapprocher de ses propres typologies.

Une fois le document identifié le logiciel GED va demander à l’IA de rechercher des éléments dans le document : N° de facture, montants, adresses…. Ce sont les métadonnées associées au type de documents.

Ces éléments sont relatifs au type de document et sont paramétrés dans le système de gestion documentaire (GED). Le système de GED connait également la typologie des caractéristiques : Date, Liste de valeurs, nombre… Le logiciel GED doit alors traiter le formatage pour rendre les données compatibles avec son modèle de données.

Une phase de vérification des données est alors nécessaire. Elle peut se faire automatiquement jusqu’à un certain point : cohérence des dates et des montants, vérification par rapport à des listes de valeurs. Présence de certaines caractéristiques dans les données (valeurs, caractères, taille). Le logiciel GED peut alors affecter un niveau de confiance aux métadonnées récupérées.

La phase suivante sera manuelle. La technique consiste à placer les documents classifiés automatiquement dans des bannettes de traitement. Les opérateurs peuvent alors visualiser la proposition faite par l’IA et le niveau de confiance déterminés par le logiciel GED. Ils peuvent effectuer les corrections en visualisant à la fois le document et la proposition de classification.

Les moteurs d’IA possèdent dans leurs modèles fondamentaux les éléments permettant de reconnaître et d’analyser la plupart des documents et ceci dans les langues variées. Si on demande un « numéro de commande » ou un « Purchase order number » les modèles seront retrouver la donnée. Ces modèles ont beaucoup progressé depuis un an et continuent à progresser.

Le problème se pose plus sur la reconnaissance du type de document car il peut y avoir des cas ambigus ou d’autres ou la forme du document n’est pas assez précise. Il peut être aussi nécessaire de reconnaitre finement des documents proches. Par exemple « Délibération du conseil municipal » ou « Délibération du conseil départemental ».
Le logiciel GED doit offrir des règles booléennes permettant de différencier certains types. Par exemple : « contrat et distribution » ou « contrat et licence ».

La mise en place d’une classification automatique permet de gagner beaucoup de temps par rapport à aux outils de RAD/LAD avec apprentissage. Le traitement IA prend moins de 10 secondes et la vérification est inférieure à la minutes dans la majorité des cas.

Il importe cependant de toujours considérer que le moteur d’IA ne donnera qu’une proposition et qu’il s’agit d’une aide qui doit toujours passer par une étape de vérification qu’il ne faudra pas sous-estimer.