J’inaugure une série de notes pour banaliser les différentes technologies mises en oeuvre lorsqu’on parle d’ECM (Enterprise Content Management) et de BPM (Business Process Management). Il s’agira de brêves, exposant en quelques phrases de quoi il en retourne sur un sujet donné. Ces notes pourront être complétées de tous vos commentaires et ajouts, il ne tient qu’à vous de participer !
Pour commencer donc, le sujet du jour : Imaging et Capture.
Il s’agit là de tout ce qui touche, de près ou de moins près, à l’acquisition, au stockage, à la gestion et à la mise à disposition des documents électroniques.
Ces documents peuvent être issus de la dématérialisation (ou numérisation ou scannérisation), il peut aussi s’agir de documents électroniques d’origine bureautiques (traitement de texte, tableurs, présentations, bases de données, messages électroniques), de télécopies (fax), de flux d’impression (éditiques, COLD), de flux EDI, de formulaires électroniques. La liste est non limitative.
On fait appel à un vocabulaire à peu près normalisé pour désigner :
- un document, composé d’une ou plusieurs pages
- une page, élément unitaire, souvent appellé ‘image’
- un dossier, conteneur de classement logique des documents
- un pli, contenant un ou plusieurs documents
- des métadonnées, caractérisant le document
Les documents une fois acquis par une « chaîne d’acquisition » ou « chaîne de numérisation » sont stockés dans un référentiel documentaire ou système de GED. Leurs métadonnées viennent alimenter un catalogue qui permet de les retrouver ultérieurement.
On parle d’opérations de :
- scan, ou numérisation d’un document papier par le scanner
- import de fichiers, ou prise en compte d’un ou plusieurs documents déjà numérisés
- assemblage, ou regroupement de pages unitaires en document
- indexation, ou caractérisation des documents
- commit, ou stockage des documents dans le référentiel de contenus
On peut utiliser des fonctionnalités complémentaires telles que les suivantes.
- traitement d’images : amélioration des images numérisées avec opérations de détection de codes à barres optionnelles
- vérification d’images : contrôle qualité permettant de refuser une page mal numérisée
- vidéocodage : saisie semi-automatique des métadonnées
- détection de pages blanches : suppression des délimiteurs de documents au sein d’un lot ou des pages sans intérêt
- OCR zonal ou Plein texte : indexation du contenu textuel des pages reconnu à l’aide d’un moteur d’OCR
- LAD : lecture automatique des documents pour extraction des métadonnées
- RAD : reconnaissance automatique des documents pour faciliter le travail d’indexation
Les outils d’Imaging et de Capture sont généralement intimement liès aux progiciels de Gestion Documentaire ou d’ECM et fournis par les mêmes éditeurs ou par des éditeurs spécialisés.
merci pour ce blog et la qualité de vos informations, continuez et ravi de votre élection chez orange !
bonjour et bravo pour ce blog!
Beaucoup d’articles interessants…
A+