Premium

La VUB développe un logiciel destiné à améliorer la numérisation de documents anciens

Les documents papier ont ceci d'embêtant qu'ils sont de moins en moins lisibles avec le temps. Ce qui peut poser de gros problèmes quand on veut numériser d'anciennes archives.

D'ambitieux projets de digitalisation sont actuellement en cours dans le monde du patrimoine culturel. D'énormes quantités de vieux journaux et de pièces manuscrites doivent ainsi être scannés et convertis sous forme électronique par OCR (reconnaissance optique de caractères). Cette opération est essentielle pour obtenir des documents " interrogeables " et rendre ainsi l'information beaucoup plus aisément accessible. L'OCR est toutefois loin d'être parfaite. Les algorithmes utilisés ont du mal avec les pages abîmées, par exemple, déchirées ou tachées. En outre, l'ordinateur peut perdre le fil dans les mises en page alambiquées des publicités et des magazines de mode.

Apprendre à regarder comme les gens voient

Sous la conduite de la Prof. Dr Ann Dooms, Lu a mis au point des " modèles d'homogénéité " qui aident l'ordinateur à parfaire sa reconnaissance du texte. Ceux-ci ont été développés et exploités dans le cadre de différents scénarios visant à résoudre une série de problèmes, relatifs notamment à la segmentation des documents, à la reconnaissance des distorsions et à l'évaluation de la qualité. Ce pour quoi le doctorant a pu s'appuyer sur l'état actuel des connaissances concernant la manière dont le cerveau humain perçoit les compositions compliquées. Lu : " La psychologie de la forme (Gestalt) nous apprend, par exemple, que les gens ont tendance à regrouper les objets de même nature. Étant dépourvus de cette capacité, les ordinateurs éprouvent plus souvent des difficultés à reconnaître le texte dans les mises en page complexes ou les zones abîmées. Contrairement aux humains, ils ne sont pas capables de recombiner les différents éléments d'une image endommagée. " En intégrant les enseignements de la psychologie de la perception dans un modèle probabiliste d'homogénéité du texte local (PLTH), Lu a appris à la machine à gérer les documents de composition difficile et à y reconnaître une grande diversité de détériorations et de déformations.

Prix international pour la reconnaissance documentaire

La recherche de Lu a résolu un certain nombre de problèmes persistants au niveau de la reconnaissance du texte et son travail a permis de démontrer la puissance d'une approche mathématique du traitement d'image. La mise au point de nouveaux modèles mathématiques semble être de nature à libérer le véritable potentiel de la numérisation de documents anciens et précieux. Le logiciel développé par le groupe de recherche Digital Mathematics a été récompensé du prix international ICDAR (International Conference on Document Analysis and Recognition) pour la reconnaissance documentaire.

Wat heb je nodig

Accès GRATUIT à l'article
ou
Faites un essai gratuit!Devenez un partenaire premium gratuit pendant un mois
et découvrez tous les avantages uniques que nous avons à vous offrir.
  • newsletter hebdomadaire avec des nouvelles de votre secteur
  • l'accès numérique à 35 revues spécialisées et à des aperçus du secteur financier
  • Vos messages sur une sélection de sites web spécialisés
  • une visibilité maximale pour votre entreprise
Vous êtes déjà abonné? 

Partagez votre histoire (d'actualité)

Vous avez des informations pertinentes pour nos rédacteurs ? Partagez-les avec nous via ce formulaire.

Signalez-nous des nouvelles

Des nouvelles à partager ?

Vous avez des informations pertinentes pour nos rédacteurs ? Partagez-les avec nous via ce formulaire.

Signalez-nous des nouvelles
Magazine imprimé

Édition Récente
11 mai 2026

Lire la suite

Découvrez la dernière édition de notre magazine, qui regorge d'articles inspirants, d'analyses approfondies et de visuels époustouflants. Laissez-vous entraîner dans un voyage à travers les sujets les plus brûlants et les histoires que vous ne voudrez pas manquer.

Dans ce magazine