scholarly journals Générer un jeu de données structuré à partir d’un texte océrisé

Author(s):  
Jon Crump

Ce tutoriel présente des stratégies pour traiter la sortie OCR brute issue d’un texte scanné, l’analyser afin d'isoler et de corriger les éléments essentiels des métadonnées, et générer un ensemble de données structuré (un dictionnaire Python) à partir de celle-ci.

Sign in / Sign up

Export Citation Format

Share Document