Afficher la notice abrégée
dc.contributor.author |
Ben salah, Mohamed amine |
|
dc.contributor.author |
Ould larbi, Amine |
|
dc.date.accessioned |
2019-11-27T08:07:15Z |
|
dc.date.available |
2019-11-27T08:07:15Z |
|
dc.date.issued |
2019 |
|
dc.identifier.uri |
http://di.univ-blida.dz:8080/jspui/handle/123456789/3491 |
|
dc.description |
ill.,Bibliogr. |
fr_FR |
dc.description.abstract |
La plupart des documents du patrimoine arabe sont des fichiers de texte soient composés de
textes non organisés Ou bien ils ont une structuration (physique et logique) qui ne permet pas
l'identification et l'exploitation.
Notre travail consiste à proposer une approche pour réaliser des conversions Les document
de patrimoine arabe vers des documents semi structuré en XML.
Ce projet est réalisée en deux étape la première étape consiste à l’extraction des métadonnées
titre auteur maison édition … par trois étape premier étape les règles de font, la deuxième les
règles linguistique, et le dernier les expressions régulière
et la seconde étape de notre projet c’est la détermination la structure des documents de
patrimoine arabe en fonction de leur table des matières par étude de plusieurs livre
avec création un DTD XML pour examiner les livre après la conversion
a la fin nous avons fait des expérimentation sur plusieurs livres de patrimoine arabe et les
résultats obtenus sont meilleurs.
Mots clé : document semi structuré, métadonnée, XML, corpus CNDA, traitement
automatique de langue ,la langue arabe.
Most of the Arab heritage documents are text files that are composed of unorganized texts Or
they have a structuring (physical and logical) that does not allow identification and
exploitation.
Our job is to propose an approach to achieve conversions Arab heritage document to semi
structured documents in xml.
This project is carried out in two stages The first step is to extract the metadata title author
house edition ... by three step first step the rules of font, the second the rules language, and the
last the regular expressions
and the second step of our project is the determination of the structure of the Arab heritage
documents according to their table of contents by study of several books
with creating a xml DTD to examine the books after the conversion
in the end we did experimentation on several books of Arab heritage and the results obtained
are better.
Keywords: semi structured document, metadata, xml, corpus CNDA automatic language
processing, Arabic language. |
fr_FR |
dc.language.iso |
fr |
fr_FR |
dc.publisher |
Université Blida 1 |
fr_FR |
dc.subject |
document semi structuré |
fr_FR |
dc.subject |
métadonnée |
fr_FR |
dc.subject |
XML |
fr_FR |
dc.subject |
corpus CNDA |
fr_FR |
dc.subject |
traitement automatique de langue |
fr_FR |
dc.subject |
a langue arabe |
fr_FR |
dc.subject |
semi structured document |
fr_FR |
dc.subject |
metadata |
fr_FR |
dc.subject |
xml |
fr_FR |
dc.subject |
corpus CNDA automatic language processing |
fr_FR |
dc.subject |
Arabic language |
fr_FR |
dc.title |
Système de création d’unités éditoriales à partir des documents plein texte vers des documents semi structurés en XML |
fr_FR |
dc.type |
Thesis |
fr_FR |
Fichier(s) constituant ce document
Ce document figure dans la(les) collection(s) suivante(s)
Afficher la notice abrégée