Système de création d’unités éditoriales à partir des documents plein texte vers des documents semi structurés en XML

Ben salah, Mohamed amine; Ould larbi, Amine

Please use this identifier to cite or link to this item: http://localhost:8080/xmlui/handle/123456789/3491

Full metadata record

DC Field	Value	Language
dc.contributor.author	Ben salah, Mohamed amine	-
dc.contributor.author	Ould larbi, Amine	-
dc.date.accessioned	2019-11-27T08:07:15Z	-
dc.date.available	2019-11-27T08:07:15Z	-
dc.date.issued	2019	-
dc.identifier.uri	http://di.univ-blida.dz:8080/jspui/handle/123456789/3491	-
dc.description	ill.,Bibliogr.	fr_FR
dc.description.abstract	La plupart des documents du patrimoine arabe sont des fichiers de texte soient composés de textes non organisés Ou bien ils ont une structuration (physique et logique) qui ne permet pas l'identification et l'exploitation. Notre travail consiste à proposer une approche pour réaliser des conversions Les document de patrimoine arabe vers des documents semi structuré en XML. Ce projet est réalisée en deux étape la première étape consiste à l’extraction des métadonnées titre auteur maison édition … par trois étape premier étape les règles de font, la deuxième les règles linguistique, et le dernier les expressions régulière et la seconde étape de notre projet c’est la détermination la structure des documents de patrimoine arabe en fonction de leur table des matières par étude de plusieurs livre avec création un DTD XML pour examiner les livre après la conversion a la fin nous avons fait des expérimentation sur plusieurs livres de patrimoine arabe et les résultats obtenus sont meilleurs. Mots clé : document semi structuré, métadonnée, XML, corpus CNDA, traitement automatique de langue ,la langue arabe. Most of the Arab heritage documents are text files that are composed of unorganized texts Or they have a structuring (physical and logical) that does not allow identification and exploitation. Our job is to propose an approach to achieve conversions Arab heritage document to semi structured documents in xml. This project is carried out in two stages The first step is to extract the metadata title author house edition ... by three step first step the rules of font, the second the rules language, and the last the regular expressions and the second step of our project is the determination of the structure of the Arab heritage documents according to their table of contents by study of several books with creating a xml DTD to examine the books after the conversion in the end we did experimentation on several books of Arab heritage and the results obtained are better. Keywords: semi structured document, metadata, xml, corpus CNDA automatic language processing, Arabic language.	fr_FR
dc.language.iso	fr	fr_FR
dc.publisher	Université Blida 1	fr_FR
dc.subject	document semi structuré	fr_FR
dc.subject	métadonnée	fr_FR
dc.subject	XML	fr_FR
dc.subject	corpus CNDA	fr_FR
dc.subject	traitement automatique de langue	fr_FR
dc.subject	a langue arabe	fr_FR
dc.subject	semi structured document	fr_FR
dc.subject	metadata	fr_FR
dc.subject	xml	fr_FR
dc.subject	corpus CNDA automatic language processing	fr_FR
dc.subject	Arabic language	fr_FR
dc.title	Système de création d’unités éditoriales à partir des documents plein texte vers des documents semi structurés en XML	fr_FR
dc.type	Thesis	fr_FR
Appears in Collections:	Mémoires de Master

Files in This Item:

File	Description	Size	Format
ben salah Mohamed amine(Système de création d’unités éditoriales....pdf		1,54 MB	Adobe PDF	View/Open

Show simple item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets