Identification des Langues proches et langues lointaines (Latin versus Arabe)

Benalia, Soumia; Otmani, Marwa

Please use this identifier to cite or link to this item: http://localhost:8080/xmlui/handle/123456789/9552

Full metadata record

DC Field	Value	Language
dc.contributor.author	Benalia, Soumia	-
dc.contributor.author	Otmani, Marwa	-
dc.date.accessioned	2021-02-02T12:07:25Z	-
dc.date.available	2021-02-02T12:07:25Z	-
dc.date.issued	2020-10-08	-
dc.identifier.uri	http://di.univ-blida.dz:8080/jspui/handle/123456789/9552	-
dc.description	ill., Bibliogr.	fr_FR
dc.description.abstract	Notre projet de fin d’étude traite l’Ident ification automat ique des Langues qui est au centre de tous les intérêts de ces dernières années. En effet, ce problème a trouvé des intérêts dans diverses sous-disciplines du Traitement Automatique de la Langue, comme la Traduction Automat ique, la Correction Orthographique, la Recherche d’Information etc. Nous avons concentré sur les principaux défis comme la taille de fragment et la vitesse d’exécution et les langues proches. Pour cela, nous avons utilisé un corpus des données étiquetées qui met ensemble six langues (Français, Anglais, Allemand, Arabe, Ourdou, et Persan). Le choix de ces langues a été motivé par la rareté des travaux qui se sont intéressés à ces langues-ci dans le domaine de Détection de Langue. Ce travail adopte les principales méthodes de classification utilisées en Machine Learning pour s'attaquer à notre problémat ique. En l’occurrence, nous sommes intéressées aux méthodes : Bayésienne, Machine à Vecteurs de Support, Régression Logistique, Forêts aléatoires, Stimulation des gradients, Algorithme des plus Proches Voisins, Arbres de Décision pour but de trouver la meilleure méthode pour identifier une langue. Nous avons aussi testés des approches linguistiques basées sur les lettres et n-grammes des lettres. Notre solution a atteint une précision de 99.98 % pour une phrase et de 81% pour un mot de 3 caractères. Mots clés : Identification de la langue, Classification supervisée, Catégorisation de texte, Reconnaissance de la langue, machine Learning, N-gramme, identification linguistique.	fr_FR
dc.language.iso	fr	fr_FR
dc.publisher	Université Blida 1	fr_FR
dc.subject	Identification de la langue	fr_FR
dc.subject	Classification supervisée	fr_FR
dc.subject	Catégorisation de texte	fr_FR
dc.subject	Reconnaissance de la langue	fr_FR
dc.subject	machine Learning	fr_FR
dc.subject	N-gramme	fr_FR
dc.subject	identification linguistique	fr_FR
dc.title	Identification des Langues proches et langues lointaines (Latin versus Arabe)	fr_FR
dc.type	Thesis	fr_FR
Appears in Collections:	Mémoires de Master

Files in This Item:

File	Description	Size	Format
Benalia Soumia et Otmani Marwa ( Identification de la langue....pdf		3,27 MB	Adobe PDF	View/Open

Show simple item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets