Projet Loracrafft
image (c) Antoine Morandi
Le but du projet Loracrafft (avec deux "f"), lancé en 2022, est de construire une application en php/Python/Pillow/Keras (pour le proof of concept) disponible sur le Web pour déchiffrer et traduire, à partir de photos, des textes écrits en égyptien hiéroglyphique du Moyen Empire (pour commencer) vers le français et l'anglais.
Dans un premier temps, les images représentant les textes à traduire seront fournies par l'utilisateur via un téléchargement. Dans un deuxième temps, elles pourraient être issues de clichés pris avec un smartphone ou une tablette, lorsque l'application aura été convertie en un langage utilisable sous Androïd et macOS (lire l'état de l'art selon le chat Gépété et son avis sur le projet).
Le projet est découpé en sujets de réflexion (phases) de la façon suivante :
phase 1 : disponibilité des textes source
phase 2 : conversion du texte source en images de haute qualité à traiter par la machine (ordinateur, tablette, smartphone, etc.)
phase 3 : reconnaissance du signe indicateur du sens de lecture
phase 4 : reconnaissance des signes de façon groupée (cadrats...)
phase 5 : classification grammaticale
phase 6 : découpage en mots
phase 7 : conversion des mots en codes MdC
phase 8 : translittération
phase 9 : traduction en français/anglais
phase 10 : lecture audio du texte résultant
L'idée derrière la conception de cette application est de fédérer des "buildings blocks" déjà existants pour réaliser certaines des phases ci-dessus :
Pour la phase 4, nous pensons à l'outil Tomb Reader de Morris Franken et Jan van Gemert
Pour les phases 5 et 6, nous pensons suivre les travaux de Serge Rosmorduc
Pour les phases 3 et 7, nous pensons à l'outil Hieroglyphs AI de Evgeniy & Alexander Sulimov
Pour la phase 8, un tel tableau existe déjà, aimablement fourni par Raymond Monfort
Pour la phase 9, votre serviteur en a déjà commencé la production à partir de l'annexe "Lexique égyptien-français" de l'ouvrage de Jean-Pierre Guglielmi, L'égyptien hiéroglyphique, (c) 2021 Méthode Assimil, avec autorisation écrite (pourrait être intelligemment remplacé par une version online du Faulkner telle qu'elle existe sur le site du Projet Rosette).
En ce qui concerne la phase 10, nos ordinateurs se chargeront du travail sans nous...
Rappel de la problématique[1]
A - un signe peut être :
B - l'écriture hiéroglyphique se caractérise par l'absence
C - l'image d'un signe peut être altérée
D - un cadrat peut contenir plusieurs signes
E - distinguer cartouches, sérekh et hout
F - nécessité d'un corpus (de signes, de mots entiers, les deux ?)
G - nécessité de déterminer l'époque du texte pour en connaître les spécificités linguistigues
H - détermination des contextes temporels (perfectif, imperfectif)
I - propositions à prédicat adverbial vs nominal, avec ou sans lexèmes.
K - certains signes peuvent être abrégés, tel N25 : en
(page en cours de mise à jour permanente au fil de l'étude)
Lire notre Paper publié le 12 janvier 2025. Une revue des publications sur le sujet est maintenant disponible dans notre forum.
[1] Sources : Cours d'égyptien hiéroglyphique, Grandet-Mathieu (Khéops) / L'égyptien hiéroglyphique, JP Guglielmi (Assimil) / Cours d'épigraphie égyptienne, P. Le Guillou (association Imhotep) / Grammaire raisonnée de l'égyptien classique, Malaise-Winand (université de Liège) / publications académiques diverses.
[accueil]
page mise à jour le 19/01/2025 14:43 |