Suivez-nous sur Twitter Suivez-nous sur Facebook VQ  velo.qc.ca 
Reportages

Écritures non déchiffrées - À la recherche des langues perdues

Par Marine Corniou - 16/02/2017


Quelques textes venus du fond des âges résistent encore et toujours au décryptage. Comment les déchiffrer ? Informaticiens et linguistes planchent sur la question.
 

Du haut du mont Djebel Barkal, la vue sur le Nil est imprenable. Le fleuve légendaire serpente au milieu du désert ocre qui s’étend à perte de vue. À l’ouest, se dresse une grappe de pyramides majestueuses. Ce sont des tombeaux royaux qui témoignent d’une époque révolue depuis plus de 2 000 ans.

Car c’est sur ce site, dans l’actuel Soudan, que fut érigée la métropole religieuse de Napata, au cœur du « pays de Koush ». Ce dernier correspond à un territoire situé au sud de l’Égypte, sur lequel a régné la civilisation koushite pendant presque 3 000 ans, entre le XXVe siècle avant notre ère et l’an 400.

Grâce à leur position stratégique, entre la mer Rouge et l’Afrique subsaharienne, les « pharaons noirs » contrôlaient les voies commerciales où circulaient or, ivoire, ébène, bétail, peaux de fauve ou plumes d’autruche. Profitant d’une agriculture prospère, d’armées redoutables et d’une administration structurée, ils maîtrisaient aussi l’écriture, que l’on appelle « méroïtique » (du nom du royaume de Méroé, le dernier de la civilisation koushite).

Mais cette écriture, même si elle peut être déchiffrée, reste désespérément incompréhensible. « Il s’agit d’une écriture phonétique : les textes peuvent donc être lus, mais pas traduits. C’est comme si on vous donnait à lire du hongrois : vous pourriez le déchiffrer, mais pas en saisir le sens », explique Claude Rilly, égyptologue et linguiste au Centre national de la recherche scientifique en France.

Seul spécialiste au monde de l’écriture méroïtique, ce chercheur essaie depuis 30 ans de percer le secret de la langue. Mais, à l’exception de quelques noms de rois, de dieux et de lieux, la langue des Koushites, qui ont pendant un temps régné sur l’Égypte, reste impénétrable. « On connaît environ 140 mots en méroïtique, la plupart empruntés à l’égyptien. Or, pour comprendre une langue, il faut en connaître 2 000 », indique-t-il.

Une poignée de mystères

Des mystères comme ceux-là, il en subsiste quelques-uns. Et, forcément, ils fascinent et frustrent les historiens, comme autant de fenêtres sur le passé qu’ils sont incapables d’ouvrir. Comment restituer une langue parlée il y a quatre millénaires et dont on a tout oublié ? Le défi est de taille, c’est peu dire.

Prenons l’étrusque, par exemple. Comme le méroïtique, cette langue résiste farouchement au décryptage. Elle est celle d’une civilisation raffinée, centrée sur la Toscane actuelle, ayant existé avant l’Empire romain. L’écriture est empruntée au grec ancien, et on parvient donc à en lire les lettres; la langue, en revanche, est une énigme. Elle n’appartient à aucun groupe linguistique connu. « C’était la langue dominante en Italie, puis elle a été remplacée par le latin pour des raisons socio-politico-économiques, précise Claude Rilly. C’est la même chose pour le méroïtique : il a disparu sans descendance. » Ainsi, la langue est morte avec le pays de Koush, lorsque celui-ci a été envahi par les Nubiens de l’ouest du Soudan vers l’an 350, en y imposant leur propre langue. Rien de très original, là : des milliers d’autres dialectes ont disparu sans laisser de traces au fil de l’histoire (notons que, encore aujourd’hui, une langue disparaît sur la planète tous les 15 jours).

Contrairement à l’égyptologue Jean-François Champollion qui s’est aidé de la pierre de Rosette, où figure le même texte rédigé en égyptien et en grec ancien, pour déchiffrer les hiéroglyphes au XIXe siècle, personne n’a trouvé de clé bilingue afin de comprendre le méroïtique ou l’étrusque.

« Mais il y a des défis encore plus grands : ce sont les textes dont on ne connaît ni l’écriture ni la langue », indique le Britannique Andrew Robinson, auteur de plusieurs ouvrages sur les langues et les écritures perdues. « En effet, là, pour déchiffrer, c’est mal parti. En comparaison, je m’estime presque chanceux ! » s’amuse Claude Rilly.

Des flopées d’archéologues se sont ainsi creusé les méninges sur le disque de terre cuite de Phaistos, trouvé en Crète en 1908, sur lequel sont gravés 241 symboles en spirale. Ou encore sur le linéaire A, une écriture composée de 85 signes, utilisée aussi en Crète par les prédécesseurs des Grecs et retrouvée sur quelques tablettes en argile. Dans ces deux cas, on n’a aucune idée de la langue parlée par les « scripteurs ».

Mais l’énigme préférée d’Andrew Robinson reste le rongo-rongo de l’île de Pâques, dont on connaît 26 textes gravés sur des tablettes en bois. « Cette écriture est exquise sur le plan artistique et totalement déconcertante. A-t-elle été introduite par les premiers Polynésiens qui ont colonisé l’île, inventée indépendamment, ou créée après l’exposition des habitants à l’écriture européenne en 1722 ? Personne ne le sait », indique cet ancien professeur invité au Wolfson College, à Cambridge.

La logique des écritures

Il faut dire que si l’écriture est une des inventions les plus géniales de l’humanité, elle est aussi une des plus complexes. Ainsi, elle peut s’appuyer sur un alphabet, un syllabaire (où les symboles représentent des syllabes), un système pictographique (comme les hiéroglyphes égyptiens) ou logographique (les caractères correspondent à des mots, comme en chinois).

Il existe aussi des abjads, où les voyelles ne sont pas écrites. C’est le cas des alphabets arabe et hébreu. « Le méroïtique, quant à lui, est un alphasyllabaire. Cela signifie qu’il note les consonnes, mais que la voyelle “A” est toujours implicite. Si l’on veut écrire un “O” ou un “I”, par exemple, un caractère spécial doit être ajouté pour modifier le son », détaille Claude Rilly. Et comme si ce n’était pas assez compliqué, il existe deux formes d’écriture méroïtique : une hiéroglyphique, utilisée sur les lieux de culte, et une cursive qui a servi à rédiger 90 % des 1 000 textes connus.

Enfin, le sens de lecture, lui aussi, peut varier. Autant dire qu’on ne sait pas par quel bout prendre certains gribouillis… Et qu’on se demande même, dans certains cas, si on a bien affaire à des signes ayant un sens.

C’est ici que la technologie peut donner un sérieux coup de pouce. « L’informatique ne pourra pas déchiffrer les écritures à notre place, mais elle peut nous faire gagner du temps en effectuant des tris et des calculs statistiques rapidement », affirme Claude Rilly. Car n’en déplaise aux littéraires qui détestent les maths, toutes les langues ont une logique, une rythmique qui ne laisse rien au hasard.

« En anglais par exemple, la lettre “Q” est presque toujours suivie d’un “U”. Jamais d’un “X” ou d’un “Z”. Tout cela peut être intégré dans un modèle statistique dit des chaînes de Markov », explique Mayank Vahia, du Tata Institute of Fundamental Research à Mumbai, en Inde.

En 2009, son équipe a passé au « moulinet » statistique une des écritures les plus étranges qui soient, celle de la vallée de l’Indus. Elle est l’œuvre d’une civilisation très avancée qui occupait le Pakistan actuel et le nord-est de l’Inde et qui a subitement disparu vers 1900 avant notre ère. Des habitants de l’Indus, on sait très peu de choses, mais on a retrouvé environ 5 000 inscriptions, comptant entre 400 et 700 signes, dont des personnages et un mystérieux taureau-licorne (voir notre entrevue).

Or la plupart des textes ont été trouvés sur des sceaux et des poteries, et ne combinent que 5 signes en moyenne; le plus long en compte 21. Plusieurs chercheurs ont donc remis en question le fait qu’il puisse s’agir d’une écriture. Les travaux de Mayank Vahia ont toutefois prouvé qu’il n’y a là rien d’aléatoire. « Nous sommes sûrs qu’il s’agit d’inscriptions structurées avec une grammaire, avec certains signes qui sont plus souvent placés à la fin », poursuit-il.

Trouver la clé

De quoi percer le secret de l’Indus ? Hélas non. Tant qu’on ne saura rien de la langue que parlaient les quelque 5 millions « d’Harappéens » (soit 10 % de la population mondiale de l’époque !), leurs messages resteront cryptés.

Ce n’est pas pour rien que les Américains ont employé des Navajos pour coder leurs messages pendant la Deuxième Guerre mondiale : personne, ou presque, ne connaissait leur dialecte. La langue, c’est la clé de l’énigme !

D’ailleurs, c’est surtout grâce à ses connaissances en copte, une langue ayant un lien avec celle des pharaons, que Champollion a trouvé la clé des hiéroglyphes. Idem pour les glyphes mayas, que l’on a pu partiellement déchiffrer depuis 30 ans en les rattachant à certains dialectes amérindiens, ou pour le linéaire B, trouvé en Crète et déchiffré en 1952 par l’architecte anglais Michael Ventris. « Il a dû faire un pari sur la langue, en supposant qu’il s’agissait de grec ancien. Personne ne le croyait, mais c’est ce qui a permis de déchiffrer cette écriture, précise Claude Rilly. Pour l’Indus, c’est compliqué. Certains partent du principe que c’est une langue dravidienne, du type de celles qu’on parle au sud de l’Inde, et qui était utilisée plus au nord dans le passé. »

Car les langues sont comme ceux qui les parlent. Elles se déplacent, évoluent au fil des générations, se transforment, se mélangent… et disparaissent parfois. Les langues qui, aujourd’hui, ont des liens de parenté entre elles ont un ancêtre commun, une langue originelle dont elles descendent toutes. Comme le latin qui, entre autres, est le « père » du français, de l’italien et de l’espagnol.

Retrouver cet ancêtre, c’est ce que s’acharne à faire Claude Rilly dans l’espoir de comprendre le méroïtique. « Je n’ai pas d’autre choix que d’aller sur place, au Soudan, et de rencontrer différents peuples pour comprendre et documenter leurs langues », explique-t-il.


Écriture méroïtique

En 2003, le linguiste a réussi à démontrer que le méroïtique appartenait au sous-groupe des langues « soudaniques orientales nord ». Il étudie actuellement une vingtaine de ces idiomes, parlés depuis le Darfour jusqu’au Tchad, en passant par l’Érythrée. Un travail de moine, mené dans des zones pas toujours accessibles. « Je vais à la rencontre des locuteurs, avec un enregistreur et un carnet. Ce sont des langues qui n’en ont plus pour longtemps à vivre et qui n’ont jamais été décrites », dit-il. Il crée des lexiques, élabore des grammaires et compare le vocabulaire, pour essayer de reconstituer la langue originelle dont est issue cette famille. Un peu comme s’il essayait de faire renaître le latin en connaissant seulement quelques mots d’espagnol et de français.

« La découverte de la famille linguistique est un gros progrès, mais ce n’est pas la panacée. Ces langues ont des structures simples, peu de consonnes, des racines très courtes et beaucoup d’homonymes », soupire le chercheur. À ce jour, il a pu reconstituer une douzaine de mots, notamment le terme abede, qui signifiait « dieu créateur ».

De son côté, Greg Kondrak cherche aussi à deviner la langue qui se cache derrière les écritures non déchiffrées. Son but : mettre au point un outil de traduction « universel », fondé sur des algorithmes complexes. Le terrain de jeu de ce professeur au département d’informatique de l’université d’Alberta, c’est le manuscrit de Voynich, un livre du XVe siècle dont on ignore tout. Il recèle des dessins de plantes et de femmes nues, des symboles astrologiques et des textes rédigés dans un alphabet inconnu. « Nous avons eu l’idée d’adapter les algorithmes développés pour la traduction automatique et de les appliquer à ce manuscrit », explique ce passionné de langues qui a opté pour l’informatique, car elle permet de mener des recherches « plus innovantes que la linguistique ».

Avec son étudiant Bradley Hauer, il a publié en 2016 un article proposant trois méthodes de décryptage capables, en théorie, de « trouver le langage qui se cache derrière n’importe quel message crypté ». Pour ce faire, ils ont pris le problème à l’envers : ils ont crypté eux-mêmes des textes, puis ils ont « appris » à l’ordinateur à retrouver tout seul la langue de départ.

Ils ont ainsi commencé par modifier des textes écrits dans une multitude de langues en remplaçant chaque lettre de l’alphabet par une autre (par exemple, tous les «A» deviennent des «B», tous les «B» des «C», etc.). Cette méthode de cryptage, très ancienne, est appelée substitution monoalphabétique.

Les informaticiens ont aussi mélangé les lettres au sein des mots, au cas où l’auteur aurait voulu jouer un tour à ses lecteurs. « Il semble que les symboles soient placés de façon un peu étrange dans les mots du manuscrit de Voynich, comme si les lettres avaient été délibérément brouillées », observe Greg Kondrak. Puis, les deux comparses ont bidouillé des algorithmes capables de comparer la « rythmique » des lettres et des mots de chaque texte codé à celle des langues connues. « Nous avons testé la meilleure de nos méthodes avec 380 langues et elle permet de retrouver la bonne dans 97 % des cas », précise-t-il.

Ce cryptage simple peut, selon le chercheur, « mimer » n’importe quel système d’écriture. « Notre postulat, c’est que, dans toutes les écritures non déchiffrées, chaque son (lettre ou syllabe) est désigné par un symbole unique. C’est une approximation mais, en général, c’est exact », explique-t-il. Autrement dit, peu importe la lettre qu’on choisit, elle « code » pour un phonème, c’est-à-dire pour une unité qui permet de découper les sons dans un langage donné et, donc, de l’écrire. La modélisation de Greg Kondrak n’est pas parfaite, mais elle est efficace, même si les alphabets de départ et d’arrivée sont de longueurs différentes.

Fort de ce constat, il a fait subir le test au manuscrit de Voynich (ou plutôt à sa version numérisée). Bilan ? « Une des langues d’origine les plus probables est l’hébreu. La correspondance n’est pas parfaite, mais nous avons comparé avec de l’hébreu moderne, pas de l’hébreu médiéval. Dans tous les cas, c’est une bonne piste », se réjouit l’informaticien.

Il n’a pas les connaissances afin de poursuivre l’enquête : il a donc rendu ses algorithmes publics et il passe maintenant le flambeau aux linguistes et autres « décrypteurs » de tout poil. Et ce n’est pas ce qui manque ! Le manuscrit de Voynich, jalousement gardé à la bibliothèque de l’université Yale, alimente bien des fantasmes depuis sa découverte dans une communauté jésuite italienne en 1912, même si certains linguistes sont persuadés que l’ouvrage est un canular. C’est le cas du Britannique Gordon Rugg qui étudie les signes de Voynich depuis plus de 10 ans et qui a conclu dans un article publié fin 2016 qu’ils ne formaient qu’un pseudo-texte dénué de sens, conçu à l’aide d’une méthode simple (la grille de Cardan) donnant une apparente structure grammaticale aux mots.

Le débat pourrait être relancé sous peu puisque n’importe quel geek pourra bientôt se procurer une copie du manuscrit et plancher sur son contenu. En août dernier, une maison d’édition espagnole a en effet obtenu l’autorisation d’en produire 898 répliques (vendues environ 10 000 $ chacune). De quoi découvrir les formules magiques d’un alchimiste ? Ou la liste d’épicerie d’un moine créatif ? Qui sait… Le jeu en vaut parfois la chandelle.

« Imaginez que les hiéroglyphes égyptiens n’aient jamais été déchiffrés, ni le cunéiforme mésopotamien, ni les glyphes mayas… Personne ne connaîtrait le nom de Toutankhamon, et on ne saurait pas qu’une vie intellectuelle riche existait en Amérique avant l’arrivée de Christophe Colomb, fait remarquer Andrew Robinson. Notre compréhension de l’histoire humaine serait tellement plus pauvre. »

Une chose est sûre : tant qu’elles nous résisteront, les écritures oubliées trouveront des âmes têtues bien décidées à les faire parler.


 

Afficher tous les textes de cette section