La technique de la stylométrie
appliquée au Livre de Mormon


Agnès B.




Hélaman 3:13 : « Et maintenant, il y a beaucoup d’annales qui sont tenues concernant les actions de ce peuple, par beaucoup de personnes de ce peuple, annales qui sont détaillées et très volumineuses à son sujet ».

Le Livre de Mormon stipule que les différents livres et annales dont il est constitué ont été écrits par un certain nombre de personnes différentes.

La technologie moderne et plus particulièrement l’informatique permet de nos jours d’analyser la trame stylistique d’un texte lorsque l’identité d’un auteur est contestée. Par l’analyse stylométrique, il est maintenant possible de déterminer avec un haut degré de certitude si telle ou telle personne est l’auteur ou non de l’ouvrage concerné.

Le Livre de Mormon a toujours été controversé. Certains ont avancé que Joseph Smith en était l’auteur, d’autres ont avancé le nom d'Oliver Cowdery, le scribe de Joseph Smith, et d’autres encore ont prétendu que c'était un certain Solomon Spaulding (1761–1816), auteur de deux ouvrages « Manuscript Story » et « Manuscript found », le premier étant accessible, le deuxième n’ayant jamais été publié. A priori, l'ouvrage traitait d’une civilisation perdue en Amérique du Nord, en provenance d’Israël. Solomon Spaulding était déjà décédé lorsque son a prétendu que l’Église avait usurpé ce manuscrit pour écrire le Livre de Mormon.

L’analyse stylométrique, comme on va le voir, a permis de prouver qu’aucune des personnes précitées n’était l’auteur du Livre de Mormon. Elle n'est cependant pas en mesure de confirmer l’origine divine de l'ouvrage. Ceci est une affaire d'expérience spirituelle. Bien que validée et objective, l'analyse stylométrique ne peut pas se substituer à la foi mais elle soutient la foi en apportant une information factuelle, rigoureusement démontrée au sujet du Livre de Mormon.

À la croisée de la linguistique et de la statistique, la stylométrie tente d’identifier le style d’un texte, voire d’un auteur.

L’analyse stylométrique est basée sur le fait que chaque auteur qui a été testé par cette méthode utilise inconsciemment soixante-cinq modèles identifiables et mesurables, comportant des mots courants utilisés par tout-un-chacun tels que « et », « le, « la », « de », « ce », « pour », etc., à un rythme statistiquement très différent selon les auteurs. On pourrait appeler cela l’ADN stylistique de l’auteur.

Au début des années 1980, une équipe de chercheurs a travaillé pour affiner et rendre plus performantes les techniques de la stylométrie. Les travaux plus récents montrent que les méthodes de comptage et de comparaison entre différents textes ont été grandement améliorées. À partir de 325 textes à l’essai, des critères distinctifs sont clairement apparus. Les textes étudiés provenaient d’auteurs dont l’identité était connue, tels Mark Twain, Samuel Johnson, Oliver Cowdery, Solomon Spaulding et des échantillons d’écrits autobiographiques ou dictés par Joseph Smith. Parmi ces 325 textes, 292 avaient été écrits par des auteurs différents qui ont été mis en comparaison, alors que 33 textes d’un même auteur étaient comparés entre eux. Chaque texte était de même taille (5000 mots). Pour donner une idée, une page dactylographiée A4 comprend environ 200 mots. Les textes analysés équivalaient à environ 25 pages.

D’autre part, parmi ces textes, il y avait des traductions en anglais de textes allemands. Ces textes avaient été écrits par des auteurs allemands différents mais avaient la particularité d’avoir tous été traduits par le même traducteur. L’analyse stylométrique de ces textes a montré dans tous ces cas que chaque texte a conservé son caractère unique malgré la traduction, c’est-à-dire que l’empreinte de l’auteur, reconnaissable malgré la traduction, se retrouvait dans chaque texte d’un même auteur et était nettement différente d’un auteur à l’autre. Ces textes ont été mis en comparaison avec des écrits en anglais, propres au traducteur, et eux aussi étaient reconnaissables et ne pouvaient être assimilés à aucun des textes qu’il avait traduits. Ceci montre que le caractère unique du style de chaque auteur peut survivre à la traduction.

Il faut cependant signaler ici que certains traducteurs préfèrent s’éloigner du texte original et ne respectent pas le style de l’auteur. Adeptes de la traduction libre, ils paraphrasent en leurs propres termes les idées de l’auteur. Dans ce cas, la stylométrie de leur traduction n’aura pour résultat que de montrer leur propre et unique style.

L’analyse stylométrique est une technique de mesure objective. Le groupe de scientifiques qui a développé les techniques de mesure pour effectuer les études sur le Livre de Mormon était constitué de personnes provenant d’origines religieuses et philosophiques différentes (agnostiques, juifs, mormons, etc.) qui ont déterminé ensemble quelles techniques de mesure utiliser. C’est sur des rapports publiés par ces scientifiques que reposent les informations qui suivent.

Les premières mentions d’une technique qui s’apparente à la stylométrie pour identifier des auteurs sont apparues au plus tard en 1851. Cependant, compte tenu de la complexité des mesures à effectuer, les premières études crédibles ont dû attendre l’arrivée des ordinateurs modernes, pour leur précision de comptage et leur traitement à grande vitesse des données. C’est pour ces raisons que l’analyse stylométrique n’a pu se développer de façon significative que ces dernières décennies.

C’est en 1980 que la première analyse complète du Livre de Mormon a été publiée par un groupe de 3 chercheurs, en utilisant l’informatique qui se développait à l’époque mais qui en était encore à ses premiers balbutiements, en comparaison avec les progrès de ces dernières années. Les techniques utilisées étaient basées sur les cadences ou rythmes d’utilisation de certains mots pour prouver que le Livre de Mormon émanait de différents auteurs. Depuis, les techniques se sont perfectionnées.

Peu de temps après cette première analyse, le groupe de scientifiques qui a plus tard appliqué au Livre de Mormon la technique de la stylométrie a voulu préalablement vérifier l’exactitude de l’analyse stylométrique en général et en particulier les résultats des travaux réalisés en 1980 par les 3 autres chercheurs. Après sept ans de travail et d’avancées significatives, la conclusion a été que l’analyse stylographique avait atteint un tel niveau de perfectionnement qu’elle pouvait être utilisée avec confiance et sans préjugé pour analyser des œuvres littéraires dont l’auteur est contesté, y compris le Livre de Mormon.

Comme dans toutes les sciences en développement, ce groupe de scientifiques a identifié et abandonné une partie des méthodes et théories préalables qui s'étaient avérées inexactes. Alors que la science de la stylométrie continue à évoluer vers une fiabilité et une sensibilité toujours plus grandes, elle a atteint un niveau qui permet la mise en œuvre d'une technique de mesure rigoureuse qui donne des réponses fiables dans l’analyse des textes de plusieurs milliers de mots d’un même auteur, en flux libre. Dans ce contexte, le flux libre signifie que les textes ont été écrits sans influence extérieure ou structures imposées qui auraient une influence sur le choix des mots de l’auteur.

Beaucoup de personnes ont des difficultés à croire qu’un auteur intelligent ne serait pas capable de berner une analyse quantitative rigoureuse qui tente de mesurer ses habitudes d’écriture. Après tout, cette idée est tout à fait défendable : quand on lit les paroles fictives des personnages créés par un grand auteur, on a l’impression que différentes personnes s’adressent à nous pour compter l’histoire du livre. Et pourtant, la plus récente méthodologie de stylométrie continue de montrer qu’il existe de nombreuses trames non-contextuelles cachées dans la narration qui sont uniques à chaque auteur, indépendamment du personnage qu’il fait parler. Même de grands auteurs comme Twain, Johnson, Heinlein, etc. qui ont essayé intentionnellement d’imiter les écrits d’autres personnes, sont incapables de modifier suffisamment leur trame non-contextuelle en flux libre pour simuler la trame d’un autre écrivain. Ceci est dû à l’incapacité de l’esprit de reconnaître consciemment l’étendue des trames stylistiques que les mesures assistées par ordinateur peuvent détecter, ce qui fait que l’analyse stylométrique est pratiquement à l’abri de toute tromperie par un faussaire.

Lorsque l’on parle de trame non-contextuelle, il s’agit de mots qui sont souvent interchangeables ou qui peuvent même être omis sans perte de la signification générale du texte. Ces mots contribuent peu à l’information contextuelle et sont souvent ignorés consciemment, aussi bien par le lecteur que par l’auteur. Ces mots constituent typiquement 20 à 45% du texte total, ce qui permet d’avoir un nombre important de choix statistiques, et plus les mesures statistiques sont nombreuses, plus leurs résultats sont fiables.

Comme on l’a vu plus tôt, le comptage de ces mots non contextuels est un paramètre important mais les scientifiques ont rapidement réalisé qu’il fallait surtout tenir compte des ratios d’utilisation de ces mots. Une étude a montré que sur 7 textes, les auteurs de 2 textes seulement ont pu être identifiés par le comptage, alors que 6 sur 7 auteurs ont pu être identifiés en utilisant la méthode des ratios d’utilisation.

Exemples de calcul de ratio :

Le nombre de fois où « Un » est le premier mot d’une phrase, divisé par le nombre de phrases

Le nombre de fois où « et » est suivi de « le », divisé par le nombre de « et »

Revenons au Livre de Mormon. Ce groupe de scientifiques de différentes origines a adopté les méthodes suivantes :

Ils ont choisi des textes de 5000 mots

Ils ont utilisé 65 ratios différents de mots et trames non-contextuels

Ils ont abandonné l'usage d'une statistique fondée sur une répartition normative des mots au profit d'une statistique qui ne requiert pas la simplification de la normalité.

Ils ont développé une méthode de comptage globale de groupes de mots qui permet d’éclater des concentrations de mots similaires du texte étudié. Cette méthode permet d’obtenir l’homogénéité des groupes de mots.

Ils ont effectué des comparaisons entre seulement deux textes à la fois.

Ils sont partis des plus anciens manuscrits existants du Livre de Mormon. Ils n'ont pas utilisé les textes où apparaissent la phrase fréquemment répétée « Et il arriva que » ainsi que les passages reprenant les textes de la Bible, version anglaise King James (Bible du roi Jacques) qui fausseraient le comptage des mots non-contextuels.

Ils ont vérifié la fiabilité et la sensibilité de la méthodologie de mesures et de codification assistée par ordinateur en analysant des textes divers dont les auteurs ne sont pas contestés.

Le développement et les vérifications de la technique utilisée par ce groupe de scientifiques ont été mis en œuvre sur des textes littéraires en anglais, touchant à des genres, des sujets, des époques et des périodes différentes dans la carrière de leur auteur et ont fait la preuve que leur technique d’analyse stylométrique est insensible à tous ces paramètres de genre littéraire, sujets traités, époques, etc.

Ils ont mis en place une batterie de 325 tests et ont étudié 26 textes d’auteurs non controversés de 5000 mots chacun, y compris des textes d’Oliver Cowdery et des passages de l’autobiographie de Joseph Smith et de discours qu’il a dictés. Il a été possible pour chacun de ces textes d’identifier, malgré les nombreux réflexes communs qu'ils contiennent, des trames de mots non-contextuels mesurables, uniques et stables dans leur ratio.

Ils ont également analysé des textes semi-classiques de différents auteurs allemands, traduits en anglais, traductions académiques faites par un même traducteur. Trois constatations importantes en sont ressorties :

1.
Chaque auteur qui a été traduit demeure reconnaissable par une constance dans sa trame stylistique.

2.
Lorsque plusieurs auteurs allemands sont traduits par un même traducteur, l’interprétation anglaise de chaque auteur est clairement distincte des autres.

3.
Les textes en anglais écrits par le traducteur lui-même ont une trame stylistique différente de ses travaux de traduction.

Ces constatations démontrent que la trame stylistique unique d’un auteur survit à la traduction, du moins lorsque celle-ci est académique et s’attache à respecter le texte original.

Les écrits de deux personnages du Livre de Mormon, Néphi et Alma, ont été choisis en raison de la longueur de leurs textes dans le Livre de Mormon. Trois textes indépendants de 5000 mots chacun de chaque auteur ont été sélectionnés, textes de même genre pour éviter toute contestation visant à justifier des rejets. On appelle « rejet » un résultat qui ne concorde pas lors de la comparaison.

L’analyse stylométrique de comparaison entre des textes Néphi / Néphi et Alma / Alma montre un nombre de rejets de 1 jusqu’à un rare maximum de 5, la plupart des rejets atteignant un pic à 2.

De même, les analyses stylométriques d’un même auteur entre deux textes de 5000 mots d’Oliver Cowdery, deux textes de Solomon Spaulding et trois textes de Joseph Smith montrent une même constance.

Par contre les textes de Néphi comparés aux textes d’Alma ont affiché un haut niveau de rejet (de 7 à 10 rejets), donc une probabilité d’auteurs différents au-delà de 99,5%.

En résumé :

1. Sur les 65 modèles identifiables analysés, les textes d’un même auteur diffèrent l’un de l’autre sur seulement 1, 2 ou 3 rejets.

2. Aucun de deux textes comparés d’un même auteur n’a affiché plus de 6 rejets.

3. En règle générale, les textes écrits par des auteurs différents présentent plus de six rejets. Il a été constaté qu’au-delà de 7 rejets l’analyse stylométrique avait un haut degré de sensibilité et donc d’exactitude qui permettait d’affirmer que deux textes comparés n’étaient pas écrits par le même auteur.

4. Six tests ont été faits en comparant des écrits de Néphi avec d’autres écrits de Néphi, de même, en comparant des écrits d’Alma avec d’autres écrits d’Alma. Les différences constatées pour un même auteur se sont limitées de 1 à 5 rejets.

5. Neuf tests ont mis en comparaison les écrits de Néphi avec ceux d’Alma. Sur 8 de ces tests, les rejets étaient supérieurs à 5 et sur quatre tests, on a relevé respectivement 7, 8, 9 et 10 rejets. Ces chiffres correspondent à 99,5%, 99,9%, 99,99% et 99,997% de chances que l'auteur des textes de Néphi et celui des textes d'Alma aient été deux personnes différentes. La conclusion en est que Joseph Smith ou toute autre personne ne pouvait pas être à l’origine à la fois des écrits de Néphi et d’Alma.

6. 36 tests ont été effectués en comparant les écrits de Néphi et d’Alma avec des écrits non contestés de Joseph Smith, d'Oliver Cowdery et de Solomon Spaulding. Lors de la comparaison de nombreux textes de Néphi ou d’Alma avec les textes émanant de ces trois personnes, les rejets étaient d’au moins 7 et souvent beaucoup plus. L’analyse stylométrique a débouché sur de fortes preuves statistiques que la stylistique de Joseph Smith, d'Oliver Cowdery et de Solomon Spaulding n’a pas été retrouvée dans les sections du Livre de Mormon qui ont été testées.

7. Le taux d’introduction de vocabulaire nouveau dans le Livre de Mormon est relativement plat, ce qui est apparu être le cas aussi dans les travaux de traductions académiques.

Les rapports qui ont découlé de ces études fournissent beaucoup d'autres indications mais la conclusion de ces analyses stylométriques est que les personnes qui examinent sérieusement ces travaux rejettent l'idée que le Livre de Mormon est constitué de textes dont l'auteur serait Joseph Smith ou d'Oliver Cowdery ou de Solomon Spaulding. L'hypothèse d'un auteur unique est, statistiquement parlant, indéfendable. De plus, les études stylométriques montrent que les écrits de Néphi et d’Alma sont statistiquement indépendants les uns des autres. L’auteur des textes attribués à Néphi et celui des textes attribués à Alma ne peuvent être une même personne.

Alors que des études stylométriques plus poussées sont toujours en cours, une explication simple – si ce n’est la plus simple – de toutes les données obtenues est que le Livre de Mormon a été écrit à l’origine par différents auteurs et traduit par un seul et unique traducteur avec un vocabulaire usuel restreint.

Ces études qui ont utilisé une méthodologie de mesures vérifiée, apportent la conclusion qu’il est injustifiable de prétendre que l’auteur des 30000 mots examinés des textes manuscrits attribués à Néphi et Alma puisse être Joseph Smith ou Oliver Cowdery ou Solomon Spaulding. Néphi et Alma ont des trames stylistiques uniques et statistiquement indépendantes l'une de l’autre, autant que le sont celles d’autres auteurs connus non contestés. Il est par conséquent évident que le Livre de Mormon est une compilation de textes écrits par différents auteurs, tout comme il le prétend. Fait remarquable : Ces résultats ont pu être obtenus malgré le filtre de la traduction.


Conférence donnée à Bayonne le 21 mars 2015 à partir de plusieurs articles de John L. Hilton (voir http://www.lafeuilledolivier.com/Livre_de_Mormon.html#STYLOMETRIE)