La
technique de la stylométrie
appliquée
au Livre de Mormon
Agnès
B.
Hélaman
3:13 : « Et maintenant, il y a beaucoup d’annales
qui sont tenues concernant les actions de ce peuple, par beaucoup de
personnes de ce peuple, annales qui sont détaillées et
très volumineuses à son sujet ».
Le
Livre de Mormon stipule que les différents livres et annales
dont il est constitué ont été écrits par
un certain nombre de personnes différentes.
La
technologie moderne et plus particulièrement l’informatique
permet de nos jours d’analyser la trame stylistique d’un
texte lorsque l’identité d’un auteur est
contestée. Par l’analyse stylométrique, il est
maintenant possible de déterminer avec un haut degré de
certitude si telle ou telle personne est l’auteur ou non de
l’ouvrage concerné.
Le
Livre de Mormon a toujours été controversé.
Certains ont avancé que Joseph Smith en était l’auteur,
d’autres ont avancé le nom d'Oliver Cowdery, le scribe
de Joseph Smith, et d’autres encore ont prétendu que
c'était un certain Solomon Spaulding (1761–1816), auteur
de deux ouvrages « Manuscript Story » et
« Manuscript found », le premier étant
accessible, le deuxième n’ayant jamais été
publié. A priori, l'ouvrage traitait d’une civilisation
perdue en Amérique du Nord, en provenance d’Israël.
Solomon Spaulding était déjà décédé
lorsque son a prétendu que l’Église avait usurpé
ce manuscrit pour écrire le Livre de Mormon.
L’analyse
stylométrique, comme on va le voir, a permis de prouver
qu’aucune des personnes précitées n’était
l’auteur du Livre de Mormon. Elle n'est cependant pas en mesure
de confirmer l’origine divine de l'ouvrage. Ceci est une
affaire d'expérience spirituelle. Bien que validée et
objective, l'analyse stylométrique ne peut pas se substituer à
la foi mais elle soutient la foi en apportant une information
factuelle, rigoureusement démontrée au sujet du Livre
de Mormon.
À
la croisée de la linguistique et de la statistique, la
stylométrie tente d’identifier le style d’un
texte, voire d’un auteur.
L’analyse
stylométrique est basée sur le fait que chaque auteur
qui a été testé par cette méthode utilise
inconsciemment soixante-cinq modèles identifiables et
mesurables, comportant des mots courants utilisés par
tout-un-chacun tels que « et », « le,
« la », « de », « ce »,
« pour », etc., à un rythme
statistiquement très différent selon les auteurs. On
pourrait appeler cela l’ADN stylistique de l’auteur.
Au
début des années 1980, une équipe de chercheurs
a travaillé pour affiner et rendre plus performantes les
techniques de la stylométrie. Les travaux plus récents
montrent que les méthodes de comptage et de comparaison entre
différents textes ont été grandement améliorées.
À partir de 325 textes à l’essai, des critères
distinctifs sont clairement apparus. Les textes étudiés
provenaient d’auteurs dont l’identité était
connue, tels Mark Twain, Samuel Johnson, Oliver Cowdery, Solomon
Spaulding et des échantillons d’écrits
autobiographiques ou dictés par Joseph Smith. Parmi ces 325
textes, 292 avaient été écrits par des auteurs
différents qui ont été mis en comparaison,
alors que 33 textes d’un même auteur étaient
comparés entre eux. Chaque texte était de même
taille (5000 mots). Pour donner une idée, une page
dactylographiée A4 comprend environ 200 mots. Les textes
analysés équivalaient à environ 25 pages.
D’autre
part, parmi ces textes, il y avait des traductions en anglais de
textes allemands. Ces textes avaient été écrits
par des auteurs allemands différents mais avaient la
particularité d’avoir tous été traduits
par le même traducteur. L’analyse stylométrique de
ces textes a montré dans tous ces cas que chaque texte a
conservé son caractère unique malgré la
traduction, c’est-à-dire que l’empreinte de
l’auteur, reconnaissable malgré la traduction, se
retrouvait dans chaque texte d’un même auteur et était
nettement différente d’un auteur à l’autre.
Ces textes ont été mis en comparaison avec des écrits
en anglais, propres au traducteur, et eux aussi étaient
reconnaissables et ne pouvaient être assimilés à
aucun des textes qu’il avait traduits. Ceci montre que le
caractère unique du style de chaque auteur peut survivre à
la traduction.
Il
faut cependant signaler ici que certains traducteurs préfèrent
s’éloigner du texte original et ne respectent pas le
style de l’auteur. Adeptes de la traduction libre, ils
paraphrasent en leurs propres termes les idées de l’auteur.
Dans ce cas, la stylométrie de leur traduction n’aura
pour résultat que de montrer leur propre et unique style.
L’analyse
stylométrique est une technique de mesure objective. Le groupe
de scientifiques qui a développé les techniques de
mesure pour effectuer les études sur le Livre de Mormon était
constitué de personnes provenant d’origines religieuses
et philosophiques différentes (agnostiques, juifs, mormons,
etc.) qui ont déterminé ensemble quelles techniques de
mesure utiliser. C’est sur des rapports publiés par ces
scientifiques que reposent les informations qui suivent.
Les
premières mentions d’une technique qui s’apparente
à la stylométrie pour identifier des auteurs sont
apparues au plus tard en 1851. Cependant, compte tenu de la
complexité des mesures à effectuer, les premières
études crédibles ont dû attendre l’arrivée
des ordinateurs modernes, pour leur précision de comptage et
leur traitement à grande vitesse des données. C’est
pour ces raisons que l’analyse stylométrique n’a
pu se développer de façon significative que ces
dernières décennies.
C’est
en 1980 que la première analyse complète du Livre de
Mormon a été publiée par un groupe de 3
chercheurs, en utilisant l’informatique qui se développait
à l’époque mais qui en était encore à
ses premiers balbutiements, en comparaison avec les progrès de
ces dernières années. Les techniques utilisées
étaient basées sur les cadences ou rythmes
d’utilisation de certains mots pour prouver que le Livre de
Mormon émanait de différents auteurs. Depuis, les
techniques se sont perfectionnées.
Peu
de temps après cette première analyse, le groupe de
scientifiques qui a plus tard appliqué au Livre de Mormon la
technique de la stylométrie a voulu préalablement
vérifier l’exactitude de l’analyse stylométrique
en général et en particulier les résultats des
travaux réalisés en 1980 par les 3 autres chercheurs.
Après sept ans de travail et d’avancées
significatives, la conclusion a été que l’analyse
stylographique avait atteint un tel niveau de perfectionnement
qu’elle pouvait être utilisée avec confiance et
sans préjugé pour analyser des œuvres littéraires
dont l’auteur est contesté, y compris le Livre de
Mormon.
Comme dans toutes les
sciences en développement, ce groupe de scientifiques a
identifié et abandonné une partie des méthodes
et théories préalables qui s'étaient avérées
inexactes. Alors que la science de la stylométrie continue à
évoluer vers une fiabilité et une sensibilité
toujours plus grandes, elle a atteint un niveau qui permet la mise en
œuvre d'une technique de mesure rigoureuse qui donne des
réponses fiables dans l’analyse des textes de plusieurs
milliers de mots d’un même auteur, en flux libre. Dans ce
contexte, le flux libre signifie que les textes ont été
écrits sans influence extérieure ou structures imposées
qui auraient une influence sur le choix des mots de l’auteur.
Beaucoup
de personnes ont des difficultés à croire qu’un
auteur intelligent ne serait pas capable de berner une analyse
quantitative rigoureuse qui tente de mesurer ses habitudes
d’écriture. Après tout, cette idée est
tout à fait défendable : quand on lit les paroles
fictives des personnages créés par un grand auteur, on
a l’impression que différentes personnes s’adressent
à nous pour compter l’histoire du livre. Et pourtant, la
plus récente méthodologie de stylométrie
continue de montrer qu’il existe de nombreuses trames
non-contextuelles cachées dans la narration qui sont uniques à
chaque auteur, indépendamment du personnage qu’il fait
parler. Même de grands auteurs comme Twain, Johnson, Heinlein,
etc. qui ont essayé intentionnellement d’imiter les
écrits d’autres personnes, sont incapables de modifier
suffisamment leur trame non-contextuelle en flux libre pour simuler
la trame d’un autre écrivain. Ceci est dû à
l’incapacité de l’esprit de reconnaître
consciemment l’étendue des trames stylistiques que les
mesures assistées par ordinateur peuvent détecter, ce
qui fait que l’analyse stylométrique est pratiquement à
l’abri de toute tromperie par un faussaire.
Lorsque
l’on parle de trame non-contextuelle, il s’agit de mots
qui sont souvent interchangeables ou qui peuvent même être
omis sans perte de la signification générale du texte.
Ces mots contribuent peu à l’information contextuelle et
sont souvent ignorés consciemment, aussi bien par le lecteur
que par l’auteur. Ces mots constituent typiquement 20 à
45% du texte total, ce qui permet d’avoir un nombre important
de choix statistiques, et plus les mesures statistiques sont
nombreuses, plus leurs résultats sont fiables.
Comme
on l’a vu plus tôt, le comptage de ces mots non
contextuels est un paramètre important mais les scientifiques
ont rapidement réalisé qu’il fallait surtout
tenir compte des ratios d’utilisation de ces mots. Une étude
a montré que sur 7 textes, les auteurs de 2 textes seulement
ont pu être identifiés par le comptage, alors que 6 sur
7 auteurs ont pu être identifiés en utilisant la méthode
des ratios d’utilisation.
Exemples
de calcul de ratio :
•
Le
nombre de fois où « Un » est le premier
mot d’une phrase, divisé par le nombre de phrases
•
Le
nombre de fois où « et » est suivi de
« le », divisé par le nombre de « et »
Revenons
au Livre de Mormon. Ce groupe de scientifiques de différentes
origines a adopté les méthodes suivantes :
•
Ils
ont choisi des textes de 5000 mots
•
Ils
ont utilisé 65 ratios différents de mots et trames
non-contextuels
•
Ils
ont abandonné l'usage d'une statistique fondée sur une
répartition normative des mots au profit d'une statistique
qui ne requiert pas la simplification de la normalité.
•
Ils
ont développé une méthode de comptage globale
de groupes de mots qui permet d’éclater
des concentrations de mots similaires du texte étudié.
Cette méthode permet d’obtenir l’homogénéité
des groupes de mots.
•
Ils
ont effectué des comparaisons entre seulement deux textes à
la fois.
•
Ils
sont partis des plus anciens manuscrits existants du Livre de
Mormon. Ils n'ont pas utilisé les textes où
apparaissent la phrase fréquemment répétée
« Et il arriva que » ainsi que les passages
reprenant les textes de la Bible, version anglaise King James (Bible
du roi Jacques) qui fausseraient le comptage des mots
non-contextuels.
•
Ils
ont vérifié la fiabilité et la sensibilité
de la méthodologie de mesures et de codification assistée
par ordinateur en analysant des textes divers dont les auteurs ne
sont pas contestés.
Le
développement et les vérifications de la technique
utilisée par ce groupe de scientifiques ont été
mis en œuvre sur des textes littéraires en anglais,
touchant à des genres, des sujets, des époques et des
périodes différentes dans la carrière de leur
auteur et ont fait la preuve que leur technique d’analyse
stylométrique est insensible à tous ces paramètres
de genre littéraire, sujets traités, époques,
etc.
Ils
ont mis en place une batterie de 325 tests et ont étudié
26 textes d’auteurs non controversés de 5000 mots
chacun, y compris des textes d’Oliver Cowdery et des passages
de l’autobiographie de Joseph Smith et de discours qu’il
a dictés. Il a été possible pour chacun de ces
textes d’identifier, malgré les nombreux réflexes
communs qu'ils contiennent, des trames de mots non-contextuels
mesurables, uniques et stables dans leur ratio.
Ils
ont également analysé des textes semi-classiques de
différents auteurs allemands, traduits en anglais, traductions
académiques faites par un même traducteur. Trois
constatations importantes en sont ressorties :
1. Chaque
auteur qui a été traduit demeure reconnaissable par
une constance dans sa trame stylistique.
2. Lorsque
plusieurs auteurs allemands sont traduits par un même
traducteur, l’interprétation anglaise de chaque auteur
est clairement distincte des autres.
3. Les
textes en anglais écrits par le traducteur lui-même ont
une trame stylistique différente de ses travaux de
traduction.
Ces
constatations démontrent que la trame stylistique unique d’un
auteur survit à la traduction, du moins lorsque celle-ci est
académique et s’attache à respecter le texte
original.
Les
écrits de deux personnages du Livre de Mormon, Néphi et
Alma, ont été choisis en raison de la longueur de leurs
textes dans le Livre de Mormon. Trois textes indépendants de
5000 mots chacun de chaque auteur ont été sélectionnés,
textes de même genre pour éviter toute contestation
visant à justifier des rejets. On appelle « rejet »
un résultat qui ne concorde pas lors de la comparaison.
L’analyse
stylométrique de comparaison entre des textes Néphi /
Néphi et Alma / Alma montre un nombre de rejets de 1 jusqu’à
un rare maximum de 5, la plupart des rejets atteignant un pic à
2.
De
même, les analyses stylométriques d’un même
auteur entre deux textes de 5000 mots d’Oliver Cowdery, deux
textes de Solomon Spaulding et trois textes de Joseph Smith montrent
une même constance.
Par
contre les textes de Néphi comparés aux textes d’Alma
ont affiché un haut niveau de
rejet (de 7 à 10 rejets),
donc une probabilité d’auteurs différents au-delà
de 99,5%.
En
résumé :
1.
Sur
les 65 modèles identifiables analysés, les textes d’un
même auteur diffèrent l’un de l’autre sur
seulement 1, 2 ou 3 rejets.
2.
Aucun
de deux textes comparés d’un même auteur n’a
affiché plus de 6 rejets.
3.
En
règle générale, les textes écrits par
des auteurs différents présentent plus de six rejets.
Il a été constaté qu’au-delà de 7
rejets l’analyse stylométrique avait un haut degré
de sensibilité et donc d’exactitude qui permettait
d’affirmer que deux textes comparés n’étaient
pas écrits par le même auteur.
4.
Six
tests ont été faits en comparant des écrits de
Néphi avec d’autres écrits de Néphi, de
même, en comparant des écrits d’Alma avec
d’autres écrits d’Alma. Les différences
constatées pour un même auteur se sont limitées
de 1 à 5 rejets.
5.
Neuf
tests ont mis en comparaison les écrits de Néphi avec
ceux d’Alma. Sur 8 de ces tests, les rejets étaient
supérieurs à 5 et sur quatre tests, on a relevé
respectivement 7, 8, 9 et 10 rejets. Ces chiffres correspondent à
99,5%, 99,9%, 99,99% et 99,997% de chances que l'auteur des textes
de Néphi et celui des textes d'Alma aient été
deux personnes différentes. La conclusion en est que Joseph
Smith ou toute autre personne ne pouvait pas être à
l’origine à la fois des écrits de Néphi
et d’Alma.
6.
36
tests ont été effectués en comparant les écrits
de Néphi et d’Alma avec des écrits non contestés
de Joseph Smith, d'Oliver Cowdery et de Solomon Spaulding. Lors de
la comparaison de nombreux textes de Néphi ou d’Alma
avec les textes émanant de ces trois personnes, les rejets
étaient d’au moins 7 et souvent beaucoup plus.
L’analyse stylométrique a débouché sur de
fortes preuves statistiques que la stylistique de Joseph Smith,
d'Oliver Cowdery et de Solomon Spaulding n’a pas été
retrouvée dans les sections du Livre de Mormon qui ont été
testées.
7.
Le
taux d’introduction de vocabulaire nouveau dans le Livre de
Mormon est relativement plat, ce qui est apparu être le cas
aussi dans les travaux de traductions académiques.
Les
rapports qui ont découlé de ces études
fournissent beaucoup d'autres indications mais la conclusion de ces
analyses stylométriques est que les personnes qui examinent
sérieusement ces travaux rejettent l'idée que le Livre
de Mormon est constitué de textes dont l'auteur serait Joseph
Smith ou d'Oliver Cowdery ou de Solomon Spaulding. L'hypothèse
d'un auteur unique est, statistiquement parlant, indéfendable.
De plus, les études stylométriques montrent que les
écrits de Néphi et d’Alma sont statistiquement
indépendants les uns des autres. L’auteur des textes
attribués à Néphi et celui des textes attribués
à Alma ne peuvent être une même personne.
Alors
que des études stylométriques plus poussées sont
toujours en cours, une explication simple – si ce n’est
la plus simple – de toutes les données obtenues est
que le Livre de Mormon a été écrit à
l’origine par différents auteurs et traduit par un seul
et unique traducteur avec un vocabulaire usuel restreint.
Ces
études qui ont utilisé une méthodologie de
mesures vérifiée, apportent la conclusion qu’il
est injustifiable de prétendre que l’auteur des 30000
mots examinés des textes manuscrits attribués à
Néphi et Alma puisse être Joseph Smith ou Oliver Cowdery
ou Solomon Spaulding. Néphi et Alma ont des trames
stylistiques uniques et statistiquement indépendantes l'une de
l’autre, autant que le sont celles d’autres auteurs
connus non contestés. Il est par conséquent évident
que le Livre de Mormon est une compilation de textes écrits
par différents auteurs, tout comme il le prétend. Fait
remarquable : Ces résultats ont pu être obtenus
malgré le filtre de la traduction.
Conférence
donnée à Bayonne le 21 mars 2015 à partir de
plusieurs
articles
de
John L. Hilton (voir
http://www.lafeuilledolivier.com/Livre_de_Mormon.html#STYLOMETRIE)