Récemment, à la lecture du deuxième tome de la célèbre série de fantasy A Song of Ice and Fire qu’on ne présente plus, je me suis demandé par curiosité quels mots revenaient le plus souvent au fil des pages. Drôle de question, me direz-vous. J’y ai pourtant repensé plusieurs fois au cours de mes dernières heures de lecture !
Heureusement pour moi, obtenir ce genre d’information est plus simple qu’il n’y paraît : à partir de la version électronique du livre, il s’agit de l’enregistrer sous le format d’un simple fichier texte. Il suffit alors de créer un petit programme qui ira compter toutes les occurrences des mots présents dans le fichier. C’est à la portée de n’importe quel développeur en herbe, cela m’a pris une vingtaine de minutes.
Bien sûr, de telles statistiques n’ont de réel sens que dans la langue originale du roman, ici l’anglais. Toute traduction peut évidemment altérer les fréquences de mots utilisés. Voici donc quelques infos récupérées par mon programme pour le premier tome, A Game of Thrones…
Premiers résultats
J’ai donc tout d’abord appris que le roman contient pas moins de 11 154 mots différents, formant un ensemble d’un peu moins de 300 000 mots.
Bien sûr, les mots classés en tête des plus fréquemment utilisés ne sont pas les plus intéressants : ce sont des pronoms, des auxiliaires ou encore des articles très communs, à l’image de the, mot le plus fréquent du roman avec 17 727 occurrences ! Cet article occupe 6% du roman à lui tout seul. Les mots and et to, avec respectivement 8 913 et 6 566 occurrences, complètent le podium.
Une fois passés ces mots très fréquents, les fréquences diminuent assez vite, comme on le voit sur le graphique ci-dessous représentant les occurrences des 1000 mots les plus fréquents. L’utilisation d’une échelle logarithmique permet de mieux visualiser cette forte baisse de fréquence.
Noms communs
J’étais assez curieux de connaître les noms communs les plus fréquents dans l’œuvre : je me suis dit que cela pouvait être un moyen d’appréhender les principaux thèmes du roman sous un angle original… peu littéraire, il faut l’avouer, mais complètement objectif car statistique.
En observant le haut du classement de fréquence des noms communs, trois catégories se détachent :
– Les noms ayant valeur de titre : Lord, ser, King, Lady, maester (l’absence de titre est aussi présente avec man, et boy)
– Les noms relatifs à la famille et à la filiation : father, brother
– Des parties du corps humain : hand, eyes, face, head
Pour être précis, voici le top 16 des noms communs :
Rang | Nom | Occurrence |
1 | lord | 1307 |
2 | ser | 977 |
3 | man | 785 |
4 | king | 743 |
5 | father | 639 |
6 | men | 593 |
7 | hand | 587 |
8 | eyes | 566 |
9 | face | 445 |
10 | boy | 442 |
11 | brother | 438 |
12 | time | 395 |
13 | head | 380 |
14 | night | 358 |
15 | lady | 348 |
16 | maester | 345 |
En prenant en compte le singulier et le pluriel des noms, c’est finalement le nom man – et son pluriel men – qui est le plus fréquent dans le roman ! On peut d’ailleurs faire la comparaison avec l’équivalent féminin :
Noms | Occurrences |
Man et men | 1378 |
Woman et women | 244 |
La différence est sans appel et trahit fortement l’aspect masculin de l’univers de la série, comme c’est le cas d’autres œuvres de fantasy telles que le Seigneur des Anneaux… George R. R. Martin a d’ailleurs revendiqué s’être largement inspiré de l’univers de Tolkien pour écrire A Game of Thrones et ses suites.
Noms propres : prénoms
Pas de réelle surprise sur la fréquence d’apparition des prénoms des différents personnages, voici un résumé à titre informatif. La tête de liste revient à Eddard Stark et son bâtard, Jon Snow.
Rang | Prénom | Occurrence |
1 | Eddard et Ned | 980 |
2 | Jon | 834 |
3 | Tyrion | 619 |
4 | Bran | 548 |
5 | Catelyn | 497 |
6 | Arya | 463 |
7 | Sansa | 422 |
8 | Dany | 413 |
9 | Robb | 410 |
10 | Robert | 403 |
11 | Joffrey | 225 |
12 | Drogo | 219 |
13 | Jorah | 167 |
14 | Littlefinger | 157 |
15 | Tywin | 151 |
Noms propres : maisons
L’affrontement central des Stark et des Lannister se retrouve nettement dans le tableau ci-dessous. Le clan Lannister l’emporte d’une courte tête. J’ai pris en compte l’usage des pluriels, qui se révèlent assez fréquents : Stark/Starks, Lannister/Lannisters, etc. A noter, la troisième place honorable de la maison Mormont, représentée principalement par Jorah, en exil, et Jeor « the Old Bear ».
Rang | Maison | Occurrence |
1 | Lannister | 457 |
2 | Stark | 452 |
3 | Mormont | 158 |
4 | Targaryen | 79 |
5 | Tully | 72 |
6 | Frey | 63 |
7 | Baratheon | 61 |
8 | Tyrell | 30 |
9 | Bolton | 20 |
10 | Redwyne | 18 |
Noms propres : villes
Pour terminer, un petit détour du côté des différentes villes mentionnées dans le roman. Winterfell arrive largement en tête.
Rang | Maison | Occurrence |
1 | Winterfell | 240 |
2 | King’s Landing | 90 |
3 | Riverrun | 87 |
4 | Eyrie | 78 |
5 | Vale | 58 |
6 | Casterly Rock | 50 |
Conclusion
Je me rends compte que commenter même brièvement ces données est plus long que les obtenir ! Pour résumer, on peut dire que l’on retrouve dans les fréquences de mots les grandes lignes du roman. Ces fréquences n’ont pas de réelles propriétés littéraires, mais permettent en revanche d’avoir une vision objective selon différents axes. Je pense que je consacrerai un futur article à l’analyse comparative de ces données avec celles du second tome, A Clash of Kings… Cela nous réserve peut-être quelques surprises !