Compter le nombre de mots et de caractères d’une liste ou d’un texte

Sur le web, on trouve quelques outils en ligne d’analyse textuelle assez puissants qui permettent en quelques clics de donner pas mal de stats sur tous nos contenus texte:

  1. nombre de caractères contenus dans un texte
  2. nombre de mots contenus dans un texte
  3. caractères les plus fréquents dans un texte
  4. mots les plus fréquents dans un texte
  5. ensemble de mots de 2 lettres les plus fréquents dans un texte
  6. ensemble de mots de 3 lettres ou plus les plus fréquents dans un texte
  7. analyse textuelle complète avec textalyser
compteurs de texte

Pour récupérer toutes les statistiques autour de nos caractères, mots, combinaisons de mots, nous allons utiliser ces 3 outils:

  • Word Frequency Counter sera utilisé pour les 4 premiers traitements (caractères et mots les plus fréquents dans un texte)
  • Phrase Frequency Counter sera utilisé pour les traitements 5 et 6 (ensemble de mots de 2 lettres et plus les plus fréquents dans un texte)
  • Textalyser pour nous donner une analyse complète de notre texte (mots, caractères, phrases, syllabes,…)

Pour illustrer mes analyses textuelles, j’utiliserai le fichier texte suivant:

Top mots clés de jeanviet.info au 18/11/2007

1/ nombre de caractères contenus dans un texte

Allez sur Word Frequency Counter , et copier-coller votre texte  comme ceci:

>> cliquez sur ce lien pour vous rendre directement sur le site <<

copier-coller texte word frequency

Ensuite appuyez sur le bouton Character Count

nombre de caractères

On voit apparaître le nombre de caractères total utilisé dans notre texte, ici : 43 833, avec en moyenne 5,5 caractères par mot (Average letters per word)… le poids des prépositions utilisés dans le texte affaiblit la moyenne de caractères par mot (comme vous le verrez plus bas "de" et "en" font parties des mots les plus utilisés par mes visiteurs)

2/ nombre de mots contenus dans un texte

Allez sur Word Frequency Counter , et copier-coller votre texte  comme ceci:

>> cliquez sur ce lien pour vous rendre directement sur le site <<

caracteres dans texte

Ensuite appuyez sur le bouton COUNT WORDS

count words

On voit apparaître la fréquence des mots par rapport à notre classement initial, Face apparaît 38 fois, Transformer 61,…  et juste au dessus le nombre total de mots utilisés dans le texte (Total: 7 944), et le nombre de mots uniques (c’est-à-dire nombre de mots différents: on voit que mes visiteurs utilisent souvent les mêmes expressions… puisque sur 7 944 mots au total, seuls 1 298 sont uniques – Unique: 1 298 !)

3/ caractères les plus fréquents dans un texte

Allez sur Word Frequency Counter , et copier-coller votre texte  comme ceci:

>> cliquez sur ce lien pour vous rendre directement sur le site <<

copier-coller texte word frequency

Ensuite appuyez sur le bouton Character Count

fréquence caractères

On voit apparaître la fréquence des caractères par ordre alphabétique, a apparaît 2 856 fois, b 453,… Si on veut classer par ordre décroissant (par popularité donc), il faut appuyer ensuite sur la touche Character Frequency

frequence des caractères

On a bien ce qu’on cherchait, le "e" est la lettre la plus utilisée dans notre liste de mots clés avec 6 163 apparitions…. viennent ensuite les r (3 915), o (3 374),…

4/ mots les plus fréquents dans un texte

Allez sur Word Frequency Counter , et copier-coller votre texte  comme ceci:

>> cliquez sur ce lien pour vous rendre directement sur le site <<

caracteres dans texte

Ensuite appuyez sur le bouton COUNT WORDS

count words

On voit apparaître la fréquence des mots par rapport à notre classement initial, Face apparaît 38 fois, Transformer 61,… Si on veut classer par ordre décroissant (par popularité donc), il faut appuyer ensuite sur la touche Word Sort: Frequency

classement par popularité des mots

On a finalement ce qu’on voulait… sur 7 944 mots, le mot Video est utilisé 215 fois !

5/ ensemble de mots de 2 lettres les plus fréquents dans un texte

Allez sur  Phrase Frequency Counter, et copier-coller votre texte  comme ceci:

>> cliquez sur ce lien pour vous rendre directement sur le site <<

copier-coller texte phrase frequency counter

Ensuite appuyez sur le bouton Submit

combinaison de mots à 2 mots les plus populaires

On voit quels sont les combinaisons de mots à 2 mots qui sont  les plus populaires (à gauche on a le nombre d’occurrences). Il y un petit bug au niveau des données chiffrés qui ne sont pas retrancris mais bien comptabilisés… (si j’ai excel 2007 – ce qui est le cas dans ma liste – seul excel apparaît malheureusement)… les videos sont toujours sacrément populaires chez moi (blog et skyblog sont pas mal non plus)

6/ ensemble de mots de 3 lettres ou plus les plus fréquents dans un texte

Allez sur  Phrase Frequency Counter, et copier-coller votre texte  comme ceci, puis sélectionnez à l’aide du menu déroulant à droite le nombre de combinaisons de mots que vous souhaitez sélectionner (2, 3, 4, etc…):

>> cliquez sur ce lien pour vous rendre directement sur le site <<

copier-coller texte phrase frequency counter + tri nombre de mots

Ensuite appuyez sur le bouton Submit

combinaison de mots à 3 mots les plus populaires

On voit quels sont les combinaisons de mots à 3 mots qui sont  les plus populaires (à gauche on a le nombre d’occurrences). Quand on rajoute un mot dans l’analyse, on comprend que mes visiteurs veulent du gratuit ;-)

7/ analyse textuelle complète avec textalyser

Allez sur  Textalyser, et copier-coller votre texte  comme ceci:

>> cliquez sur ce lien pour vous rendre directement sur le site <<

copier-coller texte textalyser

L’avantage de textalyser est qu’il gère le français et l’anglais dans sa stop liste (cette fonctionnalité permet de ne pas tenir compte des prépositions et des mots de moins de 3 lettres dans nos analyses). Choisissez donc French (pour français), si vous souhaitez vous limiter dans les top mots à 10 mots (mettez 10 dans number of words to be analyzed)… Ensuite appuyez sur le bouton Analyze the text quand tout est OK.

Voici quelques traitements auquels vous aurez accès:

Analyse linguistique : indice de lisibilité, densité lexicale, nombre moyen de syllabes par mots,…

analyse linguistique

10 mots les plus populaires (on aurait pu mettre 1000 dans les paramètres de la page d’accueil) hors prépositions et fréquence d’utilisation dans le texte

10 mots les plus populaires

Longueur des mots (ex de la première ligne: on a 1 240 mots de 3 lettres)

nombre de caratères par mots

Nombre de mots à 1, 2,… n syllabes

nombre de syllabbes par mot

Sympa tous ces traitements ! et vous quels sont les 10 mots que vous utilisez le plus souvent dans vos textes ? quels sont les mots, associations de mots les plus présents dans les commentaires de vos blogs ou skyblogs ? testez tous ces outils et vous le saurez !


advertising


6 commentaires à propos de “Compter le nombre de mots et de caractères d’une liste ou d’un texte

  1. Récemment, j’ai assité a une représentation du spectacle d’Éric Lapointe au festival des mongolfieres. Au début et au milleiux du spectacle je n’ai pas vraiment aimé sa car au début de la représentation, il a eu Brigitte Boisjoli qui a jouer mais moi je ne l’aime pas vraiment. Ensuite, vers le milleux du spectacle il a un couple qui est arrivé vraiment en retard et a la place de rester en arriere comme tout le monde qui est arrivées en retard, non il on décider de depasser et il se sont installer devans moi alors et il me cachait. Aussinon, le spectacle ses bien dérouler et j’ai vraiment apprécier

  2. assalam
    j’ai essayé votre logiciel qui c’est montré interressant et pratique,mais en utilisnat un texte en arabe ,aucun resultat,
    que faire
    merci d’avance

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>