Linguistics and Languages
Technolinguisme et multilinguisme sur Web 3.0 - Usbek et Rica
Y. J. Waliya
Tout d'abord, la langue est un média communicationnel indispensable, que ce soit entre les êtres humains soit entre les humains et les systèmes socio-technologiques intelligents, y compris entre les machines eux-mêmes (Fuller, 2017). L'interaction humaine-machine (IHM) via des interfaces interactives numériques sur Internet est possible grâce à l'affordance de la techno-langue, c'est-à-dire, la société physique est reliée à celle du numérique en reposant non seulement sur les multilingues, mais également sur les multi-technolingues (les langages de programmation) qui tirent majoritairement leurs racines des signes anglo-latins. L'anglais continue probablement à être la langue de mondialisation comblée par Internet depuis des décennies (W3Techs., 2024). Certes, la plupart des inventions numériques sur la Toile depuis 1992 sont dominées par les anglo-saxons. Ainsi, l'expression dynamique Web 3.0 accorde librement aux internautes le contrôle des affaires sociolinguistiques numériques via des agoras de réseaux sociaux centralisés/décentralisés (Facebook, Zoom, Google Meet, YouTube, X, Flickr, LinkedIn, Mastodon, Fediverse, etc.), des moteurs de recherche (Google, Bing, Yahoo, Baidu, Global WP, Exalead, Wikiwix etc.), des applications mobiles (WhatsApp, Instagram, Telegram, Snapchat, etc.), des cryptomonnaies (Bitcoin, Ethereum, Litecoin, Dogecoin, NFTs, etc.) et des métaverses (Second Life, Roblox, Zepeto, Fortnite, etc.). Tous ces éléments renforcent la domination de l'anglais des temps en temps. Il est clair que l'informatique ne peut rien faire sans ces langages spécialisés et l'anglais, car les usagers fabriquent continuellement des mots en vogue qui favorisent l'anglais dans cette ère des données web, opine Anderson cité dans Hiremath et Kenchakkanavar (2016), et l'ère du mobile intelligent où les jeunes se connectent au monde agile. Ces bouleversements soutiennent les IHM, de la réalité virtuelle au monde réel et vice versa, en façonnant les comportements de chacun grâce aux algorithmes (Enjeux RH, 2020). Cet article se concentre sur les phénomènes techno-linguistiques et multilinguistiques présents sur le weblog du magazine trimestriel français, créé en 2010 par Jérôme Ruskin. Le magazine diffuse des informations sur les technologies du futur dans la société réelle. Selon le fondateur, c'est un média qui souhaite faire tester le futur à ses lecteurs. Le magazine tire son nom des personnages curieux des Lettres persanes de Montesquieu, parues en 1721, et son but est d'explorer le futur à travers son magazine. Le weblog possède sa propre cryptomonnaie appelée « usbeks (u) » pour récompenser les utilisateurs ou les lecteurs du blog. Il s'agit d'une monnaie virtuelle complémentaire avec laquelle les lecteurs peuvent acheter n'importe quoi disponible sur la shop en ligne d'Usbek et Rica. Récemment, Jérôme Ruskin et son équipe éditoriale ont lancé de grandes loteries citoyennes pour expérimenter la réalité du futur. Plus les utilisateurs likent (aiment), commentent et partagent les articles journaliers, plus ils bénéficient de « usbeks (u) ». En revanche, la condition interdit aux visiteurs de liker, commenter et partager plus de cinq fois le jour. Ces attributs ci-avant appartiennent à l'expression Web 3.0, héritée des fonctionnalités des Web 2.0 et Web 1.0 respectivement. Cette étude vise également à dévoiler l'homogénéisation de l'anglais comme langue d'Internet, sujet abordé par Barton & Lee (2013) dans leur ouvrage Language Online: Investigating Digital Texts and Practices. À travers leurs apports, ils présentent l'anglais comme un amplificateur de la bonne compréhension du monde numérique. Cette domination semble aller à l'encontre de la politique de l'UNESCO, qui encourage l'accès multilingue universel au cyberespace (UNESCO, 2015). Cependant, dans cette concurrence numérique sociolinguistique, le français se présente ouvertement comme un archi-compétiteur de l'anglais en termes démographiques, géographiques, mercatiques et numériques. Malheureusement, l'anglais gagne toujours cette compétition en raison des termes technologiques en vogue provenant de la Silicon Valley aux États-Unis ; des réseaux sociaux et autres consortiums médiatiques numériques anglais qui rendent Internet anglo-centrique. Ce fait est critiqué par Xue et al. (2021), qui ont été inspirés à développer des modèles multilingues mT5 pour renverser la domination de l'anglais dans le prompt engineering, une langue que 80% de la population mondiale ne comprend pas. En effet, l'anglais occupe 49,7% du contenu linguistique de tous les sites web, l'espagnol le suit avec 5,9%, l'allemand 5,4 %, le japonais 4,9%, et le français est le quatrième avec seulement 4,3% de l'ensemble du contenu (W3Techs, 2024). Avec tous les pays de la Francophonie et la France elle-même, ils ne peuvent pas générer 10% du contenu linguistique total sur la Toile. C'est pourquoi, nous étudions également les comportements des utilisateurs vis-à-vis des choix de langage sur Usbek et Rica tout en suivant les répartitions structurelles de cette recherche ainsi : (i) caractérisation des termes, (ii) problématique, (iii) théorie conceptuelle du technolinguisme, (iv) analyse des nuages de mots-clés ou des thèmes d'articles sur Usbek et Rica. Ensuite, (v) études comparatives du multitechnolinguisme et du multilinguisme sur le Web 3.0, et enfin, nous énoncerons les nouvelles perspectives pour susciter le débat sur le multitechnolinguisme.
L’étude s’inscrit dans les travaux sur la langue en ligne et le multilinguisme numérique. Barton & Lee (2013) présentent l’anglais comme facilitateur de la compréhension du monde numérique, tandis que l’UNESCO (2015) promeut un accès multilingue au cyberespace. Lee (2016) évoque un recul relatif de l’influence de l’anglais, mais l’article constate la pénétration des termes anglais dans d’autres grandes langues via l’alternance codique, phénomène relevé aussi par La Pige (2024) et Refka (2021). Pfrehm (2011) conceptualise le « technolingualism », soulignant l’imbrication profonde de la technologie et de la langue. Xue et al. (2021) développent mT5 pour contester l’anglo-centrisme dans le prompt engineering. Des statistiques récentes (W3Techs, 2024) indiquent que l’anglais représente 49,7% des contenus linguistiques du web, loin devant le français (4,3%). Ces références encadrent la problématique d’une homogénéisation progressive de l’anglais en ligne et motivent l’examen du blog Usbek et Rica.
Cadre conceptuel: approche linguistique écologique de Marie-Anne Paveau, appliquée dans une « Critique du Code de Site Web, Weblog et Micro-blog (CCSWM) », traitant le code source comme un texte à part entière. L’auteur s’inspire des Critical Code Studies et propose une critique spécifique du code de site web, considérant l’algorithmique et le balisage comme des objets discursifs. Dispositif et sources: analyse sémiotique et herméneutique de captures d’écran d’extraits de code (HTML, balises, classes, attributs), de nuages de mots-clés (tag clouds) et d’interfaces (graphopticon) du weblog usbeketrica.com. Exploitation d’outils et sources web: sitemap du site (métadonnées publiques), et considération des outils analytiques (Alexa, Google Web Analytics, Yahoo Web Analytics, etc.) pour situer les interactions utilisateurs. Périodes et corpus: deux fenêtres temporelles principales – du 19/07/2016 au 31/03/2018 et du 01/07/2018 au 18/06/2020 – avec observation complémentaire de l’évolution des thèmes jusqu’en 2024. Corpus constitué des articles publiés (textes, galeries, vidéos), des thèmes/hashtags associés et des extraits de code source pertinents (incluant comparaisons avec des sites arabophones et sinophones pour montrer les constantes anglophones du code). Outils de traitement: modules Python (langdetect, matplotlib.pyplot, pandas) pour collecter/structurer les données depuis le sitemap et produire des visualisations (diagrammes de dispersion des thèmes, comptages des articles par thème, répartition par langue des thèmes et des titres alternant les codes). Procédure: (1) Extraction des URLs et métadonnées via sitemap; (2) Détection/annotation de la langue des thèmes et des segments de titres; (3) Comptage des items par thème et par période; (4) Analyse critique des extraits de code (balises, classes, attributs en anglais) et de leur articulation avec le contenu francophone visible; (5) Interprétation écologique et sémiotique des indices d’anglicisation (vocabulaire technique, code-switching dans les titres, élargissement des thèmes anglais).
- L’anglais est omniprésent dans l’ossature logicielle du web: balises, classes et attributs (ex. div, class, href) structurent des contenus y compris en arabe et en chinois, illustrant une base linguistique anglophone de la programmation.
- Sur Usbek et Rica (2016–2018), le nuage de 38 thèmes comporte 8 thèmes anglais (p. ex. design, food, hacker, Internet, maker, podcast, science-fiction, sport). Entre 2020 et 2024, le nuage passe à 77 thèmes, dont 13 en anglais (p. ex. blockchain, data, VR, Web, leadership), soit une augmentation de plus de 100% du nombre total de thèmes et une progression des thèmes anglais.
- Interactions (19/07/2016–31/03/2018): 648 508 utilisateurs, 4 327 partages, 155 954 articles marqués « lire plus tard » (graphopticon). Les contenus sont interconnectés, partageant des titres rattachés à plusieurs thèmes.
- Production (2016–2018): 2 990 textes, 165 galeries photo, 32 vidéos. Le thème « Technologie » totalise 378 articles, tandis que « Mode » affiche la valeur la plus basse (6 articles). La répartition thématique indique 21,05% de thèmes anglais contre 78,95% de thèmes français.
- Alternance codique dans les titres (2016–2018): 400 articles sur 3 187 présentent un mélange FR-EN (l’étude mentionne 0,13% des articles). Exemples de titres avec segments anglais: « do it yourself », « United colors of », « Web Summit », « Bye bye », « very bad trip », « Crowd, le podcast », « Fake news », « cyberpunk », « blockchain », « Yellowstone ».
- Période 2018–2020: l’étude rapporte 77 articles anglais contre 2 016 articles français et une « augmentation de l’alternance codique de 0,037% ».
- Les navigateurs (Chrome vs Firefox) n’affichent pas uniformément certains cadres (#Ville), illustrant la « labilité » des textes numériques et la variabilité d’interprétation du balisage.
- Constat global: l’homogénéisation de l’anglais comme langue du web est manifeste, tant dans le code (technolangues) que dans le contenu éditorial (thèmes, titres) du blog, avec une influence croissante sur le lexique technologique en français.
Les résultats répondent à la question de recherche en montrant que la structure technique du web (langages de balisage et de programmation centrés sur des mots-clés anglais) favorise une anglicisation diffuse jusque dans les contenus francophones. Sur Usbek et Rica, la présence croissante de thèmes anglais, la fréquence d’anglicismes et de segments en anglais dans les titres, ainsi que les pratiques d’alternance codique, attestent d’une dynamique d’homogénéisation linguistique en ligne. Cette dynamique est renforcée par l’écosystème Web 3.0 (réseaux sociaux, moteurs de recherche, métavers, crypto, IA générative) qui propage rapidement les buzzwords technologiques en anglais. L’approche écologique montre la symétrie de production de sens entre signes linguistiques et extra-linguistiques dans l’environnement numérique: le code source (lisible/illisible) et l’interface visible co-construisent une hégémonie anglophone. Pour le champ des études du multilinguisme, ces observations éclairent comment les technolangues (imprégnées d’anglais) structurent la communication et l’intercompréhension, avec des implications pour les politiques linguistiques (objectif UNESCO de cyberspace multilingue) et la vitalité du français en ligne.
L’étude met en évidence un double mouvement: (1) l’anglais, langue pivot du code et des technolectes, innerve l’infrastructure du web; (2) cette base technique favorise l’essor éditorial de l’anglais (thèmes, anglicismes, alternance codique) au sein d’un média francophone. Le blog Usbek et Rica illustre concrètement cette tendance, tant par ses choix de thématisation que par ses titres hybrides. À terme, le technolinguisme et les langages numériques multimodaux (textuels, iconiques, sonores, emojis) pourraient remodeler les usages linguistiques quotidiens. L’article ouvre des perspectives sur le futur (Web 4.0, interfaces RV/RA lisant les intentions, métavers) et appelle à des politiques actives de préservation des langues naturelles. Pistes futures: concevoir des langages de programmation moins anglo-centriques (voire post-symboliques, à base de dessin), développer des outils/plateformes réellement multilingues, et étudier longitudinalement l’évolution de l’alternance codique dans divers écosystèmes médiatiques.
Related Publications
Explore these studies to deepen your understanding of the subject.

