Descriptions idiolectales et Intelligence artificielle. Que nous dit le deep learning sur les textes ? - Campus AAR
Vidéo Année : 2024

Descriptions idiolectales et Intelligence artificielle. Que nous dit le deep learning sur les textes ?

Afficher 

Résumé

Les sceptiques n’en peuvent mais. L’intelligence artificielle des textes, dont la réalisation la plus connue est Chat GPT, a envahi avec succès nos vies et nos laboratoires. Cependant, la machine n’a ni intelligence ni éthique. Les avatextes qu’elle produit ne sont pas fondés sur un prédicat de vérité et ne sauraient se revendiquer ni du bien, ni du beau, ni du mal. De plus, en l’absence d’intention de la machine, autre que la stochastique, le lecteur ne saurait engager un parcours interprétatif classique sur les contrefaçons textuelles générées ; et non créés. Nos questionnements portent sur la compréhension du mode de fonctionnement des IA, condition pour évaluer les plus-values heuristiques que les traitement deep learning peuvent avoir dans l’analyse des corpus textuels : l’interprétabilité/explicabilité des modèles est la question essentielle et préalable à tout usage scientifique (vs. commercial) de l'IA. En d’autres termes, l’IA, plus que tout autre traitement automatique, « suppose une herméneutique des sorties logicielles » (F. Rastier, La mesure et le grain, Champion, 2011 : 43). Nous plaiderons que les modèles convolutionnels (CNN) ont le pouvoir de rendre compte de l’axe syntagmatique, c’est-à-dire qu’ils exhibent les combinaisons saillantes sur la chaine des textes. Tandis que les modèles transformers ont le pouvoir de rendre compte de l’axe paradigmatique, c’est-à-dire qu’ils identifient les sélections ou les « rapports associatifs » (Le Cours, Chapitre V, pp. 170-175 de l'éd 1972) des textes en corpus. Dans les deux cas, et de manière fermement complémentaire, c’est à un effort de co(n)textualisation que nous appelons – le mot en relation syntagmatique avec son co-texte immédiat, le mot en association avec ses coreligionnaires du paradigme en mémoire ou en corpus – pour une sémantique non pas formelle mais une sémantique de corpus.

Dates et versions

hal-04661880 , version 1 (25-07-2024)

Licence

Identifiants

  • HAL Id : hal-04661880 , version 1

Citer

Damon Mayaffre, Pierre-Jean Vigny, Unité Tice-Dsirn, Raphaëlle Herve. Descriptions idiolectales et Intelligence artificielle. Que nous dit le deep learning sur les textes ?. 2024. ⟨hal-04661880⟩
5 Consultations
0 Téléchargements

Partager

More