Les IA génératives : une révolution des pratiques artistiques ?

Le salon « Image-Jams » du serveur Discord de Midjourney.
Le salon « Image-Jams » du serveur Discord de Midjourney.

Résumé

L’émergence soudaine d’IA génératives (GenIA) capables de créer textes et images à partir d’une simple requête en langage naturel a créé des secousses dans le monde de la culture. De nombreuses analyses ont paru dans les médias, relayant l’inquiétude des artistes et allant parfois jusqu’à prophétiser leur remplacement par des machines. La trajectoire des GenIA présente de nombreuses similarités avec celle des technologies musicales : leur démocratisation, du laboratoire au grand public ; le développement d’outils de création qui encapsulent ou modélisent des connaissances ; la naissance de communautés de création qui inventent de nouvelles pratiques et brouillent la frontière entre professionnels et amateurs. Enfin, ces phénomènes s’inscrivent tous deux dans un contexte de culture de masse caractérisé par une médiation de la consommation contrôlée par les géants du numérique et soumise au régime de l’économie de l’attention. En prenant pour modèle la trajectoire des technologies musicales et de leurs effets esthétiques et sociaux, cet article défend la position selon laquelle l’avènement des GenIA pour la créativité n’est qu’une instanciation supplémentaire d’un processus d’automatisation de la production amorcé de longue date. Sans pour autant nier la possibilité que les GenIA soient bel et bien les premiers soubresauts d’un futur changement de paradigme, il semblerait que leur développement s’inscrive jusqu’ici dans un continuum technologique initié par la reproductibilité mécanique et prolongé par l’introduction des outils numériques pour la production artistique.

Mots-clés : IA génératives (GenIA), intelligence artificielle (IA), outils de créativité, technologies de production musicale, Gafam.

Abstract

The sudden emergence of generative AI (GenAI) capable of creating texts and images from a simple query written in natural language has caused tremors in the cultural world. Numerous analyses have appeared in the media, echoing the concerns of artists and sometimes even predicting their replacement by machines. The trajectory of GenAI bears many similarities to that of musical technologies: their democratization, from the laboratory to the general public; the development of creative tools that encapsulate or model knowledge; the birth of creative communities that invent new practices and blur the line between professionals and amateurs. Furthermore, these phenomena both take place in a context of mass culture characterized by a meditation of the consumption under the control of big tech and subjected to the rule of the attention economy. By taking the trajectory of musical technologies and their aesthetic and social effects as a model, this article argues that the advent of GenAI for creativity is merely another instance of a long-established process of production automation. While not denying the possibility that GenAI might indeed signal the beginnings of a future paradigm shift, it seems that their development so far fits into a technological continuum initiated by mechanical reproducibility and extended by the introduction of digital tools for artistic production.

Keywords: Generative AI (GenAI), artificial intelligence (AI), creativity tools, music production technologies, Big Tech.

Les IA génératives : une révolution des pratiques artistiques ?

Generative AI: a revolution of artistic practices ?

Introduction 

Les intelligences artificielles génératives (GenIA) pour la musique et les images vont-elles remplacer les artistes ? C’est ce que prophétisent certains journalistes ou ce qu’annoncent de récents mouvements dans l’industrie culturelle, comme la grève du syndicat d’acteurs hollywoodiens SAG-Aftra en 20231. Après des décennies d’art numérique et algorithmique, quelle place les GenIA vont-elles trouver dans les pratiques artistiques et quelles sont les implications de l’accessibilité croissante de ces outils sur le statut des artistes et de leurs productions ? 

En prenant la trajectoire des technologies musicales et de leurs effets esthétiques et sociaux pour modèle, cet article défend la position selon laquelle l’avènement des GenIA pour la créativité n’est qu’une instanciation supplémentaire d’un processus d’automatisation de la production amorcé de longue date. Sans qu’il ait pour l’heure introduit une différence qualitative notable dans ses produits, ce processus est avant tout intrinsèquement lié aux logiques de l’économie capitaliste. Comme l’écrit Karl Marx, la quête incessante de productivité mène logiquement à la conception de machines qui intègrent le savoir-faire des travailleurs, ce qui les déplace en périphérie du processus de production (« Fragment sur les machines », Manuscrits de 1857-1858).

Ainsi, ce texte ne soutient pas que l’art humain soit menacé par les productions des machines, mais plutôt qu’il se métamorphose plus visiblement que par le passé du fait d’une explosion des pratiques amateurs dans lesquelles les protagonistes s’investissent avec sérieux et où les GenIA occupent une place centrale. Ce phénomène ne révèle donc pas une rupture : il semble plutôt, au contraire, que l’on puisse l’interpréter comme la suite logique d’un développement global de numérisation et d’automatisation de la production, qui n’épargne pas le milieu de l’art. S’appuyer sur ce continuum ne revient pas pour autant à nier que des tendances de fond plus importantes sont à l’œuvre et n’implique pas non plus que les pratiques sont uniformes ou qu’elles évoluent linéairement. Si les filiations technologiques des GenIA peuvent être retracées sans trop de peine, les esthétiques et les dynamiques sociales qui accompagnent leur émergence sont plus difficiles à mettre en évidence, du fait de leur fragmentation et de leurs ramifications multiples. 

Aspects sémantiques et perspective méthodologique

« Intelligence artificielle » (IA) est une expression pour laquelle il n’y a, dans le champ de l’informatique, « pas de définition largement acceptée » et qui désigne des « perspectives qui devraient être considérées comme des champs de recherche différents2 » (WANG : 2019, p. 14). On peut la définir de façon très générale comme un artefact technologique doté de capacités en lien avec l’intelligence humaine, telles que la cognition, l’apprentissage ou le raisonnement. Dans ce texte, l’emploi de cette expression fait référence au développement historique de l’ensemble des travaux qui ont abouti au développement récent des GenIA. La formule « IA générative » est utilisée par le grand public pour désigner une catégorie d’applications qui permettent de générer aisément des contenus, mais elle est en revanche très peu employée par les chercheurs en informatique qui développent ces outils (GARCÍA-PEÑALVO : 2023). Les GenIA désignent plus précisément des « techniques computationnelles capables de générer du contenu en apparence nouveau et porteur de sens, comme du texte, des images ou de l’audio, à partir de l’entraînement de données » (FEUERRIEGEL : 2024, p. 111). Au-delà de ces aspects techniques, il faut souligner que le terme de « technologie » entremêle trois « couches sémantiques » : la matérialité, les activités humaines qui s’y rattachent et les connaissances développées dans leur sillage (MACKENZIE, WAJCMAN : 1985, p. 3). 

Les effets techniques, sociaux et esthétiques des GenIA sont ici envisagés à partir de la trajectoire des technologies du son et de la musique, aisément identifiables, car elles ont fait l’objet de nombreux travaux. En quelques décennies, les recherches sur le son et le traitement du signal ont conduit au développement commercial d’outils musicaux exécutables sur les appareils informatiques du quotidien : ordinateur, tablette, smartphone. L’exemple de la synthèse sonore est révélateur de ces trajectoires technologiques qui, comme celles des outils d’IA, émergent dans les laboratoires pour atteindre, dans un second temps, le grand public. Parmi les premiers travaux informatiques dans ce domaine, ceux de Jean-Claude Risset sur l’analyse et la synthèse des sons – menés dans l’équipe de Max Mathews entre 1964 et 1969 (RISSET : 2008) aux Bell Telephone Laboratories – ont fait date. Il y rencontre John Chowning, qui met au point en 1967 un algorithme de synthèse des sons par modulation de fréquence (la synthèse FM) grâce au logiciel Music V, développé par Mathews. Chowning dépose un brevet via l’Université de Stanford en 1975 (NELSON : 2015), où il est employé. Au début de la décennie 1980, Yamaha exploite ce brevet en produisant des puces électroniques qui équiperont d’abord les synthétiseurs de la marque aux trois diapasons (notamment le DX7, l’un des premiers instruments numériques à être un véritable succès commercial) puis de nombreux jeux vidéo d’arcade. Ces bandes-son vidéoludiques fournies par les puces Yamaha (entre autres constructeurs) marquent durablement les imaginaires sonores et activent une créativité musicale qui se cristallise par exemple dans l’esthétique chiptune, qu’on trouve aussi bien dans la sous-culture demoscene (McALPINE : 2018) que dans les musiques électroniques de danse (EDM).

De la recherche fondamentale à l’IA appliquée

L’arrivée des GenIA dans la conscience collective n’est que l’étape la plus récente de longs développements jusqu’alors inaccessibles au grand public – l’art génératif (dit aussi « numérique » ou « algorithmique ») existe en effet depuis les années 1960 (BODEN, EDMONDS : 2009). Après la Seconde Guerre mondiale, plusieurs moments fondateurs pour l’IA méritent mention. Alan Turing propose son célèbre « jeu d’imitation », qui vise à tester la capacité d’une personne à déterminer si elle a une interaction écrite avec un autre humain ou bien avec une machine (TURING : 1950). L’expression d’« intelligence artificielle » est officiellement introduite en 1956, lors du Dartmouth Summer Research Project on Artificial Intelligence (McCARTHY et al. : 1955). Ces deux mois de réflexion commune sont organisés par des mathématiciens et des informaticiens, parmi lesquels John McCarthy et Claude Shannon.

Les recherches s’intensifient au cours des décennies suivantes, au Stanford Artificial Intelligence Lab (fondé en 1963 par McCarthy) ou dans le Project MAC du MIT – aujourd’hui devenu Computer Science and Artificial Intelligence Laboratory – porté par Robert Fano, un proche collaborateur de Shannon. De nombreux systèmes expérimentaux sont alors développés, comme Eliza, un programme de traitement automatique des langues qui augure des chatbots. Malgré des avancées théoriques importantes, experts et financeurs restent sceptiques, d’autant plus que les dimensions applicatives (et leur potentiel économique) ne sont pas au rendez-vous. La recherche dans ce domaine est donc marquée par une période creuse qui voit une réduction des financements, parfois nommée « hiver de l’IA » (HAENLEIN : 2019, p. 3-4).

Dans les années 1990, la puissance de calcul des ordinateurs passe un cap. La victoire que remporte Deep Blue (une machine d’IBM utilisant des techniques d’IA) contre Garry Kasparov lors du match retour3 de leur partie d’échecs en mai 1997 est ultramédiatisée. Dans le même temps, loin de la conscience publique, l’industrie et l’armée intègrent en sous-main ces technologies à leur arsenal. En 1990, alors que l’armée américaine s’apprête à lancer l’opération « Desert Shield » (phase logistique qui amorce la première guerre du Golfe) en déployant ses forces et son matériel en Arabie saoudite (plus de 2,4 millions de tonnes de cargaison déplacées lors des six premiers mois), elle décide de confier la planification de la logistique à un outil IA : DART4. D’après Victor Reis, alors directeur de la DARPA5, les économies réalisées grâce à DART permettent de rembourser trente années d’investissement dans la recherche en IA en quelques mois seulement (HEDBERG : 2002). 

Au tournant du millénaire, les entreprises du numérique investissent massivement dans l’IA pour optimiser leurs services, tirant ainsi la recherche en avant. Dès 2001, Google utilise l’IA pour corriger automatiquement les requêtes contenant des fautes de frappe dans son moteur de recherche, puis lance Google Translate en 2006, un service de traduction en ligne propulsé par l’IA6. À partir de 2012, Facebook utilise à son tour ces outils pour traiter les données de ses utilisateurs et améliorer le ciblage de ses publicités (HAO : 2021). En 2016, le programme AlphaGo, conçu par Google DeepMind, bat Lee Sedol, multiple champion du monde de go (SILVER et al. : 2016), un jeu qui présente un nombre de mouvements possibles immensément plus grand que les échecs : environ 10170 pour le premier contre 1047 pour le second (LI et DU : 2018). Enfin, le début des années 2020 marque l’arrivée d’IA dites « génératives » (GenIA) à destination du grand public, dans des applications de génération de texte et d’images.

L’encapsulation des compétences comme facteur de démocratisation

Lors des décennies 1980 et 1990, les stations de travail audionumériques (STAN) font leur apparition. Ces logiciels de production musicale encapsulent des connaissances de théorie musicale et des techniques d’ingénierie sonore. Intégrant l’ensemble de la chaîne de production d’un enregistrement, ils affectent profondément les pratiques musicales (bedroom studio) et les modes de consommation (MP3, streaming). Il existe aujourd’hui des STAN de complexité variable et à bas coût (ou gratuits) sur de nombreuses plates-formes grand public, telles qu’ordinateurs (Ableton Live, GarageBand), smartphones, tablettes (FL Studio Mobile, Cubasis) et même consoles de jeux vidéo (Music 2000, Korg Gadget). En permettant une démocratisation de l’accès à la production musicale et l’émergence de nouveaux genres musicaux, les STAN ont eu une grande influence sur le son des dernières décennies (REUTER : 2022).

D’une manière assez similaire, les applications fondées sur des GenIA ont, depuis leur apparition, proliféré dans tous les domaines créatifs du numérique (GOZALO-BRIZUELA : 2023). Elles sont, de plus, en train de transformer les logiciels de création traditionnels. Progressivement intégrées à un nombre croissant d’étapes de production, elles permettent de réduire la complexité de nombreuses opérations. Ainsi, au début de l’année 2023, Adobe a introduit Firefly7, une série de GenIA intégrée à ses applications de création d’image comme Photoshop ou Illustrator et qui permet de réaliser des opérations de génération ou d’édition. Firefly permet ainsi d’enlever ou d’ajouter de nouveaux éléments dans une image existante (« remplissage génératif »). Une autre fonctionnalité, en développement sous le nom de Project Stardust, devrait bientôt permettre de déplacer des objets dans une image8.

Le champ de l’IA recoupe des techniques de natures différentes permettant de modéliser des connaissances dans une machine. Ces connaissances peuvent être inscrites sous forme de règles explicites caractérisant un domaine particulier (systèmes experts), comme c’était le cas pour Deep Blue, qui intégrait la connaissance des échecs directement dans son code et dans son hardware (CAMPBELL : 2002). Ces connaissances peuvent alternativement être modélisées à travers des techniques d’apprentissage machine (machine learning), comme les réseaux de neurones artificiels du programme AlphaGo. Contrairement aux techniques d’IA basées sur des règles, les techniques de machine learning sont génériques. Elles permettent de résoudre une grande variété de problèmes, à condition d’avoir un vaste jeu de données (dataset) de qualité pour entraîner le programme. Les GenIA utilisent le machine learning et ont donc nécessité l’analyse de grandes quantités de données : la première version de DALL-E a été entraînée sur 250 millions de paires texte-image (RAMESH : 2021), tandis que GPT-3 (l’un des modèles de ChatGPT) utilise 570 gigaoctets de textes en grande partie issus de Common Crawl, un jeu de données de contenus Web ouvert (BROWN : 2020). Les datasets utilisés pour entraîner les derniers modèles de GenIA commerciales sont tenus secrets, mais certains affirment qu’ils contiennent des contenus protégés par le droit d’auteur (BAACK : 2024), ce que refusent artistes et organisations, désireux d’être rétribués pour l’utilisation de leurs œuvres.

De nombreuses applications de GenIA fonctionnent par la saisie d’une requête en langage naturel (un prompt) dans un champ de texte. Ces outils ont la particularité de pouvoir fournir des contenus au-delà de ce qui leur est strictement demandé. Ils surmontent les requêtes ambiguës, vagues ou incomplètes et génèrent des résultats, même quand les détails ne sont pas explicitement fournis9. Les GenIA sont aussi capables d’intégrer des éléments de contexte qui ne sont pas directement exprimés dans un prompt donné. ChatGPT garde par exemple en mémoire l’historique des messages antérieurs et est capable de mobiliser une information précédemment acquise lorsqu’elle est pertinente. Enfin, les GenIA sont parfois implémentées comme des assistants susceptibles de s’activer spontanément. GitHub Copilot est un outil d’aide à la programmation informatique qui suggère du code. Intégré à un éditeur de texte, il reste en attente en arrière-plan et quand l’utilisateur commence à entrer des caractères, l’autocomplétion de Copilot s’active et lui offre une suggestion qui peut parfois compter des dizaines de lignes de code. L’outil prend aussi en compte le contexte : il propose une réponse adéquate au langage de programmation et s’appuie sur les actions précédentes de l’utilisateur.

Une large part de la population a aujourd’hui accès aux GenIA via les appareils informatiques personnels. Elles sont, de plus, proposées à bas prix : l’abonnement « basic » pour Midjourney s’élève à 10 USD (soit environ 9,2 €) par mois10 et ChatGPT 3.5 est gratuit11. Ces prix sont artificiellement tirés vers le bas par une compétition féroce entre de jeunes entreprises à la croissance fulgurante, qui se battent pour acquérir un avantage stratégique sur ce marché prometteur. Malgré cette facilité d’accès pour les utilisateurs, les coûts de développement et de maintenance d’une IA générative restent très élevés et nécessitent des ressources computationnelles coûteuses et accessibles seulement à des organismes privés. Pariant sur l’avenir, ceux-ci opèrent pour le moment à perte et restreignent l’accès aux versions les plus performantes de leurs outils (OREMUS : 2023). Cependant, des modèles alternatifs d’IA, plus efficaces et plus performants, comme Mistral7B (JIANG : 2023), ont récemment émergé et annoncent une baisse des coûts de computation, semblant ainsi confirmer la tendance à une facilité d’accès aux GenIA pour leurs utilisateurs.

La génération comme activité artistique et sociale

D’après Nick Prior, « l’éthique DIY si chère aux punk rockers n’est plus aujourd’hui une simple idéologie militante, mais la condition systématique et structurelle de la production musicale tout entière » (PRIOR : 2018). L’émergence de plates-formes et de communautés en ligne permettant la diffusion de productions et le partage de connaissances constitue un pan central de ce nouveau paradigme de production musicale. Ainsi, les technologies numériques « se sont articulées avec les pratiques contemporaines sociales, économiques et politiques pour établir les bases d’un système de production et de consommation de la culture reconfiguré – un système qui brouille cette séparation [entre production et consommation] » (PRIOR : 2018). 

À l’instar des pratiques numériques de la musique, l’utilisation des GenIA donne naissance à des communautés en ligne qui contribuent à dynamiser l’activité et les interactions des créateurs. Le serveur Discord de Midjourney est sans doute la plus célèbre de ces communautés. Outil de messagerie et de discussion vocale instantané structuré en « salons » (canaux de discussions), Discord prend en charge les commandes informatiques, qui peuvent être paramétrées par les administrateurs des serveurs. Midjourney a mis à profit cette fonctionnalité pour permettre la génération d’images directement depuis le chat : le prompt doit être précédé de la commande « /imagine » pour être pris en charge par l’outil. Midjourney a fait de Discord son interface utilisateur exclusive, permettant ainsi d’insérer l’activité de création d’images par IA dans un contexte intrinsèquement social. Le serveur de Midjourney comprend de nombreux canaux publics réservés à la génération d’images, qui permettent aux utilisateurs de voir défiler en temps réel les prompts et les résultats générés. Le serveur comprend aussi des salons d’entraide, de discussion générale, ou encore des canaux thématiques qui stimulent les échanges entre les utilisateurs du service. 

Le salon « Image-Jams » du serveur Discord de Midjourney.
Le salon « Image-Jams » du serveur Discord de Midjourney.

Dans un article récent sur les communautés d’utilisateurs de GenIA de création d’images, Téo Sanchez identifie un « groupe sociodémographique étroit » (SANCHEZ : 2023, p. 7) dans lequel professionnels de l’informatique, de l’art et de la culture sont surreprésentés. Cette étude s’appuie sur un questionnaire soumis à une vingtaine de communautés en ligne centrées sur la génération d’images par IA hébergées sur Reddit, Facebook et Discord (64 répondants au total). Elle montre que les membres de ces communautés sont mus par des motivations diverses. Outre la dimension récréative ou la simple curiosité, une proportion significative des utilisateurs mentionne un usage artistique. Un répondant sur huit déclare utiliser les GenIA à des fins « d’expression de soi », voyant dans cet usage la pratique d’une « forme d’expression riche, qui va au-delà de la récréativité et de la curiosité » (SANCHEZ : 2023, p. 8). L’un des répondants attribue même des vertus thérapeutiques à cette pratique, faisant ainsi écho à des propos de David Holz, le fondateur de Midjourney : « L’usage général relève dans une large proportion de l’art-thérapie […]. Les images ne sont pas vraiment esthétiquement plaisantes au sens universel, mais elles le sont de façon bien plus profonde, car elles s’inscrivent dans le contexte de la vie privée des utilisateurs » (KELLY : 2022). 

Les membres de communautés comme Midjourney explorent ensemble les techniques du « prompt-engineering », une expression désignant l’activité de formulation itérative de requêtes permettant un meilleur contrôle des résultats générés. L’ajout de mots-clés, appelés « prompt modifiers », permet de contrôler de nombreux aspects de l’image (voire d’y introduire de l’aléatoire), tels que le sujet, le style artistique ou la qualité (voir la taxinomie proposée par OPPENLAENDER : 2023). Sous l’angle des pratiques informationnelles (HII), le modèle d’une GenIA peut être considéré comme un « index infini » dans lequel chaque prompt est une requête générant de nouveaux résultats au lieu d’extraire un objet existant (DECKERS : 2023, p. 172). Dans les pratiques de génération d’images, les itérations successives de prompts hautement sophistiqués deviennent alors de « longues chaînes de mots-clés plutôt que des descriptions textuelles » (Ibid., p. 181), qui produisent systématiquement une image – mais jamais une erreur ni du néant. En puisant dans L’Interprétation des rêves de Freud, Jens Schröter émet l’hypothèse suivante : puisque les GenIA sont entraînées à partir de millions d’images en ligne, elles pourraient représenter une forme de matérialisation des représentations archétypales de l’inconscient collectif : « Nous pourrions alors nous demander si ces images statistiques, issues de millions d’images en ligne, rendent visible une chose déjà présente dans la masse des images, à savoir une “image collective” de l’inconscient collectif » (SCHRÖTER : 2023, p. 118).

Discussion conclusive : rupture, continuité et politique des GenIA

L’introduction de technologies numériques dans la production musicale, amorcée dans les années 1960, a provoqué un ensemble de processus et de mutations que nous pouvons aujourd’hui analyser avec recul. Ceux qui ont cours aujourd’hui dans la production artistique par le biais des GenIA représentent un phénomène trop récent pour être envisagé dans toute son ampleur. Cet article plonge dans l’histoire des outils IA et dans ses répercussions industrielles, sociales et artistiques, en prenant pour toile de fond la révolution numérique dans la musique – deux phénomènes qui sont d’ailleurs presque exactement contemporains. Ces trajectoires présentent de nombreuses similarités : la démocratisation technologique, du laboratoire au grand public ; le développement d’outils de création qui encapsulent ou modélisent des connaissances ; la naissance de communautés de création qui brouillent la frontière entre professionnels et amateurs.

L’analyse des évolutions technologiques présente de nombreux écueils. La célèbre maxime de Roy Amara dit qu’« on a tendance à surestimer l’effet d’une technologie dans le court terme et sous-estimer son effet à long terme ». Ainsi, les passerelles entre la musique assistée par ordinateur et la génération d’images par IA signifient probablement que les annonces de la mort imminente de l’art et des artistes sont dépourvues de réel fondement. Comme le montre l’histoire de la numérisation des outils de production musicale, il est plus probable que de nouveaux genres artistiques, de nouvelles communautés créatives et de nouvelles expertises apparaîtront, sans que l’art s’éteigne pour autant. Cette hypothèse a l’avantage de laisser ouverte la possibilité que les GenIA soient bel et bien les premiers soubresauts d’un lent changement de paradigme. Elle évoque immanquablement l’entrée dans l’ère de la reproductibilité technique des œuvres, théorisée par Walter Benjamin il y a presque un siècle. Elle évoque aussi la possibilité d’une sortie de la culture des relations d’échange capitaliste, suivant un processus esquissé par Marx dans son « Fragment sur les machines ». À terme, les GenIA pourraient bouleverser les notions mêmes d’œuvre d’art, de travail artistique ou encore le concept d’auteur, dont la mort a été annoncée par Roland Barthes dans son célèbre essai de 1967, « The Death of the Author ».

Cependant, l’arrivée des GenIA comme la numérisation de la production musicale s’inscrivent plus largement dans un contexte de culture de masse caractérisé par une surabondance de production (CITTON : 2014) et une médiation de la consommation contrôlée par les Gafam. Ces dernières ont une longue histoire d’appropriation des utopies imaginées par les pionniers de la contre-culture du numérique. Leurs déclarations de mission sont révélatrices d’une stratégie de communication consistant à faire croire au grand public qu’elles sont une force émancipatrice pour l’humanité. Ainsi, au cours des années 2000, Google clamait haut et fort son slogan « Don’t be evil », alors même qu’elle déployait une gigantesque infrastructure d’extraction des données privées (ZUBOFF : 2018). Si l’art ne semble pas directement menacé par les GenIA, il paraît en revanche urgent de nourrir un questionnement plus large sur la relation entre industries de la Tech, production et consommation de contenu culturel ; pour l’implémentation de GenIA libres et gérées comme des communs, pour la liberté de la culture et pour la liberté des moyens de communication qui permettent de la partager.

Un grand merci à Baptiste Bacot pour son aide précieuse dans la rédaction de cet article, les discussions partagées sur le sujet et ses relectures patientes.

Notice biographique

Sébastien Piquemal (second-hander.com) est un activiste, ingénieur et artiste repenti. Il est passionné par les questions du numérique et de la culture dans la société du capitalisme tardif. Après une courte carrière d’artiste numérique – durant laquelle il présente son travail dans de nombreuses conférences et lieux de concert (CTM, café OTO, NIME, ICMC, etc.) –, il se met à questionner son rôle en tant que créateur individualiste évoluant dans un espace culturel saturé. Après un passage au sein du mouvement écologiste Extinction Rébellion, il entame des recherches sur le rôle de l’art dans le maintien du système capitaliste et sur les moyens de renverser ce rôle pour penser des modalités de création culturelle qui soient plus collectives et axées sur le soin. Développeur open source actif, il est aussi le mainteneur de la librairie WebPd, qui permet de créer des applications audio pour le Web grâce au langage de programmation graphique Pure Data (Pd).

Notes de bas de page
  1. Parmi les revendications, les membres du syndicat s’opposaient à la capture numérique de leur profil, qui laissait entrevoir un usage de leur image hors de tout cadre légal grâce aux outils IA.
  2. Toutes les traductions sont de l’auteur.
  3. Entre les deux matchs, l’architecture de Deep Blue a été optimisée, ce qui a eu pour effet d’augmenter considérablement sa puissance.
  4. Pour Dynamic Analysis and Replanning Tool (outil de dynamique d’analyse et de replanification).
  5. La Defense Advanced Research Projects Agency (Agence pour la recherche en projets avancés de défense), à laquelle on doit aussi Arpanet, l’aîné de l’Internet.
  6. Voir : https://blog.google/technology/ai/google-ai-ml-timeline/ (consulté le 13 mars 2024).
  7. Voir : https://blog.adobe.com/en/publish/2023/03/21/bringing-gen-ai-to-creative-cloud-adobe-firefly (consulté le 13 mars 2024).
  8. Voir : https://www.adobe.com/max/2023/sessions/project-stardust-gs6-11.html (consulté le 13 mars 2024).
  9. Voir : https://openai.com/research/dall-e (consulté le 13 mars 2024).
  10. Voir : https://docs.midjourney.com/docs/plans (consulté le 13 mars 2024).
  11. Voir : https://openai.com/chatgpt/pricing (consulté le 13 mars 2024).
Bibliographie

Bibliographie

  • BAACK Stefan (2024), « Training Data for the Price of a Sandwich », Mozilla Insights. [En ligne] < https://foundation.mozilla.org/en/research/library/generative-ai-training-data/common-crawl/> (consulté le 23 mars 2024).
  • BODEN Margaret et EDMONDS Ernest (2009), « What is generative art? », Digital Creativity, vol. 20, nos1-2, p. 21-46.
  • BROWN Tom et al. (2020), « Language models are few-shot learners », Advances in Neural Information Processing Systems 33, Annual Conference on Neural Information Processing Systems 2020, December 6-12, 2020, virtual. [En ligne] < https://proceedings.neurips.cc/paper/2020/hash/1457c0d6bfcb4967418bfb8ac142f64a-Abstract.html>(consulté le 13 mars 2024).
  • CAMPBELL Murray, HOANE Joseph A. Jr, and HSU Feng-hsiung (2002), « Deep blue », Artificial intelligence, vol. 134, nos1-2, p. 57-83.
  • CITTON Yves (2014), « Introduction », L’Économie de l’attention. Nouvel horizon du capitalisme ?, Paris, La Découverte, p. 7-31.
  • DECKERS Niklas et al. (2023), « The infinite index: Information retrieval on generative text-to-image models », CHIIR ‘23: Proceedings of the 2023 Conference on Human Information Interaction and Retrieval, Austin, TX, USA, March 19-23 2023, p. 172-186. [En ligne] < https://dl.acm.org/doi/pdf/10.1145/3576840.3578327> (consulté le 13 mars 2024).
  • FEUERRIEGEL Stefan et al. (2024), « Generative AI », Business & Information Systems Engineering, vol. 66, no1, p. 111-126.
  • GARCÍA-PEÑALVO Francisco et VÁZQUEZ-INGELMO Andrea (2023), « What do we mean by GenAI? A systematic mapping of the evolution, trends, and techniques involved in Generative AI », International Journal of Interactive Multimedia and Artificial Intelligence, vol. 8, no4, p. 7-16.
  • GOZALO-BRIZUELA, Roberto et GARRIDO-MERCHÁN Eduardo C. (2023), « A survey of Generative AI Applications », arXiv [En ligne] < https://arxiv.org/abs/2306.02781> (consulté le 13 mars 2024).
  • HAO Karen (2021), « How Facebook got addicted to spreading misinformation », MIT Technology Review, 11 mars 2021. [En ligne] < https://www.technologyreview.com/2021/03/11/1020600/facebook-responsible-ai-misinformation/> (consulté le 13 mars 2024).
  • HAENLEIN Michael et KAPLAN Andreas (2019), « A Brief History of Artificial Intelligence: On the Past, Present, and Future of Artificial Intelligence », California Management Review, vol. 61, no4, p. 5-14.
  • HEDBERG Sara Reese (2022) « DART: Revolutionizing logistics planning », IEEE Intelligent Systems, vol. 17, no3, p. 81-83.
  • JIANG Albert Q. et al. (2023), « Mistral 7B », arXiv [En ligne] < https://arxiv.org/abs/2310.06825  > (consulté le 13 mars 2024).
  • KELLY Kevin (2022), « Picture Limitless Creativity at Your Fingertips », Wired, 17 novembre 2022. [En ligne] < https://www.wired.com/story/picture-limitless-creativity-ai-image-generators/> (consulté le 13 mars 2024).
  • LI Fangxing et DU Yan, « From AlphaGo to power system AI: What engineers can learn from solving the most complex board game », IEEE Power and Energy Magazine, vol. 16, no2, p. 76-84.
  • McALPINE Kenneth B. (2018), Bits and Pieces. A History of Chiptunes, New York, Oxford University Press.
  • McCARTHY et al. (1955), « A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence ». [En ligne] < https://raysolomonoff.com/dartmouth/boxa/dart564props.pdf> (consulté le 13 mars 2024).
  • NELSON Andrew J. (2015), The Sound of Innovation. Stanford and the Computer Music Revolution, Cambridge (Mass.), MIT Press.
  • OPPENLAENDER Jonas (2023), « A taxonomy of prompt modifiers for text-to-image generation », Behaviour & Information Technology. [En ligne] < https://www.tandfonline.com/doi/epdf/10.1080/0144929X.2023.2286532> (consulté le 13 mars 2024).
  • OREMUS Will (2023), « AI chatbots lose money every time you use them. That is a problem », The Washington Post, 5 June 2023. [En ligne] < https://www.washingtonpost.com/technology/2023/06/05/chatgpt-hidden-cost-gpu-compute/> (consulté le 13 mars 2024).
  • PRIOR Nick (2018), « New amateurs revisited: Popular music, digital technology, and the fate of cultural production », Routledge Handbook of Cultural Sociology, Routledge, p. 340-348.
  • RAMESH Aditya et al. (2021), « Zero-Shot Text-to-Image Generation », Proceedings of Machine Learning Research, 139, International Conference on Machine Learning, 18-24 July, virtuel. [En ligne] < https://proceedings.mlr.press/v139/ramesh21a.html > (consulté le 13 mars 2024).
  • REUTER Anders (2022), « Who let the DAWs Out? The Digital in a New Generation of the Digital Audio Workstation », Popular Music and Society, vol. 45, no2, p. 113-128.
  • RISSET Jean-Claude (2008), Du Songe au son. Entretiens avec Matthieu Guillot, Paris, L’Harmattan.
  • SANCHEZ Téo (2023), « Examining the Text-to-Image Community of Practice: Why and How do People Prompt », C&C 23: Proceedings of the 15th Conference on Creativity and Cognition, June 2023, virtuel, France. [En ligne] < https://hal.science/hal-04127516v1/file/c_c_2023_prompting_camera_ready_author_version.pdf > (consulté le 13 mars 2024).
  • SCHRÖTER Jens (2023), « The AI Image, the Dream, and the Statistical Unconscious », IMAGE, The Interdisciplinary Journal of Image Sciences, vol. 37, no1, p. 112-120. [En ligne] < https://www.academia.edu/102588826/The_AI_Image_the_Dream_and_the_Statistical_Unconscious > (consulté le 13 mars 2024).
  • SILVER David et al. (2016), « Mastering the game of Go with deep neural networks and tree search », Nature, vol. 529, p. 484-489. [En ligne] < https://www.nature.com/articles/nature16961 > (consulté le 13 mars 2024).
  • TURING Alan M. (1950), « Computing machinery and intelligence », Mind, vol. 59, no236,‎ p. 433-460. [En ligne] < https://web-archive.southampton.ac.uk/cogprints.org/499/ > (consulté le 13 mars 2024).
  • WANG Pei (2019), « On defining artificial intelligence », Journal of Artificial General Intelligence, vol. 10, no2, p. 1-37.
  • ZUBOFF Shoshana (2018), The Age of Surveillance Capitalism, Londres, Profile Books.