top of page

Gecko Webdesign

  • Rodrigue Brunet

Google embellit la réalité pour promouvoir sa nouvelle IA Gemini

Pour promouvoir sa nouvelle intelligence artificielle Gemini, Google a quelque peu altéré la réalité. Google vient tout juste de dévoiler Gemini, sa réponse à ChatGPT, et il est indéniable que les démonstrations de Google sont impressionnantes... peut-être même un peu trop.


La bataille des intelligences artificielles est lancée, et dans ce conflit, Google arrive armé de Gemini, son grand modèle de langage qui est, selon lui, "nettement en avance" sur la concurrence. Le géant de la recherche met en avant la compréhension avancée de Gemini par rapport aux contenus audio et vidéo. Bien que le cerveau numérique de Google ne soit pas encore disponible en français, la démonstration en anglais de Google était tout simplement époustouflante.



Une démonstration trop belle pour être vraie


Pendant six courtes minutes, on observe l'IA analyser et réagir presque en temps réel à ce que la caméra montre. La machine semble comprendre instantanément lorsqu'une main commence à jouer à pierre-feuille-ciseaux, reconnaître des imitations ratées de Matrix, voire jouer des morceaux de musique adaptés aux instruments gribouillés sur un post-it. Malheureusement, tout n'est pas aussi fluide et efficace que Google voudrait nous le faire croire.


Selon un article de blog de Google, les réponses de Gemini dans la vidéo sont en réalité beaucoup plus morcelées, et les "prompts" donnés à la machine sont bien plus précis que ce que la voix off laisse entendre. Ainsi, la vidéo donne l'impression d'une conversation presque fluide avec l'IA, alors que la réalité est bien plus laborieuse.


Une IA douée, mais non autonome


Aucune des réponses de Gemini n'est inventée, mais certaines ont été fusionnées ou raccourcies pour donner l'impression que l'IA peut tenir une discussion et enchaîner des éléments de réponse connexes sans avoir besoin d'être relancée. Par exemple, en ce qui concerne la reconnaissance des dessins d'instruments, la vidéo donne à penser que Gemini peut, sans intervention, reconnaître le dessin et jouer automatiquement un morceau adapté, alors qu'en réalité, le "prompt" a été divisé en deux étapes détaillant précisément chaque action que Gemini doit effectuer.


En défense, Google a précisé dans la description de la vidéo que "pour les besoins de cette démo, la latence a été réduite et les messages de Gemini ont été raccourcis". Oriol Vinyals, responsable de la recherche en IA chez Google, a même expliqué que "la vidéo illustre à quoi pourraient ressembler les expériences multimodales avec Gemini".


Cependant, il reste un fossé entre une vidéo intitulée "Prise en main de Gemini" et une illustration partiellement véridique de ce que l'IA de Google pourrait potentiellement accomplir, créant ainsi une distinction significative.

4 vues0 commentaire
  • Facebook
  • Twitter
  • YouTube
  • Pinterest
  • Instagram
bottom of page