Google a récemment dévoilé PaLM 2, sa réponse innovante à GPT-4. Ce modèle d’intelligence artificielle (IA), destiné à renforcer l’ensemble de la gamme de produits Google, se caractérise par des performances améliorées et offre quatre variantes distinctes…
Au cours de l’événement inaugural de la Google I/O, Google a introduit une mise à jour de son modèle linguistique, PaLM (Pathways Language Model). Pour rappel, la première version de ce modèle avait été annoncée un an auparavant, à la Google I/O 2022, quelques mois avant l’apparition du sensationnel ChatGPT.
Élaboré comme une option concurrente à GPT-4, le dernier modèle derrière ChatGPT, PaLM 2 se distingue principalement par son support de 100 langues différentes. Google affirme que l’entraînement du modèle sur du contenu rédigé dans un large éventail de langues a « augmenté sa compétence à comprendre, générer et traduire des textes subtils ». Le modèle a une compréhension affinée des langues, y compris des expressions idiomatiques, des énigmes et des poèmes, qui peuvent poser des défis supplémentaires à l’IA générative.
Avantages de PaLM-2
En outre, PaLM 2 bénéficie d’une logique améliorée, d’un sens commun renforcé et d’une capacité accrue en mathématiques. Pour atteindre ces améliorations majeures, Google a déclaré avoir formé le modèle sur « des articles scientifiques et des pages Web contenant des expressions mathématiques ». En théorie, PaLM 2 devrait être en mesure de rivaliser avec GPT-4, dont les capacités de raisonnement nous avaient déjà impressionnés.
De plus, le modèle s’est amélioré en programmation grâce à un entraînement basé sur « de vastes ensembles de données de code source publics ». Selon Google, PaLM 2 excelle dans la génération de code en Python et JavaScript et peut également produire du code dans des langages de programmation moins courants, tels que Prolog, Fortran et Verilog. Google promeut l’IA comme un assistant de programmation.
Ce nouveau modèle linguistique permet à la société de recherche de faire des avancées significatives dans le développement de Bard, son chatbot intelligent. Alimenté par PaLM 2, le chatbot bénéficie désormais de meilleures capacités de raisonnement, de calcul et de programmation. À court terme, le modèle permettra surtout à Bard de comprendre et d’écrire dans plus de 40 langues différentes.
Quatre variantes de PaLM-2
À l’instar de ses concurrents, tels que Meta ou OpenAI, Google propose son nouveau modèle en plusieurs versions. La société a créé quatre variantes de PaLM-2 : Gecko, Loutre, Bison et Licorne.
Alors que Licorne représente la version la plus puissante et la plus volumineuse du modèle, Gecko est présenté comme une version allégée, compatible avec des appareils moins puissants qu’un ordinateur :
« Il peut fonctionner sur des appareils mobiles et est suffisamment rapide pour offrir d’excellentes applications interactives sur l’appareil, même hors ligne ».
Cette gamme de tailles vise à faciliter le déploiement du modèle pour « un large éventail d’applications ». En proposant des versions moins gourmandes en ressources, Google semble également répondre à l’essor de l’intelligence artificielle open source. S’appuyant sur la fuite de LLaMA, le modèle linguistique de Meta, la communauté open source a rapidement développé des solutions IA qui fonctionnent sans problème sur des appareils moins performants, comme un téléphone mobile. Un ingénieur de Google s’est inquiété des innovations issues de l’open source, estimant qu’elles représentent une menace pour la société, bien plus qu’OpenAI ou Microsoft. Il n’est donc pas surprenant que Google ait développé une version de PaLM-2 compatible avec les smartphones.
Vers une amélioration des outils Gmail, Google Doc, Google Sheet etc.
Avec cette gamme de modèles, Google souhaite intégrer l’IA générative dans son écosystème de produits. Outre Bard, PaLM-2 viendra améliorer des outils tels que Gmail, Google Docs ou Google Sheets. Plus de 25 nouveaux produits et fonctionnalités reposent déjà sur le modèle linguistique, se réjouit Google. Il est notamment à l’origine de Med-PaLM-2, un modèle spécifique au domaine médical. Formé sur des données médicales grâce à l’apprentissage automatique, cette version est capable de répondre à des questions sur la médecine, la santé et même la chirurgie. Il peut également interpréter les radiographies des patients pour poser un diagnostic, aussi précis qu’un professionnel de la santé, selon Google.
Au cours de la conférence, Google a également évoqué l’intégration de l’IA générative, alimentée par PaLM-2, dans son moteur de recherche. Pour rivaliser avec Microsoft Bing, qui a adopté ChatGPT quelques mois auparavant, Google ajoutera un mode « conversation » à son moteur de recherche. Grâce à une boîte de dialogue dédiée, l’IA répondra directement aux requêtes des utilisateurs. Au lieu de parcourir les résultats, l’utilisateur obtiendra un résumé personnalisé pour répondre à sa question. Brave adopte une approche similaire, son moteur alimenté par l’IA combine les données de plusieurs sites pour générer un résumé cohérent.
Aperçu de l’avenir de l’IA chez Google
Enfin, Google a abordé l’avenir de l’IA dans l’entreprise. La société révèle déjà travailler sur le prochain modèle linguistique qui alimentera ses produits et services, comme Bard. Nommé Gemini, ce futur modèle linguistique est décrit comme multimodal – capable de traiter plusieurs types de données, tels que le texte, l’audio ou les images – et « très efficace ». Il sera également disponible en différentes tailles.
Google précise que Gemini est toujours en cours d’entraînement. Dans ses laboratoires, l’entreprise forme actuellement le modèle sur une quantité massive de données. Peut-on s’attendre à une présentation de Gemini dès 2024 lors de la prochaine Google I/O ? Seul l’avenir nous le dira, mais il est clair que Google est déterminé à renforcer sa position dans le domaine de l’intelligence artificielle et à offrir des solutions innovantes à ses utilisateurs.