Google Bard a-t-il vraiment appris le bengali tout seul ?
Sundar Pichai, PDG d’Alphabet, a participé à de nombreuses interviews et podcasts au cours des derniers mois, donnant un aperçu des futurs projets de l’entreprise en matière d’IA. Compte tenu des récents défis de Google et de la concurrence acharnée de Microsoft, plusieurs cycles de négociations semblaient être une bonne stratégie pour Pichai.
La semaine dernière, M. Pichai et plusieurs autres dirigeants de Google ont participé à l’émission « 60 Minutes » de la chaîne CBS. Au cours de l’entretien, M. Pichai a longuement parlé de l’intelligence artificielle et de son impact sur la société.
Cependant, un aspect intéressant de la vidéo a attiré notre attention. Il s’agit de la manière dont Google Bard a commencé à s’enseigner à lui-même des compétences auxquelles les chatbots n’avaient pas pensé.
Pichai déclare : « Par exemple, un programme d’IA de Google s’est adapté, de lui-même, après avoir été invité à parler la langue du Bangladesh, qu’il n’avait pas été formé à connaître. »
La langue dont il est question ici est le bengali, qui, en plus d’être parlé au Bangladesh, est principalement parlé dans l’État du Bengale occidental et, dans une certaine mesure, dans d’autres États comme le Tripura et l’Assam en Inde.
L’internet vérifie les faits
Dans la vidéo, James Manyika, vice-président de Google, explique que le système a appris à traduire tout le bengali après avoir reçu très peu de messages en bengali.
Cependant, Margaret Mitchell, ancienne chercheuse chez Google, s’est rendue sur Twitter pour souligner, preuves à l’appui, que cette affirmation était erronée. Elle a souligné que le PaLM de Google, le modèle d’IA qui est le précurseur de Bard, avait été entraîné à comprendre le bengali. Un rapide coup d’œil à la fiche technique du PaLM révèle en effet que le bengali est l’une des langues sur lesquelles il est entraîné.
Google avait annoncé PaLM lors de son événement Google I/O en 2022. Lors de cet événement, Google avait révélé qu’il avait entraîné le modèle à communiquer en bengali, selon M. Mitchell.
Dans le long fil de discussion sur Twitter, Mitchell pose la question suivante : « Comment se fait-il que les dirigeants de Google fassent croire que leur système a appris le bengali comme par magie, alors qu’il a très probablement été entraîné en bengali ? Cela nous amène à nous demander qui, de Google et de CBS, s’est trompé.
Il est intéressant de noter que Mme Mitchell a été licenciée par Google en 2021 après avoir utilisé un script automatisé pour passer au peigne fin ses courriels à la recherche de preuves corroborant les affirmations de son collègue chercheur en éthique de l’IA, Timnit Gebru.
Il convient de mentionner que Timnit Gebru a également été licenciée par Google au cours de la même période parce qu’elle avait envoyé un courriel critique à ses collègues concernant l’approche de l’entreprise en matière de diversité et d’éthique de l’IA.
L’engouement pour l’IA s’amplifie
Dans la vidéo, M. Pichai poursuit en affirmant que la société n’est pas préparée à l’évolution rapide de l’IA. Si des déclarations de ce type peuvent sembler fascinantes pour certains, nombreux sont ceux qui pensent qu’elles ne font qu’alimenter le battage médiatique autour de l’IA.
Emily M. Bender, professeur de linguistique à l’université de Washington, a fait référence au segment de CBS de M. Pichai en disant que nous ne devrions pas accepter le battage médiatique sur l’IA comme une nouvelle.
Depuis le lancement de ChatGPT, le battage médiatique autour de l’IA s’est emballé et, à maintes reprises, des experts et des chercheurs ont souligné que cela pourrait s’avérer préjudiciable au développement de la technologie. Par exemple, cela a conduit à des attentes irréalistes quant à ce que l’IA est capable de réaliser à court terme.
En revanche, les entreprises privées ont tout à gagner de l’engouement pour l’IA. Cela conduit invariablement à des investissements supplémentaires ou crée une demande pour leurs produits ou services alimentés par l’IA.
Selon certains, prétendre qu’un modèle d’IA a appris le bengali de manière autonome contribue à alimenter le battage médiatique autour de l’IA en diffusant des informations erronées. Il ne fait aucun doute que M. Pichai espérait, par ses affirmations, attirer l’attention sur les produits et services de Google qui intègrent l’IA.
« Par exemple, un programme Google AI s’est adapté après avoir été invité à parler bengali, mais il n’avait pas été formé dans cette langue », a déclaré Pichai.
La langue dont il est question ici est le bengali, qui, en plus d’être parlé au Bangladesh, est principalement parlé au Bengale occidental et, dans une certaine mesure, également dans d’autres États comme le Tripura et l’Inde. Assam, Inde.
vérification des faits sur Internet
Dans la vidéo, le vice-président de Google, James Manyika, explique que le système a appris à traduire tout le bengali après avoir reçu très peu de messages en bengali.
Cependant, l’ancienne chercheuse de Google, Margaret Mitchell, s’est adressée à Twitter pour souligner que cette affirmation est fausse. Elle a noté que PaLM de Google, le modèle d’IA pionnier de Bard, a été formé pour comprendre le bengali. Un rapide coup d’œil à la fiche technique de PaLM révèle que le bengali fait partie des langues sur lesquelles il a été formé.
Google a annoncé PaLM lors de l’événement Google I/O en 2022. Lors de cet événement, Google a révélé qu’il avait entraîné le modèle à communiquer en bengali, selon Mitchell.
Dans un long fil Twitter, Mitchell a demandé : « Pourquoi les dirigeants de Google ont-ils donné l’impression que leur système avait appris le bengali comme par magie alors qu’en fait, il a probablement été formé en bengali. Ce qui nous amène à nous demander qui s’est trompé sur Google et CBS.
Fait intéressant, Mme Mitchell a été licenciée de Google en 2021 pour avoir utilisé des scripts automatisés pour parcourir ses e-mails à la recherche de preuves à l’appui des affirmations de son collègue chercheur en éthique de l’IA, Timnit Gebru.
Il convient de noter que Timnit Gebru a également été licenciée de Google au cours de la même période après avoir envoyé un e-mail à des collègues critiquant la gestion de la diversité et de l’éthique par l’entreprise.
L’enthousiasme pour l’IA grandit
Dans la vidéo, M. Pichai a poursuivi en disant que la société n’était pas préparée au développement rapide de l’intelligence artificielle. Bien que des déclarations comme celles-ci puissent sembler attrayantes pour certains, beaucoup pensent qu’elles ne font qu’alimenter le battage médiatique autour de l’IA.
Citant le segment CBS de M. Pichai, Emily M. Bender, professeur de linguistique à l’Université de Washington, a déclaré que nous ne devrions pas accepter le battage médiatique sur l’IA comme une nouvelle.