OpenAI lance GPT-4o, un nouveau modèle d’IA générative, accessible à tous et doté d’un « mode vocal »

Chargement du lecteur...

Rejouer

Fermer

Vous aimerez peut-être aussi :

Prompt ChatGPT « créer la réplique exacte de cette image, ne rien changer » 74 fois

Zap Glitch - Saints Row: The Third

Son nouveau concept

OpenAI, l’éditeur de ChatGPT, a présenté lundi son nouveau modèle d’intelligence artificielle (IA) générative, GPT-4o, qui permet au chatbot d’interagir avec ses utilisateurs comme un assistant vocal ultra perfectionné. « Vous avez la transcription, l’intelligence et la capacité à parler, réunies ensemble pour vous apporter le mode vocal », a résumé Mira Murati, directrice technologique de la start-up californienne, lors d’une présentation vidéo diffusée en direct lundi matin.

Avec deux de ses collègues, elle a démontré comment les utilisateurs vont pouvoir interagir avec ChatGPT, lors de conversations fluides, reproduisant de façon bluffante des discussions entre humains. La présentation de l’entreprise qui a lancé la révolution de l’intelligence artificielle générative était très attendue, alors que les géants de la tech multiplient les annonces de nouveaux outils d’IA, toujours plus performants et personnalisés.

L’assistant d’IA d’OpenAI, que les utilisateurs peuvent facilement interrompre, est capable de lire les émotions sur leurs visages via la caméra de leur smartphone, de les guider pour faire des exercices de respiration, de leur raconter une histoire ou encore de les aider à résoudre un problème mathématique. « Tu as l’air joyeux, avec une pointe d’excitation. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ? », a ainsi demandé la machine à un ingénieur d’OpenAI.

Quand il lui a répondu qu’il était en train de montrer au public à quel point elle est « utile et fabuleuse », elle s’est exclamée en retour « Oh arrête, tu me fais rougir ». Mira Murati a insisté sur le fait que le nouveau modèle GPT-4o est censé apporter à tous ses utilisateurs ses capacités les plus avancées, en production et compréhension de texte, d’images et de sons et voix, via ChatGPT. « Nous sommes vraiment ravis d’apporter GPT-4o à tous nos utilisateurs gratuits. Les utilisateurs payants continueront à bénéficier de limites en termes d’utilisation cinq fois plus élevées que les utilisateurs gratuits », a-t-elle détaillé.

Depuis le lancement de ChatGPT fin 2022 - son modèle de langage capable de générer du texte sur simple requête en langage courant - Microsoft, principal investisseur d’OpenAI, Google et toute la Silicon Valley sont lancés dans une course aux outils et assistants d’IA. Google doit présenter ses dernières innovations mardi, tandis que Microsoft a un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman avait démenti les rumeurs au sujet des annonces que préparait son entreprise : « Pas GPT-5, pas un moteur de recherche », avait-il déclaré sur X (ex-Twitter). « Mais (...) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer », avait-il ajouté. « Pour moi, c’est comme de la magie ». Le trentenaire milliardaire promeut régulièrement sa vision d’une IA qui sera un jour « générale », c’est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l’humanité.

Extrait : Le Parisien

Envoyé par Flaneur le 14 mai 2024 à 21h02

+ 2 -

GruikMan Vermisseau

*Au service des investisseurs de la société...

Il y a 2 ans

+ 1 -

_pepe_ En réponse à GruikMan

... et des individus, services étatiques, organisations et entreprises intéressés par n'importe quelles informations vocales ou visuelles captées durant les échanges.

Informations qui, aux États-Unis, ne relèvent pas du droit de la personne, mais du domaine commercial.

Mieux, ce système-là peut obtenir automatiquement les informations recherchées dans l'environnement de l'utilisateur (y compris les documents écrits), et poser des questions ou orienter la conversation afin de susciter des réponses qu'il est capable d'analyser. Cela inclut les réponses corporelles, de sorte qu'il n'est même plus nécessaire que l'utilisateur donne expressément son opinion sur un sujet (politique ou commercial, notamment) pour savoir ce qu'il pense.

Un tel système s'avère problématique en ce qui concerne le respect de la vie privée des particuliers (tant celle de l'utilisateur que celle des personnes de son entourage), mais également en ce qui concerne la confidentialité des activités des entreprises (notamment non américaines) dont les employés utiliseraient ses services.

À une époque, les services en ligne qui offraient la possibilité de discuter avec de parfaits inconnus faisaient craindre (avec raison) que les usagers, notamment les plus fragiles et les plus influençables, puissent tomber sur des individus malintentionnés agissant sous une fausse identité ou une qualité usurpée. De fait, derrière la torride Ulla, la clairvoyante Madame Irma ou la petite Sophie, 12 ans, désirant discuter avec des fillettes de son âge, se cachait parfois un gros moustachu avide et pervers.

Aujourd'hui, à l'ère de la surveillance de masse généralisée, les utilisateurs des services modernes ne semblent plus se rendre compte de qui se cache réellement derrière ces beaux artefacts à la voix suave avec qui ils échangent en toute confiance, ni des menaces beaucoup plus graves que la fuite d'informations à laquelle ils participent fait peser sur leur personne et sur la société en général.

Il y a 2 ans