Premium

[UP192] Challenger

Par Sane,

Publié le 27 janv. 2025   —   11 min lu

Résumé

3 outils d'IA générative qui challengent les leaders actuels | Ce qu'il faut absolument savoir sur l'agent IA de OpenAI, Operator | Panique sur l'industrie IA à cause de DeepSeek.

News : Panique sur l'industrie IA à cause de DeepSeek.
Zoom : Ce qu'il faut absolument savoir sur l'agent IA de OpenAI, Operator.
Deep Dive : 3 outils d'IA générative qui challengent les leaders actuels.


⚡️Tremblement de terre. La sortie du modèle de raisonnement avancé R1 par DeepSeek a semé le trouble sur les business models de la Silicon Valley.

Le modèle chinois affiche sur certains benchmarks une meilleure performance que le meilleur modèle occidental (o1) pour une fraction de son coût. Mieux, il est même possible de le télécharger et de l'utiliser localement gratuitement.

Cerise sur la gâteau, il a été entrainé avec des puces à bas coût, et non pas avec de chers GPU Nvidia.

Résultat, ce climat de défiance fait s'effondrer les actions de la tech US, dont Nvidia bien sûr . En attendant, l'app DeepSeek caracole en tête des apps gratuites sur l'App Store.


🤖 Agent perplexe. Perplexity a lancé son propre agent, pour l'instant uniquement disponible dans l'app Android de Perplexity. La bête est simplement appelée "Assistant". Pour le naming, on repassera. Mais l'essentiel est ailleurs.

Assistant est capable d’utiliser le raisonnement et la recherche web, ainsi que de naviguer dans certaines applications natives d'Android.

L'objectif : passer d'un moteur de réponse à un véritable assistant capable de vous aider dans vos tâches quotidiennes. La vidéo démo est convaincante, reste à voir à l'usage.


👓 Smart glasses. Les prochaines lunettes intelligentes de Meta pourraient bien être des Oakley.

Jusqu'à présent, il s'est agit de modèles Ray-Ban et le succès a été au rdv. L'idée était de se confondre avec des lunettes classiques.

Avec Oakley (une marque du groupe EssilorLuxottica, comme Ray-Ban), la composante tech pourrait être davantage assumée, puisque le look & feel de Oakley verse davantage dans l'avant-gardisme et la modernité.

Les Oakley Meta seraient ainsi basées sur le modèle Sphaera d'Oakley. La caméra serait positionné au centre de la monture. À suivre…

Modèle Sphaera, sur lequel serait basé les futures lunettes intelligentes de Meta

🔊 IA audio. ElevenLabs a réalisé une nouvelle levée de $250M (pour une valorisation de plus de $3Mds). L'entreprise profite de la demande croissante pour sa technologie de synthèse vocale et de doublage par IA.


Sondage (résultat)

288 répondants, un record pour un sondage Upmynt, et une garantie de représentativité.

La question était : Quel développement ou évolution en cours de l'IA vous enthousiasme le plus pour 2025 ?

Résultat :

Sondage du 20 janvier 2025, 288 répondants

2025 sera supposément l'année de l'IA agentique, et cela commencera véritablement avec le lancement par OpenAI de son agent "Operator" attendu en ce début d'année. Comptez sur moi pour couvrir ça de près.

Surprise du sondage, la forte attente autour de l'IA éthique et responsable. Je m'attendais en effet à ce que cette évolution remporte peu de suffrage. Je couvrirai donc le sujet sur Upmynt prochainement !

Cet espace "Communauté" est le vôtre. Répondez à cet email avec votre besoin : Recrutement, ressource à partager, demande d'aide, question…


Operator : ce qu'il faut absolument savoir sur l'agent IA de OpenAI

OpenAI a enfin lancé son premier véritable agent IA, Operator, et c'est le début d'une nouvelle ère pour l'IA.

▹ Operator : l'essentiel

Operator est un agent IA, c'est-à-dire une IA semi-autonome capable de contrôler votre propre navigateur pour accomplir des tâches pour vous.

    • Fonctionne avec les sites existants - aucune intégration spéciale nécessaire
    • Actuellement réservé aux utilisateurs Pro (plan à $200/mois)
    • S'étendra plus tard aux abonnements Plus/Teams/Enterprise
    • Disponible uniquement aux US pour l'instant
L'interface d'accueil sur Operator rappelle celle de ChatGPT

▹ Que peut-il réellement faire ?

Quelques cas d'usage phare ont été mis en avant par OpenAI, et il s'agit essentiellement d'usages pour les particuliers, pas les professionnels.

    • Réserver des voyages et des restaurants
    • Commander des courses et des livraisons alimentaires
    • Remplir automatiquement des formulaires
    • Faire des achats sur plusieurs sites
    • Planifier des réunions
Operator en action, recherchant un emplacement de camping à Yosemite avec des tables de pic-nic. Crédit image : OpenAI.

▹ Comment ça marche ?

Operator utilise un nouveau modèle CUA (Computer-Using Agent), basé la reconnaissance d'image GPT-4 Vision (pour comprendre n'importe quel site web) et sur un apprentissage par renforcement, qui lui permet de comprendre les interfaces des sites (comme les formulaires ou les boutons).

Il serait aussi capable d'apprendre en vous observant réaliser des tâches, et de pouvoir ainsi les reproduire ensuite.

Contrairement aux outils d’automatisation traditionnels qui s’appuient sur des API, Operator traite les informations visuellement, en déplaçant une souris virtuelle et en tapant dans un navigateur.

S'il rencontre des difficultés ou fait des erreurs, l'opérateur peut exploiter ses capacités de raisonnement pour s'autocorriger.

Operator est déjà entraîné à utiliser des services partenaires. Déjà inclus : DoorDash, Instacart et Uber.

👀
Une IA autonome… mais pas trop

Operator exécute certaines actions en toute autonomie, mais il demande systématiquement une confirmation avant les étapes importantes (comme finaliser un achat).

De plus, vous pouvez regarder faire Operator, mais vous restez libre de reprendre le contrôle à tout moment, un peu comme avec la conduite autonome d'une voiture.

▹ Pourquoi c'est important

OpenAI est de facto le premier acteur majeur à lancer un véritable agent de navigation web. Il inaugure une nouvelle ère pour l'automatisation, et au-delà.

Le lancement conforte aussi l'avance traditionnelle d'OpenAI dans la guerre menée avec les autres géants de la tech, et ce, depuis le premier lancement de ChatGPT. Ils sont décidément très forts.

Dans les 6 prochains mois, on peut s'attendre à voir Google, Meta, Mistral, lancer leur propre agent sur exactement le même principe.

▹ Encore un peu de patience

Le lancement en Europe « prendra du temps » (d'après les mots de Altman). N'espérez pas y toucher, à mon humble avis, avant le 2e trimestre. À suivre…


3 outils d'IA générative qui challengent les leaders actuels

Ce sont de nouveaux outils ou alors ils viennent d'être grandement améliorés. Résultat, ils menacent de détrôner les leaders installés.

1️⃣ Gemini Avanced : enfin un (vrai) concurrent pour ChatGPT ?

Certes, c'est DeepSeek qui défraie la chronique ces jours-ci. Mais ce serait oublier les formidables améliorations apportées par Google à Gemini. La plupart sont accessibles avec un abonnement premium : Gemini Advanced.

Bonne nouvelle, en ce moment, Gemini Advanced est gratuit pendant un mois. Cela offre :

  • Le modèle 1.5 Pro en illimité
  • Une fenêtre de contexte de 1M de tokens, ce qui est sans parallèle sur le marché. C'est 5 fois de plus que côté ChatGPT ! Vous pouvez attacher l'équivalent d'un livre entier à votre prompt.
  • Gemini dans Gmail et Google Docs : les possibilités sont honnêtement limitées mais vous pouvez instantanément générer une synthèse du document ou du mail consulté, ou générer des réponses possibles.
  • La fonctionnalité Deep Research, incroyable.

Vous obtenez donc l'accès illimité à 2 des modèles les plus performants, comme en témoigne le classement de Artificial Analysis.

Quant à la fonctionnalité Deep Research, elle permet de lancer Gemini sur une recherche approfondie sur le web, par exemple pour la rédaction d'une étude de marché complète.

Lorsque je lance Gemini Deep Research sur la rédaction d'une étude de marché sur les snacks bio en France, ce sont pas moinqs de 38 sites web qui sont ainsi explorées par le bot avant de me répondre, soit 4 à 8 fois plus de sources que ce que propose Perplexity ou ChatGPT !

Et le résultat est aussi beaucoup plus détaillé, avec une réponse largement plus détaillée que la concurrence. C'est bien simple : aucun autre assistant IA ne fournit un travail aussi complet.

This post is for subscribers only

Subscribe now and have access to all our stories, enjoy exclusive content and stay up to date with constant updates.

S'abonner

Vous avez déjà un compte ? Se connecter

Partager sur Facebook Partager sur Linkedin Partager sur Twitter Envoyer par email

Passez à la vitesse IA

Abonnez-vous à la newsletter Upmynt et boostez vos activités professionnelles grâce à l'IA : dernières opportunités, meilleurs outils et conseils pratiques.

S'abonner