▹ News : Une nouvelle fonctionnalité "Omni Reference" pour Midjourney.
▹ Zoom : F Lite, le nouveau modèle image "safe".
▹ Deep Dive : Genspark est-il vraiment le super agent qu'il prétend être ?
Salut à tous,
Genspark s'est auto-proclamé comme “Super Agent”. Non content donc d'être un agent IA enfin disponible pour le grand public, il serait même une déclinaison "super" lavant plus blanc que blanc.
Car oui, Genspark promet monts et merveilles : planification, exécution, autonomie, orchestration… Le rêve agentique à portée de main, enfin !
Alors je l’ai testé en profondeur.
Et disons que… il a effectivement quelques belles cartes en main.
Mais aussi une bonne dose de poudre aux yeux.
Dans cette nouvelle édition d'Upmynt, je vous propose une plongée critique dans ce nouvel outil très commenté. Je détaille ce qu’il apporte réellement, là où il impressionne, mais aussi les zones d’ombre où il déçoit amèrement.
Bonne lecture,
Sane de Upmynt 💜

👀 T'as la réf ? Midjourney lance une nouvelle fonctionnalité appelée Omni Reference qui vous permet d'insérer de manière transparente n'importe quel personnage ou objet dans une scène, ou de mélanger et d'associer des éléments de différentes images.

🎬 Duolingo IA. Il a fallu 12 années à l'entreprise pour proposer une centaine de cours de langue. Grâce à l'IA générative, l'app propose plus de 120 nouveaux cours en une seule mise à jour.
« Ce lancement reflète l’impact incroyable de nos investissements en IA et en automatisation, qui nous ont permis d’évoluer à une vitesse et une qualité sans précédent. » - Luis von Ahn, PDG de Duolingo
La semaine dernière, dans un mémo interne, l'entreprise avait annoncé un shift pour devenir "AI-first", avec notamment la décision de ne recruter que si une équipe ne peut plus automatiser davantage leur travail.
Et après ça, ils vont maintenir que l'IA n'a aucun impact sur l'emploi. Mmmh mmmh…
🤖 Imposer Gemini. Google paierait d'énormes montants à Samsung pour embarquer son assistant IA Gemini par défaut dans leurs smartphones, révèle Bloomberg. Le montant précis n'a toutefois pas été révélé.
Cette révélation intervient alors que l'entreprise est accusée d'avoir violé les lois antitrust, notamment en payant Samsung pour être le moteur de recherche par défaut sur ses appareils.
🎶 Suno 4.5. Suno vient d'être mis à jour avec la version 4.5 de son modèle de génération de musique IA, ajoutant de nouveaux genres, une meilleure adhérence au prompt, des voix plus convaincantes et la possibilité de créer des chansons d'une durée maximale de 8 minutes.
Le générateur embarque également désormais une assistance au prompting.
Voilà plus d'un an que Suno domine le game de la génération de musique et ça ne semble pas vouloir changer.


▹ Sondage
Utilisez-vous votre assistant IA (comme ChatGPT) pour des requêtes d'ordre personnel ?
Un seul clic suffit pour voter. Résultat lundi prochain !
▹ Lien favori de la communauté
Outre l'offre sponsorisée Notion (6 mois gratuits) qui a généré le plus de clics la semaine dernière (c'est la vérité ! Et il n'est pas trop tard pour en profiter), c'est le lien vers l'article de l'Internaute expliquant comment retirer le bouton Meta AI de Whatsapp qui a suscité votre intérêt, en arrivant second (192 clics).
Cet espace "Communauté" est le vôtre. Répondez à cet email avec votre besoin : Recrutement, ressource à partager, demande d'aide, question…

F Lite, le nouveau modèle image "safe", rivalise-t-il avec Firefly ?
F Lite est un modèle de diffusion à 10Mds de paramètres créé par Freepik et Fal, entraîné exclusivement sur du contenu protégé par le droit d'auteur et SFW. Adobe Firefly n'est donc plus seul sur ce front.
En effet, ce modèle a été entraîné sur l'ensemble de données interne de Freepik, comprenant environ 80M d'images protégées par le droit d'auteur.
2 versions sont proposées, pour l'instant accessibles uniquement depuis Fal :
- F Lite standard : plus fidèle au prompt, moins créatif.
- F Lite texture : plus chaotique et sujet aux erreurs, mais offre de meilleures textures et des compositions créatives.
Mon essai rapide a été plutôt décevant, avec un niveau de réalisme en deçà de la concurrence, surtout sur les portraits (bonjour les textures lisses de peau…).

Le prompt utilisé :
⌨️ Ressource prompt réservée aux abonnés Upmynt Pro.
En comparaison, Adobe Firefly s'en sort mieux, même si le traitement est un peu moins arty, le niveau de réalisme est plus convaincant :

Et si l'on sort de la photographie ? Là encore, Firefly 4 s'est révélé plus convaincant, comme l'illustre cet exemple en flat design.

⌨️ Ressource prompt réservée aux abonnés Upmynt Pro.
C'est définitif : si vraiment vous voulez naviguer dans des eaux 100% safe côté génération image, le modèle Firefly 4 d'Adobe est plus convaincant que ce F Lite de Freepik tout juste sorti et déjà dépassé.

Genspark est-il vraiment le super agent qu'il prétend être ?
Genspark m'avait bluffé sur sa fonctionnalité "Diapositives IA", couverte dans Upmynt #216. Mais la promesse de Genspark, au-delà de la génération de deck, c'est d'être le premier véritable agent disponible à l'usage pour le grand public (Manus, pour sa part, délivre les accès au compte-goutte).
Mieux, Genspark serait un "super agent" (sic). Je l'ai donc testé sur 3 cas d'usage pour mettre à l'épreuve cette promesse puissante.
Le terme est déjà largement galvaudé, et beaucoup de chatbots spécialisés ont été marketés comme des agents, à tort.
À partir d'un objectif plutôt général, un véritable agent est capable de raisonner pour se figurer seul toutes les étapes intermédiaires optimales afin d'atteindre ce but, et de se connecter pour ce faire à d'autres outils si nécessaire.
Il réalise alors les différentes étapes les unes après les autres (et peut demander confirmation à l'utilisateur pour certaines d'entre elles), puis présente le résultat final dans un format optimal.
▹ Cas d'usage 1 : réalisation d'un audit SEO
Lorsque je demande à Genspark de réaliser un audit SEO du site Upmynt, je m'attends à ce qu'il me fournisse une analyse précise des balises Hn, de la structure des URLs, des temps de chargement ou encore des backlinks manquants.
Mais surtout, j’attends qu’il s’appuie sur des ressources en ligne pour affiner son diagnostic : par exemple en se connectant à Google PageSpeed Insights pour évaluer la vitesse, à Google Search Console pour détecter les erreurs d’exploration, ou encore à des bases comme Ahrefs, Semrush ou Moz pour analyser le netlinking et la concurrence.
Bref, pas juste un diagnostic express, mais un vrai audit dopé aux bonnes sources, avec des recommandations concrètes, priorisées et actionnables… Bon, on en est loin.
👉 Genspark se contente d'explorer la page d'accueil ainsi que quelques pages aléatoires du site, de vérifier la sitemap et le fichier robots.txt. Cela lui permet de me livrer une réponse sous la forme d'une distribution des bons et des mauvais points.

Ce n'est pas beaucoup mieux que ce que peut réaliser le modèle de raisonnement o3 sur ChatGPT, et c'est aussi beaucoup moins bien que ce que réalise Manus pour sa part.
En effet, Manus se connecte bien à des sites tiers pour obtenir de nouveaux insights, y compris le backlink checker de ahrefs. Et fournit en guise de réponse un rapport d'audit en bonne et due forme. (cf vidéo)
Verdict : le "super agent" Genspark fait moins bien que l'agent Manus. Circulez… Et passons à la suite.