7 févr. 2024 10 min de lecture

[UP100] AI Killed the Radio Star

[UP100] AI Killed the Radio Star
Réalisé par Sane sur Midjourney

C'est la 100e | Les 7 meilleurs outils IA audio (voix off, musique, optimisation)

  • Édito : C'est la 100e !
  • News : Meta et OpenAI accélèrent sur la détection.
  • Quick hack : Sur quoi tourne ce site web ?
  • Deep Dive : Les 7 meilleurs outils IA audio (voix off, musique, optimisation)

Salut à tous,

100.

Oui, en lançant Upmynt, j'avais bien l'intention d'atteindre ce cap. Ça ne veut pas dire que cela a été facile tous les jours. Le rythme de 2 éditions par semaine est très exigeant, mais j'y suis attaché pour tisser une connexion solide avec vous.

Bien sûr, et comme tout créateur de contenu, j'aimerais croître plus vite. Je me souviens que Nicolas Guyon, lui aussi créateur de contenu IA (avec son podcast Comptoir IA) m'avait confié : « On croit que c'est un phénomène de masse, mais l'IA reste une niche en France. On s'adresse à une niche. »

Et il a raison :

📊 ChatGPT a 100M d'utilisateurs actifs (hebdo), mais ne compte que 250K utilisateurs payants dans le monde. Combien sont-ils en France ? Une dizaine de milliers, tout au plus.

Nous n'en sommes qu'au tout début. Nous sommes, vous et moi, des pionniers.

Alors il faut continuer à démystifier, partager, expliquer. Pour que l'IA ne finisse pas comme la crypto, c'est-à-dire une innovation prometteuse gâchée par un écosystème opportuniste, fermé sur lui-même, qui moisit dans son jus et enrichit seulement quelques uns aux dépens des autres.

C'est dans cette optique qu'en plus de cette newsletter, j'ai lancé une offre de talks et formations.

Mais ce n'est pas tout : je travaille d'arrache-pied sur un projet captivant prévu pour septembre prochain. Le format unique de ce projet exige un peu de patience, mais je vous promets que l'attente en vaudra la peine. J'en dirai plus le moment venu, et promis, vous lirez alors en moi comme dans un livre ouvert. 👀

L'un de vous m'a confié récemment : « Lorsque je reçois Upmynt, je saute dessus, c'est ma bulle d'air de la journée. » Les taux d'ouverture me montrent que la plupart d'entre vous ouvrent toutes les éditions. C'est un lien solide entre nous.

👉 Alors, il y aura une nouvelle version d'Upmynt d'ici l'été. Je suis encore au début de la réflexion, mais comptez sur moi pour faire évoluer la newsletter dans un sens qui vous satisfera encore plus.

Avant ça, je vais aussi faire une petite place aux annonceurs, mais toujours dans un format qui enrichira la newsletter. La prochaine édition, qui sera la première sponsorisée, le prouvera à merveille avec un partenaire vraiment canon.

Dans l'immédiat, je veux remercier tout particulièrement les abonnés Premium, qui me permettent de maintenir Upmynt à flot. Sans vous, Upmynt ne serait pas allé jusque là. Et ce n'est pas une façon de parler, c'est juste la vérité.

Un grand merci pour votre confiance, et surtout votre fidélité.

Sane de Upmynt 💙


Les news chaudes 🔥

🚨 Meta appelle à la détection. Le géant demande urgemment l'instauration d'un système universel d'étiquetage des image synthétiques.

D'après le géant, la détection est le défi le plus urgent auquel est confronté la tech cette année. Je ne peux qu'acquiescer. Relire Upmynt #97 : Démasquer l'IA : l'urgence de la détection

🔖 Un marqueur dans Dall-e 3. OpenAI a annoncé l'instauration d'un système de marqueur pour toutes les images générées sur leur modèle image (via l'API Dall-e ou directement dans ChatGPT). Il consistera en deux éléments :

  • Ajout d'un composant invisible dans les metadata
  • Label en bas à droite de l'image (facile à cropper, cependant)

♊︎ Bard devient Gemini. Jusqu'à présent, Bard était le chatbot et Gemini le modèle IA qui le propulse. Par souci de simplicité, Google voudrait uniformiser ces namings sous la même marque Gemini. Quand la performance ne suit pas, il reste le marketing.

🥶 Briser la glace. Les membres premium de Linkedin ont désormais la possibilité de recourir à l'IA pour générer le premier message à un nouveau contact Linkedin.

Crédit image : Linkedin

🤡 Les séquelles des casques AR. Outre des vertiges, des maux de tête et une sensation de déconnection sociale, un nouveau syndrome fait son apparition : l'effet "miroir déformant".

Les utilisateurs ont ainsi signalé des difficultés à réaliser des tâches simples comme donner un high five ou manger, en raison d'erreurs d’appréciation sur la distance ou la taille des objets.

Bien sûr, ce symptôme n'apparait que lorsque l'utilisateur visionne son environnement à travers les écrans de son casque (comme cela est permis sur le Vision Pro).

Ma prédiction : si certains utilisateurs se mettent à passer plus de temps avec un casque sur le nez que sans, cela pourrait devenir leur nouveau rapport au réel par défaut, et cet effet "miroir déformant" surviendra alors lorsque le casque ne sera pas porté. Dystopique.

🇺🇸 AI funding. Les financements des startups IA ont globalement baissé en 2023 vs 2022 (-10%), mais cela cache en réalité un creusement de l'écart entre US (où ils ont en réalité augmenté) et Europe / Asie.

Via CBinsights

Communauté 🦊

Cet espace est le vôtre. Recrutement, ressource à partager, demande d'aide, question. Répondez à cet email pour y apparaître.

  • Job à saisir

La pépite fintech Mooncard recherche son Head of Growth - job basé à Paris.


Quick hack ⚡️ Sur quoi tourne ce site web ?

En installant l'extension Chrome "What runs", découvrez ce sur quoi tourne n'importe quel site : Réseaux publicitaires, outils d'analyse, plugins Wordpress, et même polices d'écriture…

C'est un bon moyen d'espionner vos concurrents et de vous inspirer de leur stack. Mieux, vous pouvez être averti lorsqu'ils utilisent de nouveaux services ou modules, ou suppriment ceux existants.

Par exemple, si un concurrent installe le tracker Twitter Ads, c'est un signal fiable qu'il s'apprête à lancer une campagne sur Twitter (X).

Plus rien ne vous échappera.


Deep dive 🔍 Les 7 meilleurs outils IA audio (voix off, musique, optimisation)

C'est un sujet que j'ai peu abordé sur Upmynt, mais l'IA a également envahi la sphère audio. J'ai testé une quinzaine de générateurs, pour ne garder que le meilleur.

Génération de musique : Soundraw versus Mubert

S'il existe de nombreux générateurs de morceaux, deux se sont avérés suffisamment performants à l'usage pour mériter leur présence dans ces colonnes.

Dans tous les cas, si la plupart des générateurs vous laisseront créer des morceaux gratuitement, dès lors que vous souhaitez en téléchargez un, il vous faudra vous acquitter d'abord d'un abonnement à la plateforme.

La musique ainsi téléchargée est libre de droit et utilisable pour un usage commercial.

  • Soundraw : générez des morceaux en 2 clics

L'interface de Soundraw se veut ultra accessible, même pour quelqu'un qui n'a strictement aucune connaissance ni en audio, ni en IA.

Vous choisissez une durée, un tempo (lent, normal, rapide), et un genre parmi les 25 proposés (Hip-hop, electro, musique d’ambiance, etc), et… c'est tout ! Pas de prompt nécessaire.

À noter que si vous n’êtes pas fermé sur le genre désiré, vous pouvez aussi plutôt choisir d’opter pour une humeur.

L’outil génère alors une douzaine de morceaux. Si aucun d'eux ne vous satisfait, un seul clic suffit pour en générer de nouveaux.

Certains morceaux vous sembleront un peu éloignés des choix entrés, mais sur le nombre, d'autres seront plus en ligne avec vos attentes.

  • Mubert, pour prompter directement le morceau de vos rêves

Avec le générateur Mubert, vous pouvez directement prompter le morceau de vos rêves. Cela implique cependant d'avoir un minimum de notions sur les genre musicaux ou les instruments souhaités… le tout, en anglais. On regrettera au passage l'absence d'une aide au prompting qui aurait été bien utile.

Sachez que le générateur est plus à l'aise avec des requêtes basiques ("a house track with funky beats") que si vous cherchez à innover. J'ai tenté "A spatial opera with deep melody and chord progression" et le résultat était éclaté.

De plus, contrairement à Soundraw, les morceaux sont générés un par un sur Mubert.

Bref, tenez vous-en à des requêtes simples et n'hésitez pas à itérer.

💡
Pour un besoin inférieur à une 15aine de sec (par exemple pour la bande-son d’une story), optez pour le modèle MusicGen de Meta, accessible depuis la plateforme HuggingFace. Vous pouvez générer un mini morceau et le télécharger gratuitement, pour un usage libre de droit.

Génération de voix off : Eleven Labs versus HeyGen

  • La référence Eleven Labs, performant surtout en anglais

Eleven Labs se positionne à l'avant-garde de l'IA audio, se révélant comme la plateforme la plus emblématique dans ce domaine. Sa technologie de pointe en matière de synthèse vocale transforme un texte écrit en une narration vocale, donnant vie aux mots avec une lecture à haute voix fluide et relativement naturelle.

En gros, Eleven "vocalise" le texte soumis avec une précision plutôt remarquable.

La plateforme prétend supporter une trentaine de langues, y compris le français, mais elle semble être principalement pensée pour un public anglophone : toutes les voix sont organisées et présentées, triées selon leur accent anglais (britannique, américain, australien, etc).

Cependant, certaines voix, même référencées sous un accent anglophone, peuvent effectivement produire un discours en français, adaptant leur prononciation au contenu du texte.

Par exemple, la voix nommée “Charlie”, décrite comme décontractée, conversationnelle, et australienne, peut interpréter un script en français, sans trace d'accent anglo-saxon.

Cette configuration rend cependant l'utilisation de la plateforme moins intuitive pour les francophones.

Heureusement, il existe un autre service moins connu avec une sélection dédiée de voix francophones.

Génial ! Vous vous êtes inscrit avec succès.
Bienvenue à nouveau ! Vous vous êtes connecté avec succès.
Vous vous êtes abonné avec succès à Upmynt newsletter - Faites passer votre marque à la vitesse IA.
Votre lien a expiré.
Succès ! Vérifiez votre e-mail pour le lien magique pour vous connecter.
Succès ! Vos informations de facturation ont été mises à jour.
Votre facturation n'a pas été mise à jour.