Nous voici de retour pour la deuxième édition des découvertes de la semaine, de cette année. Le concept : je partage 2 à 3 contenus que j’ai bien aimé et je donne 3 points que je retiens.
[Vidéo semi-longue] Retranscrire de l’audio/vidéo facilement avec l’IA de Whisper
Comment je suis tombé sur cette vidéo ?
Je cherchais encore des moyens de m’améliorer dans l’utilisation de ChatGPT. Mais j’avais une frustration : comme l’outil ne fonctionne qu’avec du texte, je me retrouvais souvent à lui extraire des sous-titres de vidéo YouTube.
Le problème c’est que beaucoup sont générés automatiquement et ne sont pas oufs.
L’autre souci c’est que j’ai également des vidéos qui ne sont pas sur YouTube dont je veux extraire le script.
C’est là que j’ai découvert que l’entreprise qui a produit ChatGPT a également produit Whisper, un outil de retranscription.
C’est logique en même temps, j’imagine que parmi les données dont ChatGPT se sert il y a énormément de contenu qui viennent de vidéos et qu’ils ont donc dû trouver une manière efficace de les retranscrire.
Les 3 choses que j’en retiens
#1 | Les résultats sont impressionnants quand on passe Whisper à sa puissance maximale
Par exemple, voici l’extrait d’un script d’une vidéo de Nina Ramen par le bot automatique de YouTube :
je m'appelle Nina ramen et je j'enseigne le copier writing copyrighting avec un W qui n'a rien à voir avec le copier right copyright avec un RC droit de la propriété intellectuelle de copyrighting avec un W
c'est pas à toi que je vais la prendre c'est l'art de vendre avec les mots consacrer d'engagement que ce soit sur les réseaux sociaux sur les newsletters ou sur des pages de vente
Il y a 9 erreurs sur 71 mots. Dont certaines empêchent de comprendre le texte. Ça fait 13% d’erreur.
Voici le même texte quand c’est Whisper qui fait la retranscription :
je m'appelle Nina Ramen, et j'enseigne le copier writing, copier writing avec un W qui n'a rien à voir avec le copier write. Copier write avec un R, c'est le droit de la propriété intellectuelle, le copier writing avec un W,
c'est pas à toi que je vais l'apprendre, c'est l'art de vendre avec les mots, de créer de l'engagement, que ce soit sur les réseaux sociaux, sur les newsletter, ou sur des pages de vente
On sent déjà l’amélioration. Il y a désormais 5 erreurs et aucune n’empêche de comprendre. Ça fait 7% d’erreur.
Et là tu te dis : non mais d’accord… tout ça pour ça ?
C’est pas fini !
Voici le même texte quand je pousse Whisper à sa puissance maximale (en échange, ça prend 32 fois plus de temps) :
Oui, alors je m'appelle Nina Rahman et j'enseigne le copywriting. Copywriting avec un W, qui n'a rien à voir avec le copyright, copyright avec un R c'est le droit de la propriété intellectuelle, le copywriting avec un W
c'est pas à toi que je vais l'apprendre. C'est l'art de vendre avec tes mots, de créer de l'engagement, que ce soit sur les réseaux sociaux, sur des newsletters ou sur des pages de vente
Et d’un coup c’est bien bien meilleur ! Même si on ne comprend pas pourquoi il a changé le nom de Nina alors que c’était bon dans les versions précédentes. C’est la seule et unique erreur. Tout le reste est de précision 100%. Donc un taux d’erreur de 1,4%… sur un nom propre. Et 0% d’erreur sur tout le reste !
#2 | On peut utiliser les serveurs de Google, gratuitement quand on a besoin d’avoir un ordinateur puissant
Le souci de Whisper c’est que, à puissance maximale, il utilise des ressources que la plupart des ordinateurs de particulier n’ont pas. Là par exemple il faudrait 10 giga de Ram. Alors que mon iMac a 8 giga de RaM.
Heureusement, grâce à Google Collab (que je ne connaissais pas avant cette vidéo) on peut aller se servir directement d’un ordi Google.
#3 | Le tutoriel est un peu complexe mais il est à notre portée.
Si tu essaies de le suivre, 1 conseil.
Au milieu de la vidéo il fait une erreur car il a oublié de configurer un truc. Le problème c’est que ça demande de tout recommencer. Donc, configure le avant toutes choses. Il s’agit d’un paramètre qui permet justement de profiter de toute la puissance du serveur Google.
Pour ce faire, tu vas dans le menu Exécution => Modifier le type d’exécution et tu coches “GPU”.
Pourquoi tu devrais la découvrir à ton tour ?
Si jamais tu as besoin dans ton métier ou ton quotidien d’avoir des sous-titres auto-générés de meilleure qualité, l’effort d’apprentissage vaut la peine.
Bonus : voici les requêtes à utiliser, comme ça tu n’as pas besoin de les copier à la main, tu peux les copier-coller (ça a une tête barbare mais pas de panique, suffit de recopier au moment où il le dit dans la vidéo) :
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmepg
!whisper "chemin d’accès de ton fichier"
[Article] Les millenials contredisent la règle la plus ancienne de la politique
Comment je suis tombé sur cet article ?
Je l’ai d’abord vu sur Twitter car il a beaucoup circulé, puis j’ai vu un YouTubeur politique que j’aime, le commenter. Je déteste le concept de millenials (génération Y) mais pour une fois il est pratique car on va étudier un effet qui est vraiment spécifique aux trentenaires et quarantenaires de maintenant et non pas un effet qui est en fait valable depuis toujours sur les gens de cet âge, ou alors un effet qui affecte tout le monde dans une époque donnée.
Les 3 choses que j’en retiens
#1 | On a tous et toutes l’intuition de cette règle : plus on vieillit plus on penche à droite
Si vous n'êtes pas de gauche à 25 ans, vous n'avez pas de cœur. Si vous n'êtes pas de droite à 35 ans, vous n'avez pas de cerveau". C'est ce qu'a dit Winston Churchill. Ou le président américain John Adams. Ou peut-être le roi Oscar II de Suède. Des variantes de cet aphorisme ont circulé depuis le 18e siècle, soulignant la règle bien établie selon laquelle, en vieillissant, les gens ont tendance à devenir plus conservateurs.
#2 | Mais il semblerait que c’est en train de devenir faux
Au début ça se vérifiait pour les “millenials” américains, puis d’un coup ça s’est arrêté. En ce qui concerne les “millenials” britanniques, ça ne s’est carrément jamais produit
Pour le moment, les “millenials” américains et britanniques, votent de moins en moins pour le parti de gouvernement de droite.
#3 | Est-ce que ça se transpose en France ?
Dur à dire car nous n’avons pas de système bipartisan où on est obligés de voter pour la droite de gouvernement ou “la gauche” (en réalité plutôt un centre, voire une droite modérée) de gouvernement.
Mais en tout cas c’est un phénomène intéressant.
Pourquoi tu devrais le découvrir à ton tour ?
Dans l’article, il décortique pourquoi ça a bien l’air d’être un effet de cohorte et non pas un effet de l’époque en général. En d’autres termes, pour une fois on aurait un vrai effet générationnel.
Pour lire l’article c’est par ici : https://www.ft.com/content/c361e372-769e-45cd-a063-f5c0a7767cf4