Deez is la tech — Épisode 3— Flow — Anatomie d’une feature

Published in

Deezer I/O

36 min readDec 7, 2022

Avec ce troisième épisode de Deez is la tech, nos équipes inaugurent une nouvelle série d’épisodes dédiés à la découverte des coulisses et rouages du produit Deezer. Et quel meilleur sujet que Flow pour lancer cette série intitulée “anatomie d’une feature” ?

Note: This post accompanies the release of the third episode of “Deez is la tech”, a brand new podcast created by Deezer’s Product & Tech teams — in French only for now. You will still find English content on deezer.io though. In particular, since we are talking about Flow here, you can (and should!) read our post about the story of Flow’s moods, or how Deezer’s recommendation team built an emotional AI!

Résumé de l’épisode

Flow est la fonctionnalité phare et exclusive de Deezer qui propose à chaque utilisateur un mix infini et personnalisé combinant ses musiques préférées et des découvertes sur-mesure.

Créé en 2013, [le] Flow est passé par plusieurs étapes avant d’atteindre sa forme actuelle. Comment a-t-il été conçu ? Comment fonctionne-t-il ? Comment évolue-t-il ? Quels défis nos équipes ont-elles dû relever pour parvenir à ce résultat ?

Aurélien Hérault (Chief Innovation Officer — @dokydeezer), Benjamin Chapus (Data Scientist — @xbenji) et Marin Lorant (Lead Product Manager — @MarinLorant) reviennent sur la genèse de Flow, présentent ses dernières nouveautés et évoquent des pistes d’améliorations futures. Ils nous livrent également leurs “Coups de coeur” du moment, découverts pour certains grâce à Flow !

Ce podcast est une nouvelle fois animé par Loïc Doubinine (@ztec6) et Vincent Lepot (@neozibok).

Transcript

Loïc [00:00:07] Bonjour et bienvenue dans Deez is La Tech, le podcast qui n’pète ni les plombs ni les crons ! Je m’appelle Loïc, développeur depuis plus de six ans à Deezer. Je suis aujourd’hui en compagnie de Vincent, qui va co-animer cet épisode avec moi. Salut Vincent, comment vas-tu ?

Vincent [00:00:25] Salut Loïc, ça va très bien, merci. Moi aussi, je vais me présenter : je suis toujours dév chez Deezer depuis cinq ans quasiment. Aujourd’hui, nous allons animer ensemble un nouvel épisode de ce podcast tech “made in Deezer”. Et cette fois-ci, nous allons ouvrir un peu le capot et lancer un format que nous appellerons “anatomie d’une feature”. Pour cette première, nous allons parler de Flow.

Loïc [00:00:53] Avant les plateformes de streaming, on avait quelques dizaines de disques, quelques centaines tout au plus. Sélectionner ce qu’on avait envie d’écouter était relativement facile. Bon d’accord, parfois, c’était plus difficile que ça, mais le choix était limité. Maintenant, parmi des dizaines de millions de titres qu’il faut choisir, impossible de tout écouter évidemment ! C’est pourquoi la recommandation de contenu est arrivée sur les plateformes de streaming pour nous aider, nous, simples mortels, à sélectionner la musique qui est susceptible de nous plaire dans un catalogue grossissant toujours plus que le temps disponible pour l’écoute. Deezer propose le Flow, sujet d’aujourd’hui. Bientôt dix ans, un petit ado !

Vincent [00:01:27] Que fait le Flow ? Comment est-il arrivé chez Deezer ? Vous le saurez grâce à nos invités. Car autour de la table, nous avons trois personnes qui vont vous parler de recommandation. Et je vais commencer par Aurélien. Salut Aurélien !

Aurélien [00:01:41] Salut à tous.

Vincent [00:01:41] Est-ce que tu peux te présenter en quelques mots ?

Aurélien [00:01:43] Oui, moi c’est Aurélien. Je suis là depuis quinze ans maintenant, avec plusieurs vies chez Deezer, notamment dév au début, puis chef de projet, directeur de production — comme on l’appelait à l’époque. Et puis il y a dix ans, j’ai monté l’équipe R&D. Je suis également chargé de diriger l’équipe de Data Science en charge des algorithmes.

Vincent [00:02:10] Super, merci Aurélien. À côté de toi, il y a Benjamin. Salut Benjamin !

Benjamin [00:02:15] Salut !

Vincent [00:02:16] Est-ce que tu peux te présenter, toi aussi, en quelques mots ?

Benjamin [00:02:18] Oui, je suis Benjamin, je suis arrivé chez Deezer il y a huit ans et demi, donc un petit peu après la création de l’équipe Data Science. J’ai très rapidement bossé sur les sujets de recommandation au sein de l’équipe Data. Et c’est toujours ce que je fais aujourd’hui. Donc j’ai pas mal bossé sur le Flow depuis sa naissance jusqu’à aujourd’hui.

Vincent [00:02:39] Et tu vas pouvoir nous en parler plus en détail. À côté de toi, il y a Marin. Salut Marin !

Marin [00:02:45] Salut !

Vincent [00:02:45] Même punition : est-ce que tu peux te présenter en quelques mots ?

Marin [00:02:48] Je m’appelle Marin, je suis Product Manager à la Recommandation et j’ai rejoint Deezer il y a un an et quatre mois. Je travaille beaucoup avec Benjamin pour essayer de comprendre comment les gens découvrent de la musique et comment Flow, entre autres, peut les aider à atteindre cet objectif.

Vincent [00:03:06] Eh bien merci, on va donc en discuter…pendant le temps qu’il faudra ! Et à la fin, on parlera un peu de vos coups de cœur musicaux pour terminer l’épisode.

Loïc [00:03:24] Du coup, première question : j’ai parlé du Flow au début dans l’introduction, est-ce que vous pouvez me dire ce que c’est ?

Marin [00:03:32] Flow, en deux mots, c’est une radio personnalisée, c’est la bande-son de votre vie. En gros, imaginez que l’intelligence artificielle de Deezer prend en compte tout ce que vous avez écouté, tout ce que vous avez ajouté en favoris, tout ce que vous avez skippé, tout ce que vous n’avez pas aimé, et à partir de ça, essaye de prédire en temps réel la chanson que vous avez envie d’écouter.

Aurélien [00:03:58] C’est bien résumé.

Loïc [00:04:01] Et comment ça vous est venu à l’idée, il y a quinze ans, de construire cette feature ?

Aurélien [00:04:07] Je vais me permettre de répondre et donner un peu le contexte historique. Avant Flow, il y avait la “Smartradio”. C’est un peu l’ancêtre du Flow. Pourquoi cette feature a été créée ? C’est qu’une fois qu’on a mis en place Deezer avec un catalogue de plusieurs millions de titres en ligne — ce qui était nouveau à l’époque — on s’est confronté à une grande question des utilisateurs : “j’ai envie d’écouter de la musique, mais je ne sais pas quoi”. Et puis l’idée n’est pas venue tout de suite. C’est venu quelques années après le lancement de Deezer. Donc il y avait la Smartradio qui avait ce côté un petit peu intelligent de créer des radios relativement abordables : “j’ai envie d’écouter des chansons qui ressemblent à Michael Jackson”. C’était une approche vraiment “artist-centric”. Et puis on s’est aperçu — parce que je pense qu’il y avait un côté aussi un peu involontaire… On avait mis en place des trackers data pour les royalties et c’est comme ça qu’on a commencé à logger les logs d’écoute, qui avaient une vocation non pas algorithmique au départ, mais purement de reporting. Et après quelques années de collection de data, on s’est dit : comment on pourrait les utiliser pour répondre à ces questions ? Comment on pourrait personnaliser l’expérience des utilisateurs ? À l’époque, j’étais à Berlin, et Daniel (ndlr: Daniel Marhely, co-fondateur de Deezer) et Alexandre Croiseaux — VIP Product de l’époque — sont venus me rendre visite et rendre visite à l’équipe R&D avec, dans les bagages, cette fameuse idée de Flow. Alors Flow, ce n’était pas vraiment une radio au départ, c’était une interface complète avec le “Feed”. Et en fait, Flow et le Feed, ce sont deux features qui étaient vraiment liées au tout début, qui ont été dissociées au moment de l’exécution et de la création, mais le projet initial, c’était une homepage qui défilait, qui avait un Flow, qui pouvait proposer que du contenu personnalisé, que ce soit des albums, des podcasts — il y avait déjà cette notion multi-contenus à l’époque. Voilà un petit peu comment c’est né : à la fois d’une implémentation de trackers data, d’un besoin utilisateur qui est “j’ai envie d’écouter de la musique, mais je ne sais pas quoi” et de ce concept un peu nouveau et novateur d’un mix infini.

Loïc [00:06:33] Tu peux rappeler peut-être ce que c’était que le “Feed” à l’époque ?

Aurélien [00:06:36] Le “Feed”, c’était une homepage complètement personnalisée. Ça ressemblait plus ou moins à un feed Instagram où il y avait de l’interaction : on proposait des albums, des playlists, etc., et c’était entièrement personnalisé. Sachant qu’on venait d’un shift complet, d’une homepage qui était 100% éditorialisée à une homepage 100% algorithmique. Ça a été un shift complet cette année-là avec le Flow, qui trônait en haut de cette homepage.

Loïc [00:07:07] Et tu te souviens à peu près en quelle année c’était ?

Aurélien [00:07:09] 2010, je dirais. 2010–2011 pour le Feed et la homepage. Après, on a mis plusieurs années à faire différents types de versions, et je pense que tu confirmeras quand tu nous a rejoints, Benjamin, qu’il avait aussi des portes de sortie qu’on s’était mis. Notamment, je me souviens de ce bouton qui, comme l’algo était un peu balbutiant au début, jouait son album favori ou sa playlist favorite.

Benjamin [00:07:39] Tout à fait. Quand je suis arrivé — je suis arrivé fin 2013 — le Feed était encore assez jeune, il venait de sortir et c’était la fonctionnalité phare de recommandation de Deezer. Je ne crois pas qu’il y avait énormément de reco ou d’algo ailleurs dans Deezer que dans le Feed. Peut-être les artistes similaires ou certaines choses comme ça… Et rapidement, on s’est dit “c’est sympa toutes ces recos qu’on propose à l’utilisateur sous forme de Feed” — alors ça ressemblait vraiment à un feed Facebook ancienne époque, 2012–2013 — et on s’est dit “toutes ces suggestions de contenu, ce serait bien si on pouvait les écouter de manière complètement automatique, sans avoir à choisir, et se laisser guider comme ça”. Le premier nom du Flow en interne, dans les contextes d’écoute, c’était “user feed radio”. Et je crois que ça s’appelle encore un petit peu comme ça dans certains endroits du code ! Et donc, sans développer d’algo à l’époque, on récupérait le contenu suggéré du Feed, les albums, les chansons — il y avait les chansons “tendance”, il y avait des chansons qui avaient été beaucoup partagées par des personnes — et on rassemblait tout ça. C’était la radio utilisateur.

Aurélien [00:08:43] Je vous invite à aller voir le site uxtimeline.com notamment, qui retrace toutes les différentes versions de Deezer. Et je confirme qu’en fait, c’était en 2013, le Feed.

Loïc [00:08:57] D’accord. Du coup, la question, c’est : quand vous êtes arrivés avec l’idée de ce Flow et tout ça, techniquement — on a déjà eu quelques bouts de réponse sur le “comment vous avez assemblé le Flow” mais, depuis, je pense que ça a pas mal évolué — comment avez-vous fait techniquement évoluer ce Flow ? De quoi s’agit-il ? Sans trahir les secrets industriels extrêmement importants et bien gardés de Deezer.

Aurélien [00:09:21] Je pense que c’est pas mal de voir la première problématique : le catalogue. Les artistes homonymes, les fameux ISRC qui sont censés être uniques et qui ne le sont pas…

Loïc [00:09:33] Tu peux nous rappeler ce que c’est que l’ISRC ?

Aurélien [00:09:35] L’ISRC, c’est l’identifiant de track du déposant, qui est censé être normalisé et qui nous a finalement amené à concevoir d’autres projets annexes, comme le fingerprint, pour justement gérer des problématiques de catalogue pour la recommandation. C’est venu de là, typiquement, ce projet de fingerprint. Avant de faire un SongCatcher, c’était pour gérer du catalogue et notamment des ID uniques basés sur la seule vérité qu’on avait, c’est-à-dire un fichier audio. Puisqu’on s’est rendu compte, au début de la conception du Flow, que les métadonnées étaient assez variables en termes de qualité ! Et je pense qu’encore aujourd’hui, même si ça s’est largement amélioré, il y a encore des petites problématiques.

Benjamin [00:10:21] Quand je suis arrivé, j’étais assis juste à côté de Thibault Roucou, qui a travaillé longtemps sur la gestion des royalties et qui connaissait très bien les fichiers qui sont livrés par les majors et les labels : les fameux fichiers DDEX. Ce sont des gros fichiers XML assez indigestes qui contiennent toutes les métadonnées d’un album lorsqu’il arrive chez Deezer. À partir de ces données-là, on était censé extraire des genres, des tags, des pays, le nom de l’artiste par exemple. Sauf qu’il peut souvent y avoir des artistes qui ont le même nom et donc les artistes se retrouvent mélangés. Ce sont des problèmes qu’on a encore un petit peu aujourd’hui. On s’est pas mal amélioré là-dessus, mais c’est vrai que ça reste toujours un gros sujet de différencier ces artistes-là. Et donc pour la reco, c’est très embêtant puisque quand un artiste arrive et qu’on veut le recommander, on va dire “super, il y a un nouvel album qui vient de sortir” mais ce n’est pas le bon, c’est un homonyme. Il y avait ce souci-là. C’est important aussi de différencier et de dédupliquer le catalogue pour éviter les problèmes de répétition. Un utilisateur va avoir une chanson dans son Flow, il va dire “je ne veux plus jamais l’écouter, je ne veux plus jamais l’entendre”. On a bien enregistré l’identifiant de la chanson mais, en fait, elle arrive sous une autre forme avec un album différent, et c’est toujours la même chanson. Donc les problèmes de catalogue n’ont pas mis beaucoup de temps à apparaître dans la reco. Il a déjà dû y avoir pas mal de data pour se sortir de ça.

Aurélien [00:11:41] Sans compter les données manquantes, typiquement la langue d’une chanson. On a dû mettre en place des techniques pour identifier la langue. On s’est notamment basé sur les lyrics et on a fait un détecteur de langue pour pouvoir qualifier, entre du rock anglais, du rock allemand, du rock français, du rock espagnol… Justement pour, à chaque fois, affiner. En fait, une grande phase chez Deezer, qui a été notamment drivée par la feature de recommandation et de Flow, c’est la qualification du catalogue : comment on décrit la musique, comment on arrive à bien la qualifier pour avoir une bonne base pour la reco et d’appliquer différents types d’algorithmes en production.

Benjamin [00:12:27] Puisqu’à la R&D, également au moment de mon arrivée, Manuel Moussallam est arrivé. On est un peu de la même promo ! Lui a beaucoup bossé sur la création d’une base de tags. L’une des pistes qu’on avait pour créer le Flow à l’époque, c’était de créer un grand graphe qui reliait les artistes par différentes relations, notamment le fait de partager certains tags, certaines époques, certaines métadonnées. C’était un genre de grand graphe sémantique qui devait servir pour la reco, et les premiers prototypes marchaient sur ce principe-là. On pouvait voir ça un peu comme une marche exploratoire : on part d’un artiste et on va suivre selon un tag ou si un artiste a contribué à un album… Voilà, on peut suivre tous ces chemins-là et créer une expérience de recommandation.

Aurélien [00:13:08] Avec ses problématiques, comme la date.

Benjamin [00:13:11] Avec ses problématiques, oui.

Aurélien [00:13:12] La date, qui semble être une donnée relativement fiable. La date de release. Et on se rend compte très rapidement que c’est une donnée qui est peu fiable, donc forcément, pour tout ce qui est decade, etc., on était amené à recommander des nouveautés qui n’en sont pas. Donc finalement, derrière une fonctionnalité très simple où c’est “one-click button et j’ai de la musique”, il y a beaucoup de problématiques de Deezer et pas mal de projets qui ont découlé de cette fonctionnalité.

Vincent [00:13:45] Et du coup, on imagine que le Flow tel qu’on le connaît maintenant est passé par plein de versions. Comment il évolue ? À quel rythme ? Est-ce que vous pouvez nous en dire un petit peu plus là-dessus ?

Benjamin [00:13:56] Ça évolue de manière continue depuis sa création. En fait, on est tout le temps en train de tester différents algos. Même là, à l’heure où on parle, il doit y avoir trois ou quatre versions en simultané avec plusieurs A/B tests. Ça demande pas mal de boulot déjà pour concevoir ces différents algos, réfléchir à quelle hypothèse on va vouloir tester avec nos utilisateurs. Et après, il faut analyser les données, se mettre d’accord sur ce qui est important pour définir qu’un algo est meilleur qu’un autre. Et ce n’est pas une mince affaire non plus.

Vincent [00:14:27] D’ailleurs, comment savez-vous que le Flow répond bien aux attentes d’un utilisateur ? Quel est l’indicateur qui vous dit “c’est bon, le Flow de tel utilisateur lui convient, ne lui convient pas, etc.” ?

Benjamin [00:14:38] Pendant très longtemps, ça a été avec le temps d’écoute moyen et la reconnexion. Ça a été les deux principales métriques qu’on a utilisées. Et on s’est rendu compte que ce n’était pas forcément toujours très judicieux. On a observé assez rapidement quelque chose — on aurait pu s’en douter un peu avant mais voilà : plus on va mettre des chansons familières dans le Flow, plus on va mettre des chansons du profil, plus on va mettre des trucs que l’utilisateur connaît déjà, plus le temps d’écoute sera long. Et donc, si on suit aveuglément cette métrique-là, on aura tendance à finalement ne mettre que les chansons favorites de l’utilisateur dans le Flow. Et ça va créer une fonctionnalité qui va être différente peut-être de la promesse initiale, qui était : “tu ne sais pas quoi écouter et on va choisir à ta place”. Et de dire : “ce que tu as envie d’écouter, c’est ce que tu préfères”, ce n’est pas un pari très audacieux ! Donc, pendant longtemps, on a cherché à fidéliser autour de cette fonctionnalité, à faire en sorte que les gens comprennent un peu le but, le principe, mais rapidement, on a essayé d’observer d’autres signaux, comme le fait de rajouter des chansons dans ses playlists, qu’on aurait découvertes dans le Flow. On essaye de modéliser la découverte et de voir si l’utilisateur arrive à élargir un peu son horizon musical grâce au Flow.

Aurélien [00:15:51] Je pense qu’on peut aussi parler de l’effet de fraîcheur des nouveaux algos. Généralement — enfin, c’est quelque chose qu’on a remarqué à chaque fois qu’on mettait en prod un nouvel algo — d’un seul coup, ça fonctionnait mieux. Et puis, il faut laisser assez de temps parce que les gens se sont habitués au type de sélection, ce qui nous a amenés à conditionner des temps de tests un peu plus longs que juste mettre en prod, observer, et au bout d’une semaine tirer des conclusions. On a des tendances au bout d’une semaine mais il faut laisser le temps à l’algo aussi de maturer et voir les effets sur un peu plus long terme.

Vincent [00:16:28] C’est-à-dire qu’il y a un espèce d’effet de surprise finalement ?

Aurélien [00:16:32] Oui, puisque tu changes la façon de faire la sélection. Du coup, il y a l’effet de fraîcheur qui amène une certaine nouveauté. Et puis, je pense qu’on peut quand même notifier un point, c’est qu’un algo ne va pas correspondre à l’intégralité des utilisateurs. Donc c’est un peu l’approche “divide and conquer” où on “clusterise” : d’abord on va faire deux groupes d’utilisateurs, donc on va avoir deux algos qui vont servir différemment parce que ce ne sont pas les mêmes attentes, puis après, ça va être trois, quatre et on va essayer à chaque fois de “clusteriser” pour servir au mieux des groupes d’utilisateurs et leurs attentes, qui ne sont pas identiques. Il n’y a qu’une feature mais il y a différents types d’attentes derrière Flow.

Marin [00:17:20] Aussi, l’une des spécificités de Flow, que je n’ai observée sur aucune autre plateforme de streaming, c’est que Flow prend en compte les interactions des utilisateurs en temps réel. Par exemple, si Flow me recommande une chanson et que je la bannis parce qu’elle ne me plait pas ou que je bannis l’artiste parce qu’il ne me plait pas, la “Queue list” — les chansons que Flow va envoyer après — est changée. Et ça s’adapte tout le temps comme ça. Et pendant longtemps, il y a eu un gros débat si j’ai bien compris — j’ai fait un peu d’archéologie, je suis allé chercher des vieilles présentations, regarder des vieilles présentations sur RecSys… Et un débat qu’il y a eu depuis le début je crois, c’est de savoir si c’était à l’utilisateur d’orienter Flow ou si Flow devait tout deviner tout seul. Donc si on devait s’en remettre au Machine Learning pour tout ou si on devait impliquer un peu l’utilisateur dans le choix de la musique qui allait venir. J’ai l’impression que, dernièrement, on s’est rendu compte d’un truc. Certaines interactions sont explicites — celles dont parlait Benjamin : le fait d’ajouter en favori ou d’ajouter à une playlist, ça c’est une interaction explicite qui dit que oui, l’utilisateur aime bien cette chanson-là, et le fait de bannir la chanson indique que oui, il n’aime pas cette chanson-là. En revanche, le fait de skipper, donc de passer à la chanson suivante, ou d’écouter la chanson sans interagir avec l’interface, est implicite et moins facile à lire. C’était l’un des un des éléments limitants pour améliorer encore plus la pertinence de Flow, qui était de se dire : pourquoi l’utilisateur est passé à la chanson suivante ? Est-ce que c’est parce qu’il ne l’aime pas ? Est-ce que c’est parce qu’il l’a trop entendue aujourd’hui ? Est-ce que c’est parce qu’il l’adore mais qu’en fait, ce n’est pas du tout le bon moment pour écouter cette chanson puisqu’il est en train de travailler et que c’est une chanson un peu violente ? Il y avait ce problème-là.

Loïc [00:19:25] Aujourd’hui, si je me crée un compte sur Deezer, je n’ai pas de Flow. Il me faut quelques jours pour avoir un Flow. Alors, moi, je sais concrètement ce qu’il faut avoir derrière, mais un utilisateur qui arrive sur le service ne sait pas exactement ce qu’il faut faire pour que le Flow s’active. Du coup, vient ma question : comment faire pour améliorer son Flow, pour peut-être être plus acteur de son Flow ? Tu parlais, par exemple, de mettre des chansons dans des playlists ? Du coup, ça me fait aussi poser la question : qu’est-ce qui se passe quand je mets des comptines dans une playlist de comptines ? Sachant que je ne veux pas écouter de comptines dans mon Flow par exemple, c’est pour mes enfants.

Aurélien [00:19:57] Tu es sûr ?

Loïc [00:19:57] Et oui, je suis sûr !

Benjamin [00:19:59] Oui, l’enfer est un peu dans ce genre de détails. Ça rentre dans tous les problèmes de filtrage qu’on a : on peut penser à la musique pour enfants, il y a aussi les musiques de Noël et toutes les musiques saisonnières qu’on peut avoir envie d’écouter à un moment donné mais il ne faut pas dépasser une certaine date…

Loïc [00:20:12] Genre, les musiques de Noël ne doivent pas dépasser le 24 décembre ?

Benjamin [00:20:15] Ouais, aller, jusqu’au 25, ça passe ! Mais très rapidement, on se prend beaucoup de retours du Customer Support sur les réseaux sociaux. Il peut y avoir des musiques très contextuelles, des musiques de relaxation… Sur le catalogue Deezer, il y a aussi énormément de choses assez étonnantes : il peut y avoir des sound effects, des bruits d’aspirateur, des bruits blancs, il peut y avoir des interviews, des audiobooks… Tout un tas de choses qu’on n’a plutôt envie de filtrer dans le Flow. Et pour faire ça, il faut pouvoir l’identifier. Il faut que ce soit donc flagué, il faut qu’on ait des data, donc on revient un peu à ce problème initial de catalogue. C’est pour ça qu’on a voulu, très tôt aussi, trouver des manières automatisées de qualifier la musique, autres que celles que nous fournissaient les providers, les maisons de disques et les labels. Il y avait ce projet, quand je suis arrivé, qui était d’écouter un petit peu ou de crawler ce qui se passait sur Internet, différents types de radios pour essayer de qualifier certains artistes. Si un artiste apparaît dans un blog et qu’il y a des mots — “alternatif”, “rock”, “indie folk” — qui ne sont pas très loin de cet artiste-là, ça va nous permettre de bâtir une confiance sur des tags qu’on aurait déjà pour dire : “ok, cet artiste-là, il est bien identifié”. Et à l’inverse, quand il y a des tags un peu antinomiques qui arrivent sur un artiste, on peut se dire qu’il y a un problème avec peut-être une discographie qui est mélangée.

Aurélien [00:21:33] Le premier moteur de tags pour qualifier le genre, etc., c’est un fingerprint sur différentes webradios, notamment des webradios spécialisées. Il y en a plein, sur Internet, de fans, qu’on avait mis dans le fingerprint. On analysait en permanence et du coup, quand une track se retrouvait — c’était un système de votes — dans plusieurs radios rock, on lui a accolé le tag “rock”. Par extension, on a fait ça sur les playlists après : en gros, on a pris toutes les playlists, en se disant “on va prendre toutes les playlists rock et on va essayer de qualifier notre catalogue”. C’est un autre sujet mais…

Benjamin [00:22:11] Ouais ! Pour revenir sur les nouveaux utilisateurs, c’est assez intéressant, on fait une promesse assez tôt : quand on s’inscrit à Deezer, il y a Flow, c’est différenciant, “il faut que vous l’écoutiez”. Et on s’est très souvent demandé — il y avait pas mal de débats internes : est-ce qu’on doit fournir le Flow à D0 ou est-ce qu’il doit arriver lorsqu’on a bâti une confiance assez forte sur les goûts de l’utilisateur ? Évidemment, on essaie de le proposer le plus tôt possible. C’est pour ça qu’il y a un onboarding, comme sur toutes les applis : on essaie de demander explicitement à l’utilisateur ce qu’il a envie d’écouter. On remarque, par exemple sur Spotify, qu’il y a “Discover Weekly” mais ils ne sont pas très très clairs sur “à quel moment cette playlist va être dispo”. C’est-à-dire que cette playlist de découvertes hebdomadaires, elle n’est pas disponible dès l’inscription. Et on avait quand même remarqué que ça ne dérangeait pas forcément les gens d’attendre un peu et qu’ils comprenaient qu’il fallait aussi bâtir un profil, qu’il fallait connaître un peu les écoutes. Ça peut être très très décevant : on s’inscrit, on rajoute trois artistes dans sa library, on lance le Flow et on se dit : “ok, ça me propose des choses soit trop évidentes, soit trop éloignées”. Donc on a besoin de savoir un peu plus ce que l’utilisateur va faire. Aujourd’hui, on a des critères qui permettent de déterminer si un profil est assez mûr ou pas pour le Flow.

Marin [00:23:22] Critères qui étaient notamment alignés sur ce qui se passait à l’onboarding — on demande à l’utilisateur de nous renseigner quels sont ses artistes préférés. Et aujourd’hui, pour débloquer Flow, il faut avoir ajouté en favori au moins seize artistes ou chansons. À partir de ça, on estime qu’on est capable de générer un Flow de qualité. Cette règle a tendance à évoluer, comme Flow évolue, et Flow se base sur plein d’autres données utilisateurs, et pas seulement les favoris. On se rend compte qu’on est capable de générer aussi des Flow de qualité à partir d’autres critères donc cette limite, ce palier minimum de seize artistes ou chansons favoris, tend à évoluer. Mais aujourd’hui, ça reste la façon la plus courante de débloquer Flow.

Benjamin [00:24:11] On a ajouté un critère basé sur le nombre de chansons écoutées dans une dernière fenêtre de temps. Donc quelqu’un qui n’aurait rien mis en favori mais aurait écouté un certain nombre de chansons, playlists, albums, pourrait avoir le Flow. Parce qu’on pense qu’on a un peu compris ce que la personne voulait écouter.

Vincent [00:24:28] J’ai une question. Un peu la question de la punaise de lit ! Est-ce qu’on a essayé des choses qui n’ont pas marché ?

Aurélien [00:24:35] Plein, plein, plein.

Vincent [00:24:35] Est-ce qu’on a connu des échecs avec certains algos ?

Benjamin [00:24:38] Je pense qu’on a majoritairement essayé des choses qui n’ont pas marché. Ça peut être assez décevant. En gros, le schéma classique d’un Data Scientist à la reco, c’est : on écoute le Flow, on n’est pas forcément hyper satisfait, on se dit qu’on peut mieux faire et on a tendance à vouloir améliorer par rapport à ses propres critères. On se dit : “bon, là, c’est pas du tout ce que j’ai envie d’écouter”. Donc on va changer plein de choses, on va tuner des paramètres, on va vouloir trouver des nouvelles sources… Et puis, tout d’un coup, on va avoir un algo qui nous parait vraiment super. On a envie de l’écouter, c’est trop bien, on se dit “tout le monde va adorer”, on le met en prod et on se rend compte que tous les KPI baissent, que ça marche beaucoup moins, que les gens sont déçus. Voilà, ça, c’est globalement ce qui se passe dans 90% des cas. C’est pour ça que, petit à petit, on a appris à améliorer les algos non pas sur des critères personnels — même si je pense que, parfois, avoir un peu d’opinion et quelque chose qui vient de soi-même, c’est bien — mais il faut être assez attentif aux données, mieux connaître les utilisateurs, essayer de comprendre comment le Flow est utilisé, quand, par qui, dans quel contexte, pour quelles raisons… Et pour ça, on se base sur le travail de plein d’autres équipes, que ce soit côté Data Analytics, qui vont nous donner des indications sur le contexte, sur quel genre d’applis, quels genres de moments de la journée, ou des recherches menées par l’équipe User Research, où l’on va carrément poser des questions aux utilisateurs en leur demandant : “qu’est-ce que vous pensez du Flow ? Qu’est-ce que vous attendez du Flow ? Qu’est-ce que de la découverte pour vous ? Là, vous avez fait beaucoup de skips, qu’est-ce qui ne va pas ?” Je pense que c’est là qu’on a appris le plus de choses, en écoutant les utilisateurs.

Loïc [00:26:21] Question “futur” : c’est quoi le Flow de demain ?

Marin [00:26:27] Il y a déjà le Flow d’aujourd’hui, qui a un petit peu changé à partir des interactions implicites et de ce grand débat qu’il y avait sur : est-ce que pour faire évoluer Flow et pour que Flow soit capable d’être vraiment la bande-son de la vie des utilisateurs — c’est très difficile, comment est-ce que Flow peut savoir que l’utilisateur à ce moment-là est fatigué ou qu’il est en forme ou qu’il a envie de faire la fête ? On a pris le parti de permettre à l’utilisateur de dire à Flow comment il se sent, quel est son contexte émotionnel et quelle est, du coup, la musique qu’il aurait envie d’entendre à partir de ce point-là. Parce que, comme disait Aurélien tout à l’heure, la proposition de valeur de Flow à l’origine, c’est : “je ne sais pas ce que je veux écouter, mais je veux écouter de la musique”. Donc les gens n’ont pas envie de choisir un artiste, une chanson, un genre. Ils ne savent pas et ils n’ont pas envie de choisir. En revanche, il y a une question très simple qu’on peut leur poser et qu’on se pose tous quand on se rencontre, c’est : “comment ça va ? Comment tu te sens ?” Littéralement, c’est la question que Flow pose maintenant à tous les utilisateurs, et ça s’appelle “Flow Moods”. Il y a une interface sur mobile, qui est une “roue des émotions”, avec le gradient de Flow où chaque émotion correspond à une couleur, une icône, etc. Et on peut retrouver cette proposition de valeur, différents Flow qui correspondent à des humeurs, aussi sur l’application desktop. Et ces interfaces-là, je vous laisserai le loisir de les regarder, permettent de conserver la proposition de valeur initiale de Flow, qui est “je ne sais pas ce que je veux écouter, je n’ai pas envie de réfléchir, je n’ai pas envie de choisir quelque chose”, et en même temps, “je peux orienter Flow pour que Flow puisse vraiment être la bande-son de ma vie, que Flow puisse s’adapter à mon contexte émotionnel.

Vincent [00:28:14] On lui dit “je suis en train de travailler” ou “je suis fatigué, j’ai envie d’écouter des trucs relaxants”…

Marin [00:28:20] C’est ça, oui.

Aurélien [00:28:21] C’était aussi une des demandes d’utilisateurs d’avoir de l’interaction. Parce que, finalement, la proposition de valeur, c’est “je veux écouter de la musique que j’aime, je ne sais pas quoi, aidez-moi”, donc on est là avec Flow mais derrière, ça ne veut pas dire ne pas faire du tout d’interaction. On peut le voir à travers les feedbacks : quand un utilisateur s’habitue à l’usage de Flow, il a de plus en plus envie de participer et de pouvoir le customiser. Et je pense que — c’est mon point de vue en tout cas — l’aventure Flow, c’est de garder cette proposition au niveau “je ne sais pas quoi écouter, proposez-moi quelque chose” et au fur et à mesure, de tester différents types d’interactions, d’aller toujours plus loin. Puis, d’un point de vue technique et algorithmique, les techniques avancent dans la description du catalogue. Je sais que, maintenant, on utilise des embeddings audio, c’est-à-dire qu’on va prendre en compte des critères sonores du signal audio pour toujours améliorer la qualification et se rapprocher de plus en plus de “la chanson parfaite au bon moment”. Je pense que c’est ça Flow et c’est ça qu’on va continuer de développer : d’avoir la bonne chanson au bon moment. Donc c’est à travers des interactions, c’est à travers l’amélioration de la qualification du catalogue, des algorithmes qui avancent et des techniques. Il y a une évolution, c’est un long chemin et là, les moods, c’est super intéressant. On peut, du coup, cartographier l’humeur des Français, ou même des utilisateurs dans le monde ! Ce qui donne d’autres types d’informations et ce qui amène toujours Flow à être un peu tête de pont dans la création de nouvelles features, qui sont aussi annexes. Je reviens beaucoup là-dessus mais Flow, par sa proposition, tire Deezer sur des chemins qu’on n’avait pas forcément anticipés : le fingerprint — comme je l’évoquais tout à l’heure, le système de tags, la détection de moods — parce que, finalement, pour faire une “Flow wheel”, il y a eu du travail de recherche pour détecter les moods, c’était la première étape. Il y a beaucoup de choses complètement annexes. L’onboarding, pendant longtemps, était inexistant et on donnait Flow à tout le monde. Et au fur et à mesure, c’est en créant l’onboarding que ça a servi à la homepage — au fameux Feed — et le fameux Feed a servi au Flow. En fait, le Flow est quand même une feature locomotive sur plein de projets tout autour.

Benjamin [00:30:48] Le Flow, on essaie de le garder simple. Il y avait donc toujours ces débats de savoir si on voulait permettre à l’utilisateur de choisir si on voulait avoir plus de découvertes ou si on voulait avoir seulement des choses personnelles. Au final, je pense qu’on revient un peu de ce stade où on pensait que via la data, via les algos, on pouvait comprendre vraiment ce qui se passait dans la tête des gens. La musique reste quand même quelque chose de très très très personnel. Ce qui va rendre la recommandation musicale vraiment sympa je pense, c’est quand on la caractérise un peu en expliquant pourquoi on recommande quelque chose. Donc, dans les évolutions futures du Flow, je pense que c’est quelque chose qu’on a envie d’explorer. C’est-à-dire qu’on propose cette chanson-là — alors peut-être pas forcément spammer l’utilisateur en lui disant “voilà, c’est pour ça qu’on te l’a recommandée” — mais si la personne veut savoir pourquoi, on pourrait dire : “c’est parce que tu as écouté ça il y a un moment, ou parce que ça vient de sortir, ou parce que quelqu’un qui est très proche de toi écoute ça, ou parce que tu l’as écoutée à un moment donné mais tu n’as pas fini l’album”. Enfin, essayer de caractériser pourquoi on pousse ce contenu-là. Je pense que ça permet de rétablir une bonne confiance avec nos utilisateurs qui commencent à être un petit peu éduqués, maintenant, aux algos, commencent à comprendre comment tout marche, que ce soit sur les sites de e-commerce, que ce soit sur TikTok, Netflix ou Deezer, et sont finalement quand même assez contents quand on prend leur temps de leur dire pourquoi on leur pousse du contenu. Et ça peut aussi limiter le rejet face à la reco.

Loïc [00:32:09] Et qu’est-ce qu’il y a comme solutions techniques mises en place aujourd’hui pour caractériser le catalogue ou pour analyser tout ça ? Est-ce qu’on peut utiliser les gros mots actuels, qui sont le Big Data, l’IA, ce genre de choses ?

Aurélien [00:32:23] Je pense que ça fait déjà quelques années qu’on utilise ces gros mots-là. D’une manière générale, on fait partie du club des sociétés qui utilisent l’AI, de la Big Data, etc.

Benjamin [00:32:36] Le Deep Learning.

Aurélien [00:32:36] Comment ?

Benjamin [00:32:37] Le Deep Learning, dans les gros mots qu’on n’a pas dits.

Aurélien [00:32:39] Du Deep Learning, du Machine Learning…

Marin [00:32:41] Du Neural Network.

Aurélien [00:32:44] Oui, oui, on fait partie de ces gens-là. Après, c’est comme tout : comme toute techno, ça évolue. Enfin, la Big Data, ça vient d’où ? Ça vient des distributions Linux, Cloudera, etc., qui ont démocratisé ça il y a quelques années maintenant. Après, une fois que c’est un peu plus accessible, ça ne veut pas dire qu’on sait faire de la Big Data. Je pense que maintenant, après toutes ces années d’investissements, on fait partie quand même des personnes qui savent exploiter, qui ont développé une expertise dans ces domaines-là. Mais c’est de l’investissement. Je rappelle que Deezer a quand même investi pendant dix ans dans de la R&D, dans des équipes Data Science. Ça ne s’est pas fait non plus en un jour. On n’est pas débarqué sur ce domaine-là, donc ce n’est pas un gros mot chez nous. Ça reste un terme assez marketing, je pense. Malgré tout, oui, on brasse beaucoup de données, on en traite énormément et ça ne va pas en s’arrangeant, j’ai envie de dire. On en accumule de plus en plus, et en plus, à partir de ces données-là, on en crée d’autres ! C’est-à-dire que maintenant, on va “s’amuser” à aller voir ce qu’on peut aller chercher dans les MP3 pour créer encore plus de données.

Loïc [00:34:00] Et vous avez vu une vraie différence, justement, avec l’avènement de toutes ces technos ? On parlait de Deep Learning, maintenant on parle d’IA depuis peut-être 5–6 ans de manière industrielle. Est-ce que ça change réellement la donne, ou la qualité, ou la pertinence de ce qu’on fait ? Ou est-ce que c’est juste un outil de plus ?

Benjamin [00:34:18] Non, on gagne vraiment en précision, en confiance et on peut être un peu plus ambitieux. Donc je pense qu’on ne se serait jamais lancé dans les Flow Moods si on avait uniquement l’info qui venait des utilisateurs ou ce qui venait du catalogue. Ce n’est pas assez fiable. On sent que pour qu’une musique propage une émotion, il faut qu’elle ait un signal particulier. Et c’est une technologie qui est assez mature aujourd’hui, tout ce qui est “Music Information Retrieval”, qui permet de caractériser un mood. On peut facilement extraire d’une chanson sa tonalité, son rythme et certaines émotions qui pourront en sortir. Alors, ça ne marche pas par magie ! C’est parce qu’il y a, avant, des personnes qui ont fait le travail d’annoter ces chansons-là en disant “ça, c’est triste”, “ça, c’est joyeux”. Ce sont des choses qui ont été faites en interne, via la super team Edito & Curators, qui ont littéralement compilé, via des playlists, des chansons qui correspondaient à chaque mood. Après, le modèle va apprendre et va comprendre comment différencier ces chansons-là, directement à travers le signal. Donc on s’appuie sur ça, on s’appuie aussi sur les métadonnées et on s’appuie aussi sur l’intelligence collective de nos utilisateurs : on a des milliards de streams par mois donc à partir de là, on peut tirer des tendances, on peut voir des corrélations entre des écoutes. Qu’est-ce qui est mis dans les favoris ensemble ? Qu’est-ce qui est mis dans des playlists ensemble ? Mais aucune de ces méthodes, séparée des autres, ne marcherait vraiment. Je pense que la force qu’on a maintenant, c’est, via les puissances de calcul qui ont évolué et notre force de frappe, de pouvoir mélanger tout ça et d’avoir quelque chose d’assez intéressant. Ce qui est intéressant aussi, c’est de voir que ces différentes méthodes marchent plus ou moins bien selon les utilisateurs. Il y a des utilisateurs qui sont très sensibles au contenu lui-même, indépendamment des métadonnées d’une chanson, de qui est l’artiste. Ça va vraiment être : comment la musique sonne. D’autres vont être plus intéressés par une actualité donc ce ne sont pas forcément les mêmes algos. Je pense qu’aujourd’hui, ce qu’on essaie de faire, c’est de cibler au mieux en fonction des utilisateurs. Est-ce qu’il vaut mieux avoir plein d’algos et un algo qui choisit le meilleur algo pour chaque utilisateur, ou un seul algo qui s’adapte ? Voilà le genre de questions qu’on se pose tous les jours.

Aurélien [00:36:24] Et qu’on teste.

Benjamin [00:36:24] Et qu’on teste, évidemment.

Vincent [00:36:27] Comme quoi, il y a quand même encore un peu d’humain dans tout ça !

Aurélien [00:36:30] De toute façon, techniquement, tout ce qui est usage du Deep Learning, notamment avec GPU, etc., c’est NVIDIA, en mettant les librairies à disposition pour du calcul, qui a fait que ça a commencé réellement à prendre. Et puis derrière, malgré tout, il y a quand même beaucoup de supervisé. Les algos apprennent ce qu’on leur dit d’apprendre. Typiquement, pour les Flow Moods, il me semble même qu’il y a eu une participation hyper active des éditos, et donc l’algorithme est là pour appliquer une expertise éditoriale. Et c’est juste le rendre scalable parce qu’il y a des millions de titres. Enfin, contrairement à des Netflix où, finalement, le catalogue est relativement limité — il n’y a pas autant de films qu’il y a de musique — nos problématiques de scalabilité sont assez particulières avec la musique.

Loïc [00:37:17] Du coup, avez-vous fait des études pour voir combien de tracks ont pu sortir du catalogue caché ? Quand je dis “caché”, c’est le catalogue que personne n’écoute. Est-ce que les algorithmes du Flow les font ressortir ? Ou est-ce que justement, en utilisant un peu trop le côté éditorial, on se re-focus encore une fois, toujours, sur le gros du catalogue écouté ?

Aurélien [00:37:35] Je pense que dans toutes nos têtes, on a un peu cette vision où l’on espère vraiment aller chercher la petite pépite cachée au fin fond du catalogue. Je pense que ça a dû arriver. Est-ce qu’on l’a précisément mesuré ? Est-ce qu’on l’a précisément qualifié ? J’aurais tendance à dire “non”. Maintenant, plusieurs études ont montré cette fameuse couverture — ce qu’on appelle la couverture du catalogue dans les algos, c’est de prendre de plus en plus en compte un maximum de tracks — oui, on a vu et c’est quelque chose qu’on calcule et qu’on mesure aujourd’hui. C’est l’un des critères, la couverture du catalogue. C’est de savoir, en gros, qu’est-ce qu’on va prendre et qu’est-ce qui va être “recommandable”.

Loïc [00:38:18] Et cette couverture, a-t-elle tendance à augmenter dans le temps ?

Aurélien [00:38:21] C’est l’un de nos objectifs de la faire augmenter, et aussi que les algos prennent le relais. Enfin, dans la conception, on est là pour identifier la bonne audience et apporter le bon contenu à la bonne audience. Donc c’est de vérifier, après une sélection éditoriale — par exemple dans une playlist qui va mettre en avant et qui va booster un artiste, est-ce que les algos vont prendre le relais derrière ? Ou est-ce que ça va retomber aussi vite ? Parce qu’on est censé, quand on a créé une certaine audience avec une sélection éditoriale notamment, pouvoir prendre le relais de cette sélection et pouvoir continuer à “targeter” les bonnes personnes avec ce contenu.

Loïc [00:38:59] Du coup, j’ai une autre question. À un moment donné, tu disais que le Flow a tendance à être la locomotive et à permettre de faire plein de choses. Je sais qu’à Deezer, comme toutes les plateformes de streaming audio, on a des problématiques de spam de musique de la part des labels — là, pour le coup, je parle de labels qui vont volontairement essayer d’utiliser nos algorithmes pour leurs propres besoins. Est-ce que c’est quelque chose que vous prenez en compte ? Est-ce que vous avez participé à cette lutte contre ce spam ? Peut-être en identifiant les sources audios qui, je sais, peuvent être un peu modifiées pour passer entre certaines mailles, ou ce genre de choses ?

Aurélien [00:39:31] Le spam. La fraude.

Loïc [00:39:32] On peut faire tout un podcast si vous voulez !

Aurélien [00:39:34] Je pense que ça vaudrait le coup de prendre le temps d’en discuter parce que c’est quelque chose qui n’est pas nouveau en fait, et qu’on a pas forcément détecté au tout début. On ne s’en souciait pas trop, on était peut-être un peu plus innocent… Ou les techniques ont peut-être un peu plus évolué. Mais clairement, d’une manière globale sur Deezer : oui, il y a des phénomènes de fraude, oui, il y a des phénomènes de spam. Ils sont de plus en plus inventifs, il y a plusieurs techniques : en touchant au like, en touchant la recherche… Il y a mille moyens où des acteurs externes essayent d’influencer les algos pour justement bénéficier de cette prise de relais, en essayant de détecter les signaux qui vont faire qu’ils vont être mis en avant. Il y a aussi des techniques de détection — et d’ailleurs, il y a une équipe qui a été créée pour traiter ce sujet-là de notre côté. Avec la mise en place notamment du fingerprint, ça nous a permis de calculer un certain nombre de scores, notamment des labels ou des artistes qui relivraient trop souvent la même track avec des métadonnées différentes. On parle de “shittiness score” : en gros, si tu spam un peu trop avec le même contenu, on a tendance à avoir un score qui va pénaliser dans les algos. C’est l’un des mécanismes qui existent. Il y en a d’autres.

Benjamin [00:40:59] Oui, les gens ont rapidement compris que, pour qu’un algo sélectionne du contenu, il fallait qu’il soit un minimum populaire. Donc je pense qu’une bonne partie de la fraude vise à faire gonfler la popularité de certains albums, certains artistes. Après, il y a un effet boule de neige : une fois qu’un artiste est adoubé dans une playlist, que ce soit une playlist Deezer ou quelqu’un d’autre, et qu’il a plein d’écoutes, ça va créer une crédibilité. Ça va inciter d’autres personnes à écouter cet artiste ou à le passer en radio — puisqu’on sait que les radios se basent aussi sur les tops streaming pour leur programmation. Donc oui, il va y avoir beaucoup de tentatives de faire gonfler la popularité d’artistes. Il y a aussi des labels qui relivrent toujours le même contenu ou qui vont penser qu’en mettant tous les mots-clés possibles et imaginables, ça allait rendre le contenu plus intéressant. Ou alors des choses un peu plus simples : parfois des albums qui sont re-livrés, le même, sans forcément de changement audio sur l’album, ou des rééditions en se disant “peut-être que les algos, en se disant que c’est du nouveau contenu, vont le pousser en nouveauté à de nouveaux utilisateurs”. Donc oui, il y a pas mal de choses à contourner.

Vincent [00:42:03] Donc en fait, on a les mêmes problématiques qu’un Google qui se fait spammer son index de recherche.

Aurélien [00:42:06] Bien sûr, il y a de la SEO. Aujourd’hui, clairement, il y a de la SEO et, je pense, même des techniques pour placer des playlists dans le moteur de recherche. Bon, là on s’écarte un petit peu de Flow mais oui, ça existe. Enfin, c’est clairement là et on essaye de les identifier et de faire au mieux pour garder un contenu de qualité. Parce que, que cette technique existe, c’est une chose, mais il faut garder en tête qu’on est là pour les utilisateurs, pour leur fournir la meilleure expérience possible. Et ça fait partie de notre job de contrôler, de monitorer tout ça.

Benjamin [00:42:41] Donc on essaie de calculer une métrique de qualité du contenu, en regardant, en gros, à quel point ce contenu est skippé par rapport au fait qu’il soit écouté entièrement. Ça va nous donner une indication. On va regarder ce qui passe dans le Flow et on va se dire : “tiens, cette chanson, elle a été skippée dans 99% des cas donc il y a quelque chose de très bizarre”. Ça permet de détecter du contenu automatiquement comme ça. Alors, ça peut vouloir dire qu’on a recommandé cette chanson aux mauvaises personnes, mais quand ça atteint un certain niveau, c’est que vraiment… Alors, parfois, c’est simplement une chanson qui a été mal encodée — il y a un gros glitch audio au moment donné ou elle ne dure que dix secondes — ou alors c’est, encore une fois, un homonyme ou une chanson bizarre.

Vincent [00:43:25] Oui, finalement, il ne faut pas oublier que, derrière tous ces algorithmes — tu l’as cité tout à l’heure, Benjamin — il y a une grosse équipe de curation qui vient vérifier la qualité des données qu’on a, la qualité des morceaux…

Benjamin [00:43:35] Ça nous aide beaucoup parce que ça permet d’être vraiment sûr que ça a été whitelisté, que ça a été autorisé, que ça a été sélectionné par quelqu’un qui l’a mis dans une playlist avec un thème particulier. On sait que ça a été écouté en interne. Donc c’est vrai que c’est quelque chose qu’on peut prendre aveuglément pour la reco, alors que si l’on s’intéresse aux dizaines voire centaines de milliers d’albums qu’on reçoit chaque semaine et chaque mois, c’est très dur de séparer le grain de l’ivraie.

Vincent [00:44:01] Écoutez, merci beaucoup ! C’était, encore une fois, un podcast super intéressant et plein d’insights. Merci beaucoup.

Benjamin [00:44:07] Merci.

Aurélien [00:44:08] Merci à vous.

Marin [00:44:08] Merci à vous !

Vincent [00:44:08] Je vous propose qu’on passe à la deuxième partie de ce podcast, qui est : les coups de cœur. Est-ce qu’il y a des morceaux que vous avez envie de recommander aux gens qui nous écoutent ?

Loïc [00:44:26] Peut-être des pépites du fin fond du catalogue ?

Aurélien [00:44:30] Je pense qu’on pourrait faire une émission rien que sur ça !

Vincent [00:44:34] Aussi !

Loïc [00:44:34] Je note !

Vincent [00:44:35] Mais là, on ne peut pas faire des émissions de plusieurs heures !

Benjamin [00:44:40] Alors, je suis en train de regarder mon top du mois pour voir s’il y a des choses que j’aurais beaucoup écouté. Oui ! Il y a un label que j’aime beaucoup, qui s’appelle Habibi Funk. C’est un label — je crois — qui est basé à Berlin, qui a été créé par une personne libanaise — je crois. Bon, je ne suis pas sûr de ces infos-là mais l’idée, c’est que ce sont des rééditions de vieux sons généralement du Maghreb, d’Afrique ou du Moyen-Orient des années 70–80, qui sont réédités en vinyle et qui sont aussi sur Deezer et sur les plateformes de streaming. Et il y a des choses vraiment cool, des catalogues un peu oubliés — qualité restaurée. Là, il y a un album de Hamid Al Shaeri que j’aime bien. Voilà pour mes obsessions du moment.

Aurélien [00:45:22] Moi, j’écoute pas mal un petit artiste qui s’appelle Achile. Et comme je suis du style monomaniaque, c’est…

Loïc [00:45:29] Il n’y a que lui.

Aurélien [00:45:30] Il n’y a que lui…

Vincent [00:45:30] Un Flow avec que du Achile !

Aurélien [00:45:30] …et des podcasts.

Loïc [00:45:34] C’est un Flow-album chez toi.

Aurélien [00:45:35] Ouais, ouais… Non mais voilà, on fait chacun partie d’un cluster et je pense que je fais partie du cluster “je consomme un artiste à fond et puis après je passe à un autre”.

Vincent [00:45:49] Et Marin ?

Marin [00:45:51] Moi, je n’ai pas du tout un profil album- ou artist-centric. J’écoute plutôt les chansons en fonction de l’histoire que je me raconte autour de la chanson. Ça peut être lié à l’artiste, ça peut être lié au moment où j’ai découvert la chanson, ça peut être lié à plein de trucs. Et la dernière que j’ai bien aimée et que j’ai découverte grâce à Flow, c’est une chanson qui s’appelle “Nightlife Blues” de North Downs. C’est un groupe anglais — on va dire — de rock électronique moderne. Et l’EP date de 2020.

Loïc [00:46:21] Nice !

Vincent [00:46:25] Eh bien, merci beaucoup, encore.

Loïc [00:46:25] Merci beaucoup à vous tous.

Aurélien [00:46:25] Merci !

Benjamin [00:46:27] Merci.

Marin [00:46:28] Merci à vous.

Vincent [00:46:29] Et à la prochaine !

Aurélien [00:46:31] Avec plaisir !

Loïc [00:46:32] Clap de fin.

Benjamin [00:46:32] “It’s a wrap!”

Marin [00:46:33] On n’a pas eu le temps, du coup, de balancer les jeux de mots sur Flow Moods. Mais il y en avait pas mal.

Vincent [00:46:46] Oh, tu peux les garder… Enfin, tu peux y aller, on enregistre !

Marin [00:46:48] C’est enregistré ? Bon alors, pour la postérité : “à la pêche aux moods”.

Loïc [00:46:52] À la pêche aux moods, aux moods, aux moods, aux moods… Bon, on mettra ça dans le bêtisier alors !

Références

Présentation de la fonctionnalité Flow
Historique des différentes version de Deezer depuis sa création sur UX Timeline
Présentation de la fonctionnalité SongCatcher
Conférence RecSys
Travaux et papiers de l’équipe Research
Coups de coeur des invités :
- Hamid Al Shaeri
- Achile
- Nightlife Blues de North Downs

À propos du podcast

Deez is la tech propose d’aborder des sujets relatifs aux mondes du streaming musical et de la “tech” au sens large (incluant développement, produit, design, qualité, data, recherche, etc.), et d’explorer les coulisses de certaines des fonctionnalités phares de Deezer. Le tout à l’occasion de discussions entre collègues et pairs, en toute décontraction, mêlant partage d’expériences, bonnes pratiques et réflexions sur les évolutions possibles du secteur.

Un nouvel épisode est publié chaque premier mercredi du mois sur de nombreuses plateformes d’écoute et un transcript est mis à disposition en parallèle sur notre blog deezer.io.

Deez is la tech — Épisode 3— Flow — Anatomie d’une feature

Résumé de l’épisode

Transcript

Références

À propos du podcast

Written by Pauline Munier