Deez is la tech — Épisode 7 — La recherche — Anatomie d’une feature

Published in

Deezer I/O

36 min readJun 7, 2023

Dans ce septième et dernier épisode de la saison 1 de Deez is la tech, nos équipes ouvrent de nouveau le capot afin d’explorer certains des rouages de l’application Deezer.

Après Flow, c’est à la fonctionnalité de recherche que se sont intéressés nos deux animateurs, Loïc et Vincent, pour la deuxième session de notre série “anatomie d’une feature”.

Note: This post accompanies the release of the seventh episode of “Deez is la tech”, a podcast created by Deezer’s Product & Tech teams — in French only for now. You can still find English content on deezer.io though. Go check it out!

Résumé de l’épisode

La barre de recherche est le principal point d’accès aux 90 millions de morceaux disponibles sur Deezer, ce qui fait d’elle une fonctionnalité cruciale pour les utilisateurs qui découvrent l’application et souhaitent y jouer une musique.

Mais comment fonctionne la recherche sur Deezer, au juste ? Quels sont les mécanismes sous-jacents qui permettent aux utilisateurs de trouver le contenu qu’ils cherchent rapidement ? Comment s’assure-t-on que le moteur de recherche est performant ? Quelles sont les pistes d’améliorations futures ?

Dans cet épisode, Marion Baranes (Research Scientist — @Marion_Baranes), Liam Byrne (Product Manager) et Mathieu Delcluze (Senior Machine Learning Engineer) font un tour d’horizon des sous-fonctionnalités de la “search” qui offrent la possibilité aux utilisateurs de trouver tous types de contenus (de la musique mais aussi des podcasts ou encore des profils utilisateurs), alors même qu’ils ne connaissent pas leur orthographe précise, ou n’ont qu’un bout des paroles ou de la mélodie d’une chanson à leur disposition, par exemple. Nos trois invités évoquent, entre autres, les processus techniques mis en place pour proposer les résultats les plus pertinents en un temps record (de l’ordre de quelques millisecondes !), ainsi que l’influence potentielle de l’intelligence artificielle sur l’avenir des moteurs de recherche.

Ce podcast est une nouvelle fois animé par Loïc Doubinine (@ztec6) et Vincent Lepot (@neozibok).

Transcript

[00:00:07.080] — Loïc : Bonjour et bienvenue dans Deez is la tech, le podcast qui ne pète ni les plombs ni les crons ! Moi, c’est Loïc, Numérobis du code, éleveur d’éléphants, de serpents, de gnous, de baleines et de gaufres à poches…

[00:00:22.800] — Vincent : Moi, c’est Vincent, développeur à micro qui s’occupe de pingouins, de baleines et qui aide à tenir la barre d’un paquebot au nom grec !

[00:00:33.810] — Loïc : Dans les épisodes précédents de Deez is la tech, on se demandait comment Deezer passait tous les jours à la FNAC pour récupérer les nouveaux CD et les mettre à disposition pour du streaming. On vous a également expliqué comment, grâce à Flow, Deezer vous épargne la peine de parcourir les 90 millions de chansons de son catalogue et vous sert la musique que vous avez envie d’écouter sur un plateau. Mais aujourd’hui, vous savez ce que vous voulez ! C’est vous qui prenez les décisions et vous voulez écouter quelque chose de très spécifique. Mais…Mais…Mais vous ne vous souvenez plus du titre exact ? Quelle tuile ! Vous ne pourrez pas briller auprès de vos amis en leur faisant écouter la pépite que vous avez dénichée. Mais attendez, que vois-je ? Est-ce un oiseau ? Un avion ? Non, c’est bien Deezer avec sa fonctionnalité de recherche hors du commun. Tapez n’importe quoi dans la barre de recherche, on corrige votre requête. Vous ne vous souvenez que d’un bout des paroles, on vous trouve le titre. Même si vous ne savez pas écrire correctement “eminam”, “amiem”, “emiam”… Bref, on retrouvera Eminem pour vous, peu importe comment vous l’écrivez. Vous l’avez compris, dans ce nouvel épisode de notre série “Anatomie d’une feature”, on va parler de la fonctionnalité de recherche ou “search” pour les intimes. Avec nous pour en parler, Marion Baranes.

[00:01:38.960] — Marion : Bonjour, Marion Baranes. Je suis chez Deezer depuis sept ans. J’ai travaillé à la Search pendant quatre ans et maintenant je suis à la Recherche. J’expérimente sur tout ce qui est extraction d’information, analyse automatique de la langue et moteur de recherche, en gros.

[00:01:57.140] — Loïc : Et avec nous aussi, Liam Byrne.

[00:01:59.370] — Liam : Oui, je suis Liam. Je suis chef de produit en charge de la search et des blind tests et je travaille chez Deezer depuis 2017.

[00:02:07.470] — Loïc : Et enfin, Mathieu Delcluze.

[00:02:09.650] — Mathieu : Oui, Mathieu. Je suis arrivé chez Deezer en octobre 2021 pour bosser sur la search en tant que Machine Learning Engineer, c’est-à-dire mettre en place des modèles qui font que le moteur de recherche marche bien et surveiller aussi toute l’influence sur le moteur de recherche.

[00:02:31.210] — Loïc : Déjà, première question : qu’est-ce que la search ?

[00:02:33.170] — Mathieu : La search, c’est le principal point d’accès au catalogue de chez Deezer. Comme tu l’as dit dans ton introduction, que tu aies une idée vague, précise, ou quand tu ne sais pas forcément comment écrire quelque chose, tu vas utiliser le moteur de recherche pour trouver ce que tu veux, c’est-à-dire les données catalogue — donc 90 millions de titres, des albums, mais aussi une librairie de podcasts — donc podcasts, épisodes, et enfin de la donnée utilisateur — que ce soit des playlists que les utilisateurs ou l’équipe éditoriale de Deezer vont créer ou même des profils utilisateurs directement.

[00:03:01.970] — Vincent : Est-ce que c’est une feature qui est très utilisée sur le site ?

[00:03:06.360] — Liam : Oui, on a 2,5 millions d’utilisateurs tous les jours. On en a à peu près un million qui utilisent la search pour lancer une session de musique.

[00:03:18.560] — Vincent : Donc c’est vraiment un vecteur très important pour venir sur Deezer et lancer de la musique une première fois ?

[00:03:24.910] — Mathieu : Oui, on estime que la première chose que les utilisateurs qui vont télécharger l’application vont faire, entre autres, c’est de chercher quelque chose dans le catalogue. Ça peut vraiment être une cause de frustration s’ils ne trouvent pas un titre à cause de la search. Ils vont se dire : “le catalogue de Deezer est peut-être moins gros que ceux des concurrents”. Alors que ce n’est pas forcément vrai, c’est peut-être juste le moteur de recherche. Donc finalement, dans le choix d’une application ou même d’un abonnement, c’est vraiment crucial. En termes de volume de streams, on estime que la search correspond à environ 30–40% de ce volume, en tant que point d’accès de stream.

[00:03:55.840] — Liam : Dans la search, juste en dessous de la barre de recherche, il y a SongCatcher. C’est un autre moyen de rechercher de la musique et de découvrir de nouvelles chansons. Et Deezer est le seul service de streaming qui propose ce genre de features dans l’application même.

[00:04:11.010] — Vincent : Est-ce qu’on peut juste expliquer très rapidement ce qu’est SongCatcher, pour ceux qui ne connaîtraient pas ?

[00:04:15.150] — Liam : SongCatcher, c’est une autre façon de trouver la musique. C’est pour la musique qui joue autour de toi. Tu peux lancer SongCatcher et ça va reconnaître la chanson qui joue.

[00:04:26.660] — Vincent : D’accord, ça va la détecter et tu pourras ensuite directement la jouer sur Deezer, voire la mettre en favoris.

[00:04:32.690] — Liam : Exactement. Dès que tu trouves la chanson, tu peux l’ajouter aux favoris, tu peux jouer la chanson, tu peux continuer la fête et l’écouter le lendemain. Dans SongCatcher, il y a aussi la possibilité de chanter et de reconnaître une chanson que tu chantes.

[00:04:49.520] — Loïc : Donc, sans même l’avoir dans la musique ambiante, je vais juste être capable de la “hummer” un peu…

[00:04:54.740] — Liam : Exactement. Il y a un bouton dans SongCatcher : tu peux lancer la feature, chanter et SongCatcher va reconnaître la chanson que tu chantes. Si tu chantes bien. Si tu chantes moins bien, c’est plus difficile pour SongCatcher de trouver la chanson !

[00:05:09.330] — Loïc : Ok, donc pour les chanteurs en herbe ! Ça ne marchera pas pour moi, je crois…

[00:05:13.920] — Vincent : Est-ce qu’il y a d’autres features un peu “fancy” de la recherche que vous voudriez partager ?

[00:05:21.430] — Marion : Je peux en partager, une partie en tout cas. Comme l’a dit Mathieu, la search, c’est trouver ce que vous êtes en train de chercher. Mais c’est aussi réussir à donner des résultats personnalisés en fonction de tes goûts, c’est réussir à corriger les fautes que tu auras faites dans ta requête… Et je pense qu’il y a aussi d’autres features du style savoir gérer plusieurs alphabets, savoir gérer des variantes en fonction de la langue que tu parles habituellement. Et je pense qu’il y a plein d’autres features que je suis en train d’oublier !

[00:05:51.210] — Mathieu : Oui mais tu as fait un bon descriptif. Il y a des features un peu plus récentes qui sont arrivées, notamment la “search by lyrics” : ça arrive que l’on ne connaisse pas le titre d’une chanson, mais seulement un refrain ou une punchline. La search by lyrics qu’on a mise en production cette année permet, en tapant quelques mots, de trouver les chansons grâce aux lyrics.

[00:06:09.140] — Vincent : Et tout ça derrière la même barre de recherche, un peu à la Google.

[00:06:12.460] — Mathieu : Exactement. C’est aussi la complexité du moteur de recherche, c’est qu’on doit accéder à différents types de contenus — que j’ai cités plus tôt — via un seul point d’entrée : cette barre de recherche qu’on trouve sur l’application et sur le site web.

[00:06:32.690] — Loïc : Mathieu, tu en as parlé rapidement tout à l’heure, il y a de la musique dans la recherche donc on va pouvoir retrouver des noms d’albums, des noms d’artistes, des noms de chansons. Il y a aussi des podcasts. Il y a d’autres contenus. Comment fait-on pour, à partir d’une recherche, proposer le contenu le plus intéressant ou le plus adapté ? Par exemple, si l’on cherche un nom d’artiste, que le nom d’artiste qui correspond soit la première chose qui nous soit retournée. Comment fait-on pour détecter ce genre de précisions ? Je ne sais pas comment poser la question…

[00:07:02.110] — Mathieu : Oui, je vois ce que tu veux dire. En fait, dans le moteur de recherche, on pourrait dire qu’il y a deux briques. Il y a la première partie qui est, une fois qu’on a le texte que l’utilisateur a tapé, d’essayer de retourner le plus de documents — donc dans notre cas, ça va être, comme tu dis, de la musique, des épisodes, des playlists — qui matchent une partie ou tout le texte entier. Et ensuite, il y a une stratégie de “comment on va ranker ces différentes choses pour avoir le classement le plus pertinent pour l’utilisateur”. On va avoir deux scores qui sont liés à ces deux parties. Le premier score, ça va être un score de “à quel point le texte que j’ai tapé dans la barre de recherche est proche de celui de l’artiste ou de la playlist”. Mais comme tu l’as dit, si je tape “Rihanna”, j’ai envie d’avoir la vraie Rihanna et pas un homonyme de Rihanna qui a quatre fans en Angleterre. Donc on va avoir un deuxième score de popularité dans le pays, qui va donner un poids — évidemment — aux artistes les plus populaires. Ce sont les deux scores avec lesquels on fonctionne aujourd’hui. Et cette année — et je pense aussi pour l’année prochaine, on a une ambition — comme le font la plupart des moteurs de recherche, d’ajouter une couche de personnalisation en fonction de tes goûts, en fonction de tes streams récents, de tes likes, pour ordonner une page en fonction de ce que tu aimes, tes genres préférés, tes artistes préférés.

[00:08:13.560] — Loïc : Donc je pourrai trouver la Rihanna obscure qui a deux fans en Angleterre en premier de ma liste parce que je l’écoute souvent.

[00:08:19.280] — Mathieu : Exactement. Le but et l’obligation aussi du moteur de recherche, c’est de permettre de trouver toutes les “Rihanna” possibles. On ne peut pas se permettre de présenter une seule “Rihanna” et d’oublier les autres. Donc on va quand même présenter toutes les “Rihanna”, mais évidemment, le classement sera fait, aujourd’hui, en fonction de la popularité.

[00:08:34.680] — Vincent : Donc là, on a vu la feature de search du point de vue de l’utilisateur, on va dire. J’aimerais bien qu’on ouvre un peu le capot. Sans forcément trahir les secrets industriels de Deezer — qui sont évidemment des trésors bien gardés, est-ce que vous pourriez nous en dire un peu plus sur la manière dont c’est fait derrière, “behind the scenes” ?

[00:08:52.950] — Marion : Concrètement, faire un moteur de recherche suppose de pouvoir stocker tout le contenu qu’on possède chez Deezer quelque part. On a une équipe Catalogue qui nous fournit énormément de données. Nous, on ne va pas rechercher dans toutes ces données. On va réorganiser ces données de manière plus intelligente, plus maligne. Ça va être la partie de pré-traitement des données, qu’on va stocker ensuite dans des moteurs, dans des databases qui sont très intelligentes — de type Elasticsearch. Ces données, une fois stockées dans Elasticsearch, peuvent être “requêtables”. Ça, c’est pour la partie stockage des informations. Ensuite, il y a une seconde partie que Mathieu a déjà évoquée avant, qui est : lorsqu’un utilisateur fait une requête, comment est-ce que sa requête est prise en compte ? Là, comme il l’a expliqué, on prend la requête, on fait une requête dans Elasticsearch, qui va nous redonner une série de résultats. Ces résultats vont être réordonnés en fonction de plusieurs critères : comme il l’a expliqué, la popularité, une mini phase de personnalisation mais très faible — c’est pour ça, d’ailleurs, qu’il y a un but de retravailler dessus. Et une fois que ces résultats sont réordonnés — donc “re-rankés”, on les restitue à l’utilisateur, en gros.

[00:10:05.530] — Vincent : Et le tout en quelques millisecondes.

[00:10:07.470] — Marion : Et le tout en quelques millisecondes !

[00:10:09.440] — Mathieu : Exactement. Et la milliseconde, c’est une chose très importante. Je n’ai pas de métaphore exacte mais c’est l’une des métriques que l’on suit précisément, et même dans l’industrie du moteur de recherche — sans citer celui qu’on utilise tous les jours, c’est vraiment quelque chose d’important, que l’on mesure tous les jours. On a un catalogue assez gros — comme nos concurrents d’ailleurs — et ça implique des contraintes sur le pré-traitement, comme l’a dit Marion, et sur la requête que l’on envoie sur Elasticsearch. Même dans nos développements et dans nos recherches, on ne peut pas faire n’importe quoi. Parce que le but numéro 1 de la recherche, c’est de donner à l’utilisateur des résultats rapidement.

[00:10:41.530] — Loïc : Donc on préférerait, dans la balance, perdre en précision et en efficacité pour pouvoir répondre quelque chose de suffisamment pertinent, on va dire, mais rapidement.

[00:10:52.990] — Mathieu : Exactement. Et c’est une balance qui n’est pas simple à trouver parce qu’on a beaucoup de types de recherche différents, parce qu’on a beaucoup d’utilisateurs. Mais il faut trouver une gestion entre les deux. Pour vous donner un exemple, je crois qu’en 2010, il y a une étude qui a montré que Google avait baissé son taux de réponse de 500 millisecondes — ça paraît rien — et que ça a fait baisser leur trafic de 20% d’un coup. C’est ce genre de problématique que l’on prend en compte aussi — donc qui a, comme tu dis, une balance précision / rapidité.

[00:11:16.990] — Loïc : Aurais-tu des exemples de fonctionnalités de recherche ou d’algorithmes que vous auriez mis de côté à cause du temps de traitement trop long ou de leurs performances trop mauvaises ?

[00:11:27.870] — Mathieu : Oui, j’ai un exemple et je pense que Marion pourra développer aussi. On écrit très bien sur notre smartphone et sur nos ordinateurs mais il arrive, soit parce qu’on est en train de courir ou qu’on est en soirée ou qu’on ne se souvient plus exactement du titre d’une chanson, que l’on fasse des fautes d’orthographe. Ça nous arrive. Mais on doit quand même, nous, en tant que personnes travaillant sur la search, proposer un résultat qui peut être proche de ce que veut l’utilisateur. Ça demande des algorithmes un peu plus robustes, qui demandent plus de ressources. Et ces algorithmes ne peuvent pas être mis en production n’importe comment. C’est un vrai travail. Ça paraît tout bête de proposer des résultats alors qu’on fait des fautes d’orthographe mais c’est un vrai domaine de recherche qui demande beaucoup de travaux. Et ce sont notamment des travaux sur lesquels Marion a travaillé quand elle bossait sur la search.

[00:12:12.410] — Marion : Yes, tout à fait. C’est un très bon exemple parce que justement, la majorité des systèmes de correction orthographique, de manière générale dans la littérature, traitent les fautes d’orthographe à la volée. Ce qui veut dire, en gros, qu’on attend que la personne ait créé une faute d’orthographe pour pouvoir la corriger. Dans un moteur de recherche — par exemple à Deezer, on ne peut pas du tout se permettre d’attendre que quelqu’un ait fait une faute d’orthographe pour commencer à pré-calculer toutes les corrections possibles qu’il pourrait y avoir pour cette faute d’orthographe. Si l’on reçoit un mot, on ne peut pas se permettre, à ce moment-là, de commencer plein de calculs pour générer toutes les corrections possibles. En fait, on essaye de prédire les fautes que vont faire les gens, donc toutes les fautes que l’on corrige sont des fautes que l’on a prédites avant, avec plein de stratégies différentes. C’est un système de pré-traitement hyper important et on ne pourrait pas se permettre de le faire après que la personne ait rédigé sa requête.

[00:13:03.840] — Loïc : Donc c’est le même principe que pour le ranking : c’est la popularité des erreurs qui fait qu’elles seront mieux prises en compte dans l’algorithme ?

[00:13:11.430] — Marion : Oui et non. Je n’aime pas les réponses faciles ! Concrètement, oui, dans le sens où plus il y a des gens qui vont faire cette erreur, plus on va repérer qu’il y a un problème avec une requête. Quand tu fais une requête, on va logger à peu près toutes les actions qui sont faites par l’utilisateur. On va voir que la personne a commencé par écrire “eminam” — puisque tu as utilisé la faute “eminam” tout à l’heure. Puis, on va voir qu’il s’est recorrigé en “eminem”. On va voir qu’il y a plein de gens qui font exactement cette même opération à un moment et se dire : “oui, quand même, c’est bizarre, peut-être qu’il y a une faute”. Donc il y a, en effet, tout un système qui va chercher à apprendre les fautes que font les utilisateurs. Mais il y a aussi un autre système qui, lui, va essayer de prédire les fautes qui n’ont pas encore été faites et qui sont souvent des fautes très fréquentes. Par exemple, des fautes de proximité clavier : si je prends un clavier azerti, tu mets un “z” au lieu d’un “a”. C’est un truc hyper fréquent. Ou alors tu mets “au” au lieu de “o”. Ça a le même son, c’est complètement logique dans la tête de l’utilisateur. C’est le genre de fautes que les gens font régulièrement. Et même si personne n’a fait cette faute, il est très probable qu’elle arrive à un moment. Donc on va essayer de trouver une balance entre les fautes qui sont très fréquemment faites et les fautes qui ne sont pas encore faites, mais qui ont de fortes chances d’arriver.

[00:14:24.020] — Loïc : Du coup, ça re-boucle un peu sur les questions d’accessibilité qu’on avait à un moment donné, par rapport à l’orthographe. Si vous jouez sur les sons, vu qu’on a — notamment en français — plein de façons d’écrire les mêmes sons, ça doit faciliter l’accès à la musique, à un artiste bien donné, sans avoir jamais vu comment ça s’écrivait réellement.

[00:14:43.580] — Marion : Oui. C’est le problème avec des artistes du genre Pierpoljak où leur orthographe n’est pas du tout celle attendue. Lorsque tu l’entends, tu as imaginé les trois prénoms alors que pas du tout. Le problème aussi, c’est qu’en correction orthographique, tu pourrais générer une infinité de mots. Mais on ne peut pas stocker une infinité de mots. Donc il faut aussi faire un choix entre ce que l’on veut stocker et pas stocker.

[00:15:07.560] — Vincent : J’allais dire que ça doit faire une masse de données énorme pour pouvoir gérer tous les cas possibles. Je ne sais pas si l’on peut donner ce genre d’informations, mais du coup, l’index de la search chez nous fait à peu près quelle taille ? Pour, en gros, les 90 millions de titres de musique ?

[00:15:22.580] — Mathieu : D’un point de vue cluster Elasticsearch, on a 30 nœuds en production qui stockent les différents index. Quand on parle d’index, on va dire qu’un index est une catégorie d’items qu’on stocke. Donc on a un index catalogue pour les tracks, les albums, les artistes. On a des index pour les playlists, on a des index pour les utilisateurs. On a aussi une obligation de répliquer ces index — si on a un nœud qui saute ou un index qui ne va pas bien, d’avoir des copies. Et enfin, on a des index qui sont plus “cruciaux” que d’autres dans le sens où les gens vont principalement chercher du catalogue par exemple, mais moins des utilisateurs. Donc on va avoir des contraintes différentes en fonction du type de données. Évidemment, l’index le plus important pour nous, c’est l’index catalogue.

[00:16:06.220] — Vincent : Toujours dans les histoires de correction orthographique, je me posais une question en vous écoutant. Quand on est sur notre smartphone, on va taper un truc et, j’imagine que vous êtes comme moi, vous avez des smartphones qui se croient plus intelligents que nous et qui remplacent les mots à la volée quand ils se rendent compte qu’il y a une erreur, même quand il n’y en a pas. Est-ce que ce sont des choses que vous prenez déjà en compte ?

[00:16:26.440] — Marion : À l’époque où je travaillais dans la search — puisque maintenant, ça fait trois ans que je ne le fais plus, je n’avais pas été jusque là. Déjà, parce que c’est très compliqué. Ce sont des mots qui vont peut-être se ressembler pour ton clavier, mais quand on les met côte à côte, ce ne sont pas du tout des mots qui se ressemblent. Donc c’est difficile parfois, lorsqu’il y a deux requêtes qui se succèdent, de déterminer si, oui ou non, elles viennent de la même intention de recherche. C’est une réflexion qui est très compliquée, qui a fait beaucoup écrire dans la littérature et qui a fait beaucoup réfléchir les chercheurs. Il n’y a pas de super solution, pour l’instant, pour déterminer exactement à quel moment un utilisateur commence une démarche de recherche et à quel moment il la finit. Il y a des indices quand les mots se ressemblent, que ce soit phonétique, graphique ou sémantique à la limite — et là, ça devient beaucoup plus compliqué. Si, par exemple… Je ne vais même pas essayer de chercher des exemples ! Mais si tu cherches le mot “abc” puis qu’après tu dis “ah non, c’était “aba””, s’il y a un artiste qui s’appelle “Abc” et un autre “Aba”, il n’y a rien qui me dit que tu ne voulais pas chercher les deux. C’est là que ça devient compliqué de travailler à la correction pour faire ça.

[00:17:41.020] — Vincent : Oui, surtout que les smartphones sont quand même les spécialistes pour remplacer des mots par des trucs qui n’ont rien à voir.

[00:17:44.780] — Marion : C’est pour ça que je n’ai pas cherché d’exemple !

[00:17:47.390] — Liam : Mais ne t’inquiète pas, j’ai un exemple tout simple : si un utilisateur tape “P!nk” sur son smartphone et que ça autocorrige “Pink”, on va quand même trouver l’artiste P!nk.

[00:18:01.940] — Vincent : D’accord. On est capable, au moins, de faire ce rapprochement-là. Effectivement, OK.

[00:18:07.770] — Liam : Oui, si le smartphone essaie d’être très intelligent…

[00:18:09.400] — Vincent : Après, s’il remplace “P!nk” par “assiette”, c’est sûr que c’est plus compliqué, j’imagine !

[00:18:13.320] — Loïc : Est-ce qu’il y a des corrections manuelles qui sont apportées ? Par exemple, dans le cas de P!nk, c’est peut-être fait grâce aux algorithmes. Mais est-ce qu’on a un moyen de corriger certaines choses qu’on connaît ou qu’on a vu ? On a vu des erreurs classiques : par exemple, les éditeurs nous disent qu’ils cherchent un artiste avec un nom bien particulier et que, contre toute attente, ça ne sort pas.

[00:18:36.260] — Marion : Oui, j’en ai déjà connu quelques-uns. Je pense que Mathieu potentiellement aussi.

[00:18:41.670] — Liam : Je pense qu’on lance le sujet des “keywords” parce qu’il faut avoir une connaissance du contenu en fait. Si quelqu’un cherche une playlist de running, il va dire “je cherche une playlist running”, tout simplement. Mais peut-être qu’on a une playlist très bien pour eux qui ne s’appelle pas “playlist running” mais “sport” par exemple. Pour ça, il faut avoir des keywords qui nous aident à diriger l’utilisateur vers le bon contenu.

[00:19:16.160] — Marion : Oui. Cette notion de “keywords” a été intégrée dans l’idée, justement, de pallier au problème “quelqu’un va chercher une chaîne de caractères et on va lui renvoyer une autre chaîne de caractères”. Ça marche très bien pour les playlists parce qu’en effet, souvent, quand tu crées une playlist, il y a plein de tags que tu voudrais ajouter à ta playlist. Mais à la base, ça avait été créé pour gérer des problèmes où les gens cherchaient des entités du catalogue en utilisant ni le titre de la chanson ni le nom de l’artiste. Le premier besoin qu’on a vraiment eu, c’était lorsque Niska a sorti la chanson “Réseaux”. Tout le monde cherchait Réseaux en écrivant “pouloulou”. Il n’y a pas forcément de lien logique quand tu ne connais pas la chanson. Mais quand tu connais la chanson, tu sais qu’en fait, il dit “pouloulou” dans la chanson. Et d’un coup, tout le monde s’est mis à chercher “pouloulou” dans le moteur de recherche. Donc on a été obligé de rajouter un keyword “pouloulou” pour cette chanson parce que, sinon, ça créait une grosse frustration.

[00:20:10.500] — Mathieu : Exact ! Pour rejoindre ce que disaient Marion et Liam, et même sur la discussion sur les fautes d’orthographe, on arrive à développer des modèles “robustes” basés soit sur la phonétique, soit sur la distance de clavier, qui prédisent des fautes. Mais il y a des choses qu’on ne peut pas vraiment prédire. D’ailleurs, en général, que ce soit dans la recommandation ou la search, il y a un pourcentage faible de cas qui requièrent une intervention manuelle. L’ajout de keywords permet justement de corriger ces problèmes-là. Le “pouloulou”, c’est un exemple. Ça arrive sur des artistes émergents ou même trending. Donc il faut toujours — je pense — s’assurer un pouvoir de faire le pompier, dans très peu de cas, mais qui sont des cas quand même importants.

[00:20:47.470] — Vincent : Par rapport à un moteur de recherche où l’on taperait du français pour nous — et les gens taperaient dans leur alphabet, je sais qu’à une époque, les ponctuations étaient un problème. Est-ce que pour des artistes dont les noms sont purement de la ponctuation — je pense à “!!!” (“Chk Chk Chk”) qui consiste en trois points d’exclamation par exemple, ça a été un challenge ou pas chez nous ?

[00:21:08.040] — Mathieu : Oui, je pense que ça l’a été du temps de Marion ! Et ça l’est toujours un peu aujourd’hui…

[00:21:11.820] — Marion : Ça a été mon premier projet chez Deezer, “!!!” (“Chk Chk Chk”). Littéralement, je suis arrivée et on m’a dit : “pour commencer, tu pourrais travailler là-dessus, et fais attention parce qu’il faut que l’on gère “!!!” mais il faut aussi que l’on gère “P!nk” donc on ne peut à la fois ni ignorer les points d’exclamation, ni les prendre complètement en compte. C’était vraiment mon tout premier projet. Je te laisse continuer !

[00:21:29.850] — Mathieu : Non, c’est vrai, tu as raison. On se dit qu’on a réglé un cas et qu’après on est tranquille, et on voit un album — l’album “+” d’Ed Sheeran ou des artistes qui vont mettre des espaces entre leurs titres de musique — et en fait, il y a toujours des nouveaux cas. Alors on crée des règles qui couvrent de plus en plus de cas. Donc ça arrive moins souvent, mais ça arrive ! Les emojis en font partie, par exemple.

[00:21:48.450] — Loïc : C’est ce que j’allais dire !

[00:21:50.170] — Mathieu : Donc ça arrive. Il y a un moment, oui, c’était la ponctuation. Et maintenant, on a d’autres problèmes. Mais oui, ça arrive tout le temps.

[00:21:57.920] — Loïc : Et est-ce qu’il y en a qui en abusent — de la ponctuation ou d’autres moyens — pour pouvoir faire du squatting ?

[00:22:04.540] — Liam : Oui, on peut citer les playlists qui utilisent des titres qui ne correspondent pas à leur contenu. Les créateurs essaient de rediriger les gens vers leurs contenus, leurs playlists. Par exemple, s’il y a un album de Rihanna qui sort et que les gens cherchent “Rihanna” la veille de la sortie, il peut y avoir une playlist qui porte le nom de l’album de Rihanna mais qui ne correspond pas au contenu de cet album qui sort le lendemain.

[00:22:36.580] — Loïc : Mais ça, ça pourrait ne pas être forcément volontaire. C’est-à-dire que je pourrais faire, par exemple, une playlist sur ce qui ressemble à tel album de Rihanna et qui, effectivement, ne contient pas de contenu de l’album.

[00:22:46.310] — Liam : Oui mais j’imagine que c’est décevant pour les utilisateurs qui cherchent l’album : ils vont retrouver les mêmes chansons que l’année d’avant. Et après, ils vont dire “Deezer, ils n’ont pas le nouvel album de Rihanna” parce qu’ils ne sont pas au courant du jour de la semaine où il va sortir.

[00:23:01.280] — Marion : Dans ce qu’a dit Liam, il y a un truc qui est vrai et que j’ai déjà constaté lorsqu’il y avait une grosse attente sur une sortie et où, justement, on devait surveiller que cette sortie était bien indexée et compagnie : il existe des artistes qui créent des albums qui portent exactement le nom de l’album d’une star. Cet album est censé sortir le lendemain et eux sortent leur album la veille, justement pour réussir à gagner toute la popularité. Souvent, ce sont des cas de fraude qui sont assez vite repérés parce que pas très discrets ! Mais concrètement, c’est un cas de fraude de tenter de profiter de la renommée des autres.

[00:23:42.020] — Liam : Y compris le jour-même, quand un album va sortir, c’est un challenge pour nous de dire “ça, c’est le contenu que l’utilisateur cherche”. Peut-être qu’il cherche Rihanna et qu’il n’est pas au courant du nom de l’album. Il va chercher “rihanna” et nous, on n’a pas beaucoup de data qui disent “il y a beaucoup de monde qui a écouté cet album” parce qu’il est 9h du matin le jour-même de la sortie.

[00:24:06.330] — Vincent : Oui donc forcément, la popularité dont on parlait tout à l’heure, le score de popularité n’est pas encore bon puisque le contenu est tout frais.

[00:24:13.610] — Mathieu : Oui, c’est un vrai défi qu’on appelle, dans la recherche, “cold start item”. C’est-à-dire qu’on établit des classements sur la popularité ou sur d’autres métriques — de clics, par exemple — mais si l’item est tout nouveau, qu’est-ce qu’on fait avec ça ? Est-ce que c’est un vrai album attendu de Rihanna ou est-ce que ça va être une réédition des Rolling Stones que personne n’a vraiment envie d’écouter ? Enfin, ça dépend ! Et donc, il faut prédire l’intérêt de cette sortie. Ce n’est pas forcément évident. Comme disait Liam, on n’a pas beaucoup de data là-dessus, donc c’est beaucoup d’inférences. Et sur des grosses sorties, on n’a pas envie de décevoir l’utilisateur.

[00:24:58.310] — Loïc : Depuis tout à l’heure, on parle de playlists, il s’agit principalement de playlists utilisateurs — on ne parle pas des playlists éditoriales, celles de Deezer en tant que telles. Qu’est-ce qui va faire le classement des playlists utilisateurs ? Qu’est-ce qui fait qu’une playlist sera mieux notée par la recherche ? Est-ce qu’on va comptabiliser le nombre de gens qui l’écoutent ou peut-être les keywords qui peuvent ressortir ? Enfin, qu’est-ce qui fait qu’une playlist sera plus populaire qu’une autre dans la recherche ?

[00:25:23.530] — Mathieu : Tu veux dire, en séparant les playlists éditoriales de…?

[00:25:26.950] — Loïc : Oui, juste en considérant les playlists utilisateurs. Parce que les playlists éditoriales, on est capables, nous, de les identifier — donc peut-être d’y appliquer un traitement particulier. Mais comme on peut rechercher les playlists de n’importe quel utilisateur de Deezer, comment les classe-t-on en tant que telles — mise à part leur pertinence dans les mots ?

[00:25:42.510] — Liam : Est-ce que tu cherches des conseils pour une de tes playlists, pour la monter dans les résultats ?

[00:25:49.820] — Vincent : On sait que Loïc est un fraudeur !

[00:25:49.820] — Loïc : Comment je fais pour que ma playlist soit le premier résultat pour toutes les recherches ?

[00:25:55.320] — Mathieu : Comme tu le disais, il y a les keywords. On parle toujours de cette logique de double classement : il y a le classement de pertinence entre la query et les keywords que tu vas mettre, et ensuite, il y a des playlists utilisateurs qui marchent très bien parce qu’elles sont de bonne qualité. En fait, on va prendre, tout simplement, les streams faits à partir de la playlist, qui vont nous donner un score de popularité pour la playlist. On ne fait pas une moyenne des artistes dans la playlist en disant “cette playlist est populaire”. Non, on va vraiment regarder d’où viennent les streams et se dire “OK, cette playlist, elle attire les gens” pour plusieurs raisons. Et du coup, ça va être le score de la playlist.

[00:26:27.700] — Loïc : D’accord. Donc le succès de la playlist a potentiellement un effet sur son classement à terme ?

[00:26:32.040] — Mathieu : Oui. Et ce qui est aussi compliqué avec la search — dans cette logique de classement qui est vraiment centrale au niveau du moteur de recherche, c’est que plus on va montrer un item en forte position, plus ça va attirer les gens et donc ils vont cliquer dessus. Plus ils vont cliquer dessus, plus ça va augmenter le score. C’est un peu le serpent qui se mord la queue ! On va parfois avoir des choses en top position alors qu’elles ne devraient pas être là. Mais parce qu’on l’a mis en top position, ça reste. C’est un peu la dérive des classements des moteurs de recherche en général.

[00:26:59.300] — Vincent : Ok. Du coup, je me posais une autre question : comment sait-on qu’un algorithme de recherche est performant ? Performant, pas au sens latence, mais au sens fonctionnel. Est-ce qu’on a des métriques pour savoir si un algorithme fonctionne mieux qu’un autre ? Et comment fait-on pour pouvoir évaluer les différents algorithmes ?

[00:27:19.030] — Mathieu : Oui, on a des métriques qui mesurent la qualité d’un moteur de recherche, au-delà de l’aspect technique. À Deezer, on a deux métriques principales, deux KPIs. Le premier, c’est ce qu’on appelle le “success rate”. Tout simplement, c’est : “j’effectue une recherche; combien de fois sur cette recherche-là, vais-je aboutir sur ce que je voulais et donc démarrer une session de stream ou ajouter un favori”, par exemple. C’est un pourcentage tout simple qu’on regarde tous les jours. La deuxième métrique, c’est une métrique d’effort. Un point crucial dans le moteur de recherche, c’est à quel point j’ai des difficultés à trouver ce que je voulais. Donc on va agréger plusieurs types de métriques, que ce soit, par exemple, le nombre de reformulations de ma query, le temps que j’ai passé à écrire ma query, mais aussi le classement de l’item sur lequel j’ai cliqué. Et on va faire une sorte de moyenne qui va nous donner ce qu’on appelle un “effort index”, qui va nous permettre de mesurer à quel point c’était compliqué, difficile de trouver cet item. Ce sont les deux métriques sur lesquelles on va jouer. Ensuite, cela va nous permettre de créer des nouvelles features ou d’en updater certaines, par exemple avec des logiques d’A/B tests. On va appliquer, sur un pourcentage de nos utilisateurs, une nouvelle feature ou un nouveau changement et on va regarder, sur ces deux métriques-là, s’il y a eu vraiment des changements, quelle version a le mieux marché et ensuite prendre une décision par rapport à ces observations.

[00:28:36.790] — Marion : Si je peux me permettre d’appuyer sur l’importance des deux métriques que vient de décrire Mathieu. C’est hyper important d’avoir ces deux métriques combinées parce que souvent, on a tendance à se dire : “si quelqu’un a cliqué, c’est qu’il est content et qu’il a trouvé ce qu’il recherche”. Et c’est hyper important, du coup, de prendre en compte la difficulté qu’il peut avoir à trouver un élément. D’autant plus dans un moteur de recherche où l’on n’a pas beaucoup d’informations sur : “quand il a cliqué sur quelque chose, est-ce qu’il a fini par trouver ce qu’il cherchait ?” Ce n’est pas parce que l’on clique qu’on a trouvé. La notion de définir ce qu’est un succès dans une action de recherche est très complexe et demande énormément de stratégies différentes. Il y a encore plein d’améliorations possibles mais elles sont hyper complexes à mettre en place aussi, parce que c’est difficile de savoir si, lorsqu’un utilisateur a cliqué sur quelque chose, il a vraiment trouvé ce qu’il cherchait.

[00:29:32.790] — Vincent : On est vraiment dans l’implicite, là, pour le coup. C’est jouer aux devinettes pour savoir si finalement, quand il a cliqué, c’était bien le bon truc ou si c’était une cover alors qu’il cherchait l’originale, ou ce genre de choses.

[00:29:44.470] — Liam : Oui, il y a deux actions positives : soit quelqu’un va ajouter aux favoris, soit quelqu’un va jouer le contenu. Mais après, s’il joue le contenu, peut-être que le contenu est un peu décevant — ce n’est pas le nouvel album de Rihanna, c’est l’album de l’année dernière. Du coup, il ne va pas l’écouter longtemps. Il va voir que ce n’est pas le bon contenu et va l’arrêter. Donc ce n’est pas tout à fait simple de dire : “j’ai cliqué là-dessus et j’ai trouvé ce que je voulais”.

[00:30:18.320] — Vincent : D’accord.

[00:30:19.540] — Loïc : Maintenant, on peut peut-être parler de l’avenir de la search. Qu’est-ce que vous envisagez comme changements majeurs ou même mineurs ? Quels sont les petits trucs qui vont améliorer la search demain ?

[00:30:31.320] — Mathieu : Comme tu le disais, il y a deux types de changement : il y a mineur et majeur.

[00:30:35.540] — Loïc : Merci !

[00:30:36.090] — Mathieu : J’aime bien répéter les questions, ça me rend intelligent.

[00:30:39.240] — Loïc : Ça laisse le temps de réfléchir. T’inquiète, il n’y a pas de problème, on connait tous la technique !

[00:30:41.790] — Mathieu : Non mais mineur, c’est un peu tout ce qu’on a dit depuis le début. C’est-à-dire qu’on ne peut pas se dire : “on a développé une feature, ça a marché et c’est bon, on ne s’en occupe plus, on va faire que des choses nouvelles”. Il y a le catalogue qui augmente toujours, il y a des nouveaux types d’albums, des nouveaux types de mots, des emojis, etc. Il faut toujours avoir un œil dessus et régler des bugs, se dire que ce n’est pas parfait et qu’il faut toujours travailler dessus. Ce n’est pas très sexy, mais c’est aussi important que de faire des choses nouvelles. En choses nouvelles plus longues, vous avez peut-être vu, ces jours précédents ou ces mois précédents, l’émergence de certains algorithmes génératifs qui permettent de “parler” avec une IA — c’est un grand mot ! Ça peut être une option pour envisager des nouveaux types de recherche. Vous avez peut-être vu que Bing, le moteur de recherche de Microsoft, a mis en place publiquement un nouveau type de recherche avec ChatGPT. Ce sont des choses que l’on regarde mais ce sont des choses sur lesquelles on a aussi un œil critique. Il ne faut pas aller trop vite. On a été éduqué par les moteurs de recherche depuis très jeune. La façon de chercher avec des keywords, c’est une façon de faire qui marche plutôt bien dans énormément de pourcents des cas. Mais dans la musique — comme disait Liam avec les playlists, par exemple — on ne veut pas forcément chercher avec le titre exact. Il y a des queries, on veut par exemple écouter un style de musique particulier ou une musique qui date des années 2000 avec de la guitare et une voix féminine. Et ça, on ne l’a ni dans le titre de la chanson, ni dans les paroles. Donc comment on interprète ces types de queries un peu différentes pour trouver un résultat pertinent — que ce soit une playlist, une chanson exacte… Ça, c’est une nouvelle stratégie que l’on essaye de mettre en place. En tout cas, on effectue de la recherche — Marion, par exemple, effectue de la recherche dessus. Et ensuite, l’idée est d’essayer de mettre ça en production.

[00:32:18.550] — Loïc : Donc en gros, utiliser toutes les métadonnées que l’on génère à partir du contenu — donc potentiellement à partir de l’analyse audio en tant que telle, pour dire “il y a de la guitare, il y a de la voix, il y a ceci” et potentiellement enrichir la recherche.

[00:32:30.900] — Mathieu : Oui par exemple, ou les émotions… Enfin, tout ce qu’on peut ajouter. Et comme tu dis, il y a une partie catalogue, c’est-à-dire ajouter des metadata en plus, pour pouvoir chercher d’une nouvelle façon.

[00:32:40.570] — Loïc : Et est-ce que l’on pourrait imaginer une recherche, par exemple, basée sur les covers ? Si je cherche un album avec un bébé tout nu dans une piscine, par exemple?

[00:32:48.200] — Mathieu : Oui, c’est possible, tout à fait ! Les algorithmes que je viens de citer — comme ChatGPT — sont des types d’algorithmes où, au lieu de chercher mot par mot, comme on le fait aujourd’hui dans les moteurs de recherche traditionnels — attention, “traditionnel” ne veut pas dire “dépassé”, c’est juste que c’est ce qui se fait — on peut aussi chercher d’une façon vectorielle. C’est un mot qui fait peur mais en gros, on va modéliser le texte avec des chiffres, on va le mettre dans l’espace et on va essayer de regarder autour de ce point qu’on a modélisé s’il y a des choses qui peuvent ressembler en termes sémantiques à ce morceau de texte. Ça peut être des images, par exemple. On peut peut-être trouver un album avec une vache dessus de Pink Floyd en tapant ce que je viens de dire. Mais pour l’instant, ce n’est pas encore chez Deezer. Peut-être qu’un jour, ça le sera !

[00:33:35.180] — Loïc : Ça promet !

[00:33:36.060] — Liam : Moi, je ne vais pas trop parler de ça parce que c’est assez… Nous, on a une idée, mais après, on ne veut pas lancer ça…

[00:33:42.160] — Loïc : On n’en dira pas trop !

[00:33:43.100] — Mathieu : Pour peut-être ajouter un dernier point là-dessus, ce sont des algorithmes qui procurent un “wow effect”. Et comme tu le dis, imagine que tu tapes “vache” et que tu as l’album de Pink Floyd, c’est super ! Mais le problème, c’est que ce sont des algorithmes qui ne sont pas très critiques envers eux-mêmes, c’est-à-dire qu’ils ne savent pas quand ils font des erreurs. Et on ne peut pas non plus se permettre de mettre ça en production. Parce que ce que l’on a oublié de dire depuis le début, c’est que le moteur de recherche, on peut taper n’importe quoi dedans. Et on peut aussi avoir n’importe quoi comme résultat. Donc il faut que l’on fasse gaffe aussi à ce genre de choses.

[00:34:11.950] — Loïc : Et du coup, dans le “n’importe quoi”, qu’est-ce que vous avez comme filtres aujourd’hui ? Je pense notamment à tout ce qui pourrait être grossièretés ou recherches illégales. Est-ce que l’on fait ce genre de choses ?

[00:34:22.090] — Mathieu : Non, pas vraiment. Enfin, Marion, je ne sais pas si tu as de l’expérience là-dessus ?

[00:34:24.950] — Marion : Oui et non. Alors, il y a plusieurs manières de répondre. Mais non, concrètement, on n’a pas de filtre. C’est-à-dire que si tu veux une super playlist pour ta soirée torride ce soir, tu peux trouver. Et tu sais quoi ? Ce sera très facile de trouver. Si, par contre, on te met un filtre enfant, ça va devenir plus compliqué de trouver parce qu’il y a des filtres qui existent. Par exemple, quand on a ouvert au MENA (i.e. Middle East / North Africa), on a dû ajouter des filtres parce que toutes les chansons ne pouvaient pas passer dans les pays arabophones, etc.

[00:34:56.590] — Loïc : On parle de la notion d’explicite, c’est ça ?

[00:34:58.280] — Marion : On parle de la notion d’explicite. Qu’est-ce que l’on veut mettre dans les oreilles de qui ? Il y a des albums qui sont sortis dans un pays mais qui ne sont pas accessibles légalement dans d’autres pays. Donc ceux-là, par exemple, ne sont pas accessibles. Il y a ce genre de filtre qui existe. Après, très sincèrement, tout ce qui est disponible dans ton pays, tu peux mettre tous les keywords que tu veux, tu le trouveras.

[00:35:19.920] — Liam : Mais après, c’est le choix de l’utilisateur aussi. Dans les paramètres, tu peux choisir de cacher le contenu explicite et on ne va pas te montrer le contenu explicite, par exemple. C’est aux utilisateurs eux-mêmes de dire : “je ne veux pas le contenu de Eminem, qui est un peu explicite”. On va le cacher dans la search.

[00:35:42.410] — Loïc : Et de ce que je sais, pour le contenu catégorisé enfant — “kid” comme tu disais, il y a deux logiques. Sur le contenu explicite, on va marquer certains contenus “explicit” mais, par défaut, il y a des choses qui, potentiellement, ne sont pas encore marquées “explicit”. Donc on va marquer a posteriori le contenu. Alors que pour les kids, ça va être l’inverse : quand ton profil est marqué “enfant”, il y a forcément un humain qui est passé pour dire “ça, c’est possible”. Et si personne n’est passé devant, il n’arrivera pas.

[00:36:11.120] — Liam : Oui, pour les kids, c’est fait en avance. On a un contenu différent pour les kids que pour les adultes. Mais pour les adultes, il y a un choix entre trois niveaux d’un paramètre qui cache le contenu explicite.

[00:36:25.650] — Loïc : Je crois que tu peux le cacher, cacher la cover ou ne pas le voir du tout — c’est-à-dire que tu ne verras même pas l’album dans la liste.

[00:36:32.350] — Liam : C’est exactement ça. Il y a trois niveaux et les kids sont séparés.

[00:36:35.880] — Loïc : Ok, c’était une question bonus !

[00:36:38.930] — Marion : Non mais tu peux chercher tout ce que tu veux.

[00:36:41.940] — Vincent : Écoutez, je pense qu’on va pouvoir rester sur cette dernière question.

[00:36:46.090] — Loïc : Oui, je pense.

[00:36:46.680] — Vincent : Je pense qu’on a fait un tour non-exhaustif, évidemment. Merci, en tout cas, pour tous vos insights. Et puis je vous propose de passer tout de suite à la deuxième partie de ce podcast : on va passer sur les coups de cœur des invités.

[00:37:05.660] — Loïc : Alors, vous cherchez quoi comme musique en ce moment ?

[00:37:08.890] — Marion : Moi, j’ai des goûts hyper éclectiques. J’écoute un petit peu de tout et je vais être du genre à écouter quatre styles de musique différents dans une même journée, donc je n’ai pas un focus sur un truc. Mais si je dois faire une recommandation — c’est ce que j’aime bien aller voir en concert en ce moment, c’est de la musique du type de ce que fait Moon Hooch. C’est un groupe de trois personnes, une percu et deux saxos. Et avec trois instruments, ils arrivent à mettre le feu dans une salle. C’est entre la techno, l’acoustique… C’est hyper cool ! Je recommande la chanson “Number 9”. Voilà !

[00:37:48.340] — Loïc : Nice, j’ai envie d’écouter.

[00:37:49.470] — Vincent : Elle va peut-être finir dans mes favoris avant la fin de l’émission, celle-là !

[00:37:53.630] — Liam : Et moi, j’ai un coup de cœur pour un groupe australien qui s’appelle Gang of Youths. Petite histoire : je suis allé voir un concert de Mumford & Sons au Zénith de Paris il y a quelques années et Gang of Youths faisait la première partie. J’ai tout de suite adoré leur musique et le chanteur est très charismatique, il danse beaucoup sur scène. C’est pas que la musique, c’est la performance ! Je vous conseille en particulier d’écouter et de regarder la vidéo du morceau “Let Me Down Easy”.

[00:38:26.730] — Vincent : Et Mathieu ?

[00:38:27.420] — Mathieu : Le problème, c’est que la search, je l’utilise principalement pour mon travail. Du coup, 95% de mes requêtes sont un peu… Ce n’est pas forcément ce que j’écoute, c’est juste pour tester si ça marche ! Mais j’ai écouté un morceau, il n’y a pas longtemps, d’un producteur de musique électronique anglais qui s’appelle Burial, qui fait souvent des chansons assez longues. J’aime bien les chansons assez longues, comme ça je n’ai pas à me casser la tête pour changer de chanson ! Et puis, quand je marche, ça me crée une ambiance. C’est un morceau qui s’appelle “Come Down to Us” et qui dure 16 minutes. Et je suis tranquille pendant 16 minutes !

[00:38:58.040] — Loïc : Nice.

[00:38:58.840] — Vincent : Cool, merci beaucoup !

[00:39:00.150] — Marion : Du coup, vous ne faites pas de recommandations musicales ?

[00:39:02.630] — Vincent : On n’en fait pas… Je ne sais pas ! Tu veux en faire une, toi, Loïc ?

[00:39:06.950] — Loïc : Récemment, j’ai découvert Sons of Kemet. C’est une pièce de jazz, c’est pas mal !

[00:39:11.570] — Mathieu : Oui, très cool !

[00:39:12.060] — Vincent : Moi, je ne sais pas… Si je dois en choisir une… En ce moment, je réécoute énormément un groupe de rock américain qui s’appelle The National et dont l’un des albums m’a fait tripper, qui s’appelle “I Am Easy to Find”. Je ne sais plus si c’est le dernier en date ou l’avant-dernier, mais tout l’album est juste à tomber.

[00:39:30.760] — Vincent : Encore merci pour toutes les infos sur la search. Je pense que c’était très riche en informations. Merci beaucoup ! Merci aussi à Liam qui a fait l’effort de parler en français pendant ce podcast.

[00:39:40.885] — Mathieu : Avec un bel accent !

[00:39:40.930] — Liam : Oui, ce n’est pas un secret : je suis pas Français, je suis Irlandais.

[00:39:46.330] — Vincent : Tu vois, franchement, ça s’est très bien passé.

[00:39:48.500] — Liam : Merci et avec plaisir !

[00:39:49.640] — Mathieu : Merci à vous, c’était super comme expérience.

[00:39:56.800] — Vincent : Et c’est ainsi que s’achève cette première saison de Deez is la tech. Nous espérons que vous avez pris autant de plaisir à l’écouter que nous en avons eu à faire ces sept épisodes. Si vous avez des retours, n’hésitez pas à nous en faire part sur les réseaux sociaux, par exemple sur Twitter (@DeezerDevs). Vous pouvez également retrouver tous les transcripts des épisodes ainsi que les références des coups de cœur de nos invités dans notre blog tech deezer.io. Merci à tous ceux qui se sont succédés au micro d’avoir pris le temps de partager leur expérience. Merci à Deezer de nous avoir permis de vous proposer ce podcast. Merci à Loïc qui, en plus de co-animer le podcast, gère la prise de son — et c’est parfois acrobatique ! Et surtout, un grand big up à celle sans qui ce podcast ne serait pas ce qu’il est : je parle bien sûr de notre réalisatrice, productrice, coordinatrice et déesse Shiva, Pauline Munier. À bientôt, on l’espère, pour une saison 2. D’ici là, et plus que jamais, ne pétez ni les plombs, ni les crons ! Bye !

Références

Artistes et contenus cités dans l’épisode : Eminem, Rihanna, Pierpoljak, P!nk, !!!, “Réseaux” de Niska, + d’Ed Sheeran, Rolling Stones
SongCatcher : identifiez une chanson instantanément
Search by lyrics : trouvez des chansons en recherchant leurs paroles
Moteur de recherche Google
Elasticsearch
ChatGPT
Microsoft Bing & ChatGPT
“Album avec un bébé tout nu dans une piscine” : Nevermind de Nirvana
“Album avec une vache dessus de Pink Floyd” : Atom Heart Mother de Pink Floyd
Coups de coeur des invités :
- “Number 9” de Moon Hooch
- “Let Me Down Easy” de Gang of Youths
- “Come Down to Us” de Burial
Coups de coeur des animateurs :
- Sons of Kemet
- I Am Easy to Find de The National

À propos du podcast

Deez is la tech propose d’aborder des sujets relatifs aux mondes du streaming musical et de la “tech” au sens large (incluant développement, produit, design, qualité, data, recherche, etc.), et d’explorer les coulisses de certaines des fonctionnalités phares de Deezer. Le tout à l’occasion de discussions entre collègues et pairs, en toute décontraction, mêlant partage d’expériences, bonnes pratiques et réflexions sur les évolutions possibles du secteur.

Un nouvel épisode est publié le premier mercredi de chaque mois (ou un mois sur deux, en fonction de notre bande passante !) sur de nombreuses plateformes d’écoute et un transcript est mis à disposition en parallèle sur notre blog deezer.io.

Deez is la tech — Épisode 7 — La recherche — Anatomie d’une feature

Résumé de l’épisode

Transcript

Références

À propos du podcast

Written by Pauline Munier