Nous achetons des flux de données auprès d'un certain nombre de fournisseurs de données commerciales, dont Xperi (anciennement All Music Guide), Songkick et LyricFind, entre autres. Les données sous licence sont généralement assez complètes, bien que leur étendue soit souvent limitée.
Certains fournisseurs, tels que MusicBrainz et Discogs, s'appuient sur les contributions de leurs utilisateurs pour obtenir des données. Le principal avantage du modèle de crowdsourcing est qu'il permet d'accéder à des données qui ne sont pas disponibles auprès de sources commerciales ; il n'y a pas toujours de bonne raison économique de collecter ou de créer certaines données, c'est donc aux enthousiastes de le faire, et ils font souvent un travail remarquable.
Les utilisateurs de Roon apportent leurs connaissances en écoutant leur musique préférée. Parce qu'ils sont des auditeurs à l'opinion très tranchée, ils explorent chaque jour les profondeurs de leurs genres et styles préférés, et ces connexions constituent la base des modèles et des cartes de Valence.
Valence dispose d'une arme secrète lorsqu'il s'agit de données propres : l'expertise de la communauté Roon. Composé de professionnels de la musique, d'audiophiles et de passionnés de musique, ce groupe passionné a fourni nos localisations, notre répertoire de radios Internet et commence maintenant à créer et à conserver les nouvelles données utilisées par Valence.
Les données ingérées par Valence proviennent des détenteurs de droits (maisons de disques), de fournisseurs de données commerciales, de projets de données à but non lucratif et de la communauté Roon. Une donnée dans Valence peut provenir de n'importe laquelle de ces sources, s'enrichissant et devenant plus détaillée au fur et à mesure que des preuves corroborant son exactitude sont trouvées dans d'autres sources de données. Cette approche unique de l'agrégation signifie qu'après une ingestion quotidienne complète, l'index de Valence est sans doute le plus grand et le plus précis au monde.
Valence utilise une approche qui prend en compte les noms de fichiers, la structure des répertoires, les données des balises et la longueur des fichiers pour fournir à Roon des identifications d'albums et de pistes très fiables.
La plupart des lecteurs de musique interagissent avec les services de diffusion en continu en utilisant une API pour la recherche, la navigation et la lecture ; ils dépendent également de cette API pour la plupart ou la totalité de leurs métadonnées musicales. Valence ingère en fait chaque jour les catalogues complets des services musicaux intégrés, puis détermine (à l'avance) lesquelles de ses propres données doivent être appliquées à chaque flux provenant de chaque service intégré.
Par convention, le terme "métadonnées" désigne le nom d'un album et les pistes qu'il contient. Valence va plus loin en saisissant les crédits de l'album et des pistes, les dates d'enregistrement, les dates de sortie et de réédition, le label, l'évaluation et la critique, ainsi qu'en faisant la distinction entre les différentes versions d'un album.
Outre les données d'enregistrement, Valence rassemble des informations sur les interprètes, les compositeurs, les producteurs et les chefs d'orchestre, y compris leurs statistiques vitales, leurs biographies, ainsi que les lieux où ils ont vécu, les groupes ou les ensembles qu'ils ont rejoints, leurs liens sociaux et les dates de leurs prochains concerts.
Dans le modèle de données de Valence, les enregistrements (pistes) sont des instances de compositions, ce qui est une notion importante, en particulier lorsqu'un artiste reprend une chanson d'un autre artiste ou (comme c'est souvent le cas, non seulement dans les domaines du classique et du jazz, mais aussi du rock et de la pop) lorsque le compositeur et l'interprète ne sont pas la même personne.
Valence produit des "chartes" de popularité internes à tous les niveaux : artiste, album, morceau et composition. Il génère également plusieurs palmarès plus spécifiques par genre, ainsi qu'une série consacrée à la musique classique.
Ce que les gens font dans la musique informe le modèle de Valence sur le monde de la musique. Par exemple, Trent Reznor entretient des relations différentes avec la musique qu'il crée lorsqu'il est le leader de Nine Inch Nails, lorsqu'il collabore à une musique de film avec Atticus Ross ou lorsqu'il produit un album pour Halsey.
Une sonate comportant trois mouvements ne garantit pas qu'il y aura trois pistes correspondantes sur un album présentant cette composition. La compréhension des œuvres sous-jacentes et de leurs subdivisions permet à Valence de représenter correctement les reprises de chansons pop, les standards de jazz de l'American Songbook et les œuvres classiques à plusieurs voix.
Le modèle de similarité de Valence évalue les similitudes entre certains artistes, albums et morceaux et d'autres artistes, albums et morceaux. Il est basé à la fois sur le comportement des utilisateurs (les personnes qui aiment X aiment aussi Y) et sur l'opinion d'experts ou la vérité de terrain.
Au cours de la carrière d'un artiste ou d'un compositeur, des schémas apparaissent souvent, illustrant des plages d'œuvres particulièrement appréciées. Valence modélise ces plages pour créer une notion d'"apogée", c'est-à-dire des périodes particulièrement remarquables dans la carrière de cette personne.
Les musiciens évoluent souvent au cours de leur carrière. Valence attribue des scores pour la "genreness" et la "composerness" (parmi de nombreux autres vecteurs) pour aider à comprendre si Taylor Swift est une artiste pop ou country, ou si Bob Dylan doit être considéré comme un interprète ou un auteur-compositeur.
Dans les limites des connexions basées sur les métadonnées, Valence utilise ses modèles pour affiner et produire un ensemble plus nuancé et significatif de recommandations possibles.
Le contexte dans lequel une recommandation est faite peut avoir un impact radical sur son exactitude. Une excellente liste d'albums de R&B serait complètement différente dans le contexte d'Aretha Franklin et de Frank Ocean ; une liste de pianistes remarquables dans le contexte de Chopin n'a rien à voir avec ceux du contexte du jazz post-bop.
Valence génère un modèle privé, stocké dans le profil de chaque utilisateur, qui documente les facettes du goût de l'utilisateur en fonction de sa bibliothèque et de son historique d'écoute. Les recommandations sont pondérées en tenant compte de ce profil.
Les informations factuelles constituent la base des recommandations ; par exemple, le fait de savoir que deux musiciens ont collaboré est la meilleure preuve d'un lien entre eux. Les informations éditoriales (telles que les catégories de genre et les classements d'albums) constituent une autre dimension sur laquelle s'appuient les suggestions.
Indépendamment des approches techniques de la science des données sous-jacente, la connaissance du domaine de la musique est l'épine dorsale de Valence. Ce qui la distingue, ce sont des subtilités telles que les différences entre le R&B des années 60 et le R B contemporain, ou le fait que Taylor Swift a commencé par la country et a fini par dominer les hit-parades pop, ou que vous ne voulez probablement pas entendre les quatuors à cordes de Beethoven entre les mouvements de ses symphonies.
L'un des exemples les plus frappants de Valence dans Roon est celui des éléments de l'interface utilisateur qui apparaissent en fonction du contexte. Par exemple, si vous regardez un artiste qui a souvent collaboré, vous pouvez voir "featured collaborators" ou si l'artiste fait partie d'une scène, vous pouvez voir "other artists from Glasgow" (autres artistes de Glasgow). Roon contient des centaines d'éléments d'interface utilisateur qui ne sont affichés que dans des contextes accompagnés de données pertinentes.
Le contenu local et le contenu en continu étant identifiés de la même manière, ils sont tous deux enrichis de métadonnées et imbriqués dans Roon. Cela élimine les silos de contenu et permet une navigation véritablement axée sur l'intention - l'accent est mis sur ce que vous voulez écouter, et non sur l'endroit où cette chose se trouve.
Les nouveautés sont affichées dans différents contextes dans Roon, et dans chaque contexte, les résultats sont complètement différents. Les nouveautés affichées sur l'écran d'accueil sont filtrées à l'aide du profil de goût, mais celles affichées sur l'écran d'un artiste intègrent également le genre et les années d'activité de l'artiste pour une plus grande pertinence.
Chaque jour, Valence produit six mix uniques de 25 pistes pour chaque utilisateur de Roon. Chaque mix a pour thème un artiste qui figure en bonne place dans l'historique d'écoute de l'utilisateur, et combine des sélections susceptibles d'être familières avec d'autres qui remettront en question les goûts de l'auditeur.
Comme tout grand système, la chaîne d'approvisionnement de la musique en streaming est propice aux abus. De nombreux labels "mauvais joueurs" publient des enregistrements inauthentiques dans le but d'inciter les utilisateurs à écouter leurs flux. Valence permet à Roon de filtrer ce contenu de mauvaise qualité et d'afficher uniquement les enregistrements authentiques.
Dans Roon, Focus expose les capacités de Valence directement à l'utilisateur et permet un filtrage multidimensionnel des discographies d'artistes et des bibliothèques entières des utilisateurs.
Traditionnellement, la recherche d'un ensemble de fichiers locaux est une chose, et la recherche d'un ensemble de données distantes par API en est une autre. Roon fait les deux avec une interface utilisateur unifiée en utilisant la base de données agrégée de Valance et la recherche contextuelle, améliorant à la fois la précision et la pertinence.