Valence
Roon通过使用数据、识别和机器学习为音乐增加价值,为音乐提供丰富的背景,并帮助听众更深入地参与音乐。 Valence是使之成为可能的技术栈。
贡献

从物理媒体到数字媒体的过渡为使音乐体验更加丰富带来了巨大的希望,但到目前为止,这种希望大多没有实现。原因(我们认为)是,作为一个乐迷,除了听音频,还有更多的东西。乐迷们希望了解音乐,理解制作音乐的人;他们希望形成知识和情感上的联系,以丰富他们自己的生活体验。

黑胶和CD等物理格式的内页说明包含了大量的信息,但下载和流媒体已经剥夺了这些。我们的目标是首先恢复所有这些数据,然后进一步利用新技术来完成比物理媒体更多的工作。

Valence使我们能够通过几个步骤来实现这一目标。我们首先汇总各种数据源,包括商业元数据、众包贡献和专家听众的收听历史。接下来,我们识别系统遇到的每一个数据对象,无论是硬盘上的文件、音乐服务的流媒体,还是关于专辑的文章中提到的一个制作人。利用这些构件,Valence形成了一个数据库,不仅包括艺术家、专辑和曲目,还包括作曲家、作品、表演、指挥家、乐团、独奏家、标签和合作者。这个数据库使我们能够建立对音乐实体之间的关系、它们的流行度、相似度以及它们自然归属的类别的理解。其结果是一种推荐方法,它始终考虑到了权威元数据、专家意见、受欢迎程度、上下文意识和个人用户的品味概况。

聚合

有许多音乐元数据的来源。有些提供广度(覆盖大量的发行版本),而有些则有深度(丰富的细节或具体的数据),但没有一个数据源能提供所有的数据。众多专门的数据源只拥有单一的数据类型(例如音乐会或歌词)。

Valence的基础--它的音乐数据库--是由来自不同来源的多个数据集组合而成的。每天都有数千兆字节的信息被摄取、重复利用和消除歧义;其结果是一个详尽的唱片、表演者、作曲家和作品的汇编。

许可证数据

我们从一些商业数据供应商那里购买数据源,包括Xperi(前身为All Music Guide)、Songkick和LyricFind等。许可证数据通常相当全面,尽管其广度往往有限。

众包的数据

一些供应商如MusicBrainz和Discogs依靠用户的贡献来获取数据。众包模式的关键优势在于,它提供了从商业来源无法获得的数据;收集或创建某些数据可能没有很好的经济理由,所以要由爱好者来做,而他们经常做得很出色。

聆听历史

Roon用户仅仅通过聆听他们喜爱的音乐来贡献他们的知识。因为他们是非常有主见的听众,他们每天都在探索他们喜欢的流派和风格的深处,而这些联系构成了Valence模型和地图的基础。

社区贡献

当涉及到清洁数据时,Valence有一个秘密武器:Roon社区的专业知识。这个热情的团体由音乐专业人士、发烧友和自称是音乐书呆子的人组成,他们提供了我们的本地化、互联网广播目录,现在正开始创建和策划Valence使用的新数据。

鉴定

因为Valence被设计成有史以来整个音乐语料库的地图,它必须能够识别某人可能听过的每张唱片。从任何特定来源(甚至是唱片公司)获得的音乐数据本身也是不完美的,所以Valence假定它们都不是权威的。

数据识别

Valence摄取的数据来自权利人(唱片公司)、商业数据供应商、非营利性数据项目和Roon社区。Valence中的一块数据可以来自这些来源中的任何一个,随着在其他数据源中发现其准确性的佐证,它将不断增长并变得更加详细。这种独特的聚合方法意味着,在每天完整的摄取之后,Valence的索引可以说是世界上最大和最准确的。

文件识别

Valence使用一种考虑到文件名、目录结构、标签数据和文件长度的方法,向Roon提供高置信度的专辑和曲目识别。

溪流识别

大多数音乐播放器使用API与流媒体服务互动,进行搜索、浏览和播放;它们的大部分或全部音乐元数据也依赖于这些API。Valence实际上每天都在摄取集成音乐服务的全部目录,然后(提前)决定哪些自己的数据应该应用于每个集成服务的每一个流媒体。

一个更丰富的模式

Valence的聚合数据库是圣杯:巨大的覆盖广度与深度和丰富的数据。

记录数据

传统上,"元数据 "意味着一张专辑的名称和它包含的曲目。Valence更进一步,捕捉专辑和曲目级别的信用、录制日期、发行和再发行日期、标签、评级和评论,以及区分专辑的不同版本。

传记资料

除了录音数据,Valence还汇总了关于表演者、作曲家、制作人和指挥家的信息,包括他们的重要数据、传记,以及他们居住过的地方、他们加入过的乐队或乐团、社会链接和即将举行的音乐会日期。

组成数据

在Valence的数据模型中,录音(音轨)是作品的实例,这是一个重要的概念,特别是当一个艺术家翻唱另一个艺术家的歌曲,或者(不仅在古典和爵士乐中经常如此,在摇滚和流行乐中也是如此)作曲家和表演者不是同一个人时。

建模与合成

在元数据的基础上,Valence建立了音乐作品和创造它们的人之间的关系模型。这些模型使我们有可能从乐迷或专家听众的角度理解音乐世界。

颗粒状的普及

Valence在所有层面上产生内部人气 "图表":艺术家、专辑、曲目和作品。它还为每个流派生成几个更具体的图表,以及一个专门针对古典音乐的系列。

角色和关系

人们在音乐中的所作所为为瓦伦斯的音乐世界模型提供了参考。例如,当特伦特-雷兹诺(Trent Reznor)担任九寸钉(Nine Inch Nails)的主唱,与阿提克斯-罗斯(Atticus Ross)合作制作电影配乐,或为哈尔西(Halsey)制作专辑时,他与自己创作的音乐有不同的关系。

构成-记录的映射

一首奏鸣曲有三个乐章,并不能保证在一张以该作品为主题的专辑中会有三个相应的曲目。了解基本的作品和它们的细分,可以让瓦伦斯准确地描绘出翻唱流行歌曲、美国歌曲集爵士乐标准和多声部的古典作品。

相似性模型

Valence的相似度模型映射出某些艺术家、专辑和曲目与其他艺术家、专辑和曲目的相似程度。它是基于用户行为(喜欢X的人也喜欢Y)和专家意见或基本事实。

艺术家的 "全盛时期"

在一个艺术家或作曲家的职业生涯中,经常会出现一些模式,说明特别受人欢迎的材料的范围。Valence对这些范围进行建模,以创造一个 "全盛时期 "的概念--在这个人的职业生涯中特别值得注意的时间。

X-ness

音乐家往往在他们的职业生涯中不断发展。Valence为 "意识 "和 "作曲"(以及其他许多向量)打分,以帮助理解泰勒-斯威夫特是流行音乐还是乡村音乐艺术家,或者鲍勃-迪伦是否应该被视为表演者或作曲家。

建议

Valence在提供音乐推荐时考虑了五个因素。这些因素结合起来使用,可以提供对音乐敏感的以用户为中心的建议,其准确性令人难以置信。

相关性和受欢迎程度模型

在元数据驱动的连接的界限内,Valence使用其模型来完善和产生一套更细微和有意义的可能建议。

语境意识

做出推荐的背景会从根本上影响其准确性。一个伟大的R&B专辑清单在浏览艾瑞莎-富兰克林和弗兰克-奥西的背景下会完全不同;一个在肖邦背景下的著名钢琴家清单与在后波普爵士乐背景下的钢琴家没有共同之处。

味道简介

Valence生成了一个私人模型,存储在每个用户的个人资料中,该模型记录了用户基于其图书馆和收听历史的品味的各个方面。在考虑到这一品味的情况下,对推荐进行加权。

权威的元数据

事实信息为推荐提供了基础;例如,知道两个音乐家曾合作过是他们之间联系的最好证据。编辑信息(如流派分类和专辑评级)提供了另一个维度来衡量建议。

专家意见

不管基础数据科学的技术方法如何,音乐领域的知识是Valence的支柱。它的与众不同之处在于微妙之处,比如60年代和当代R&B之间的差异,或者泰勒-斯威夫特从乡村音乐开始,最后统治了流行音乐排行榜,或者你可能不想在贝多芬交响曲的乐章之间听到他的弦乐四重奏。

Valence在Roon中工作
有数据意识的用户界面

Roon中Valence最引人注目的例子之一是根据上下文出现的用户界面元素。例如,如果你在看一个经常合作的艺术家,你可能会看到 "特色合作者",或者如果该艺术家是一个场景的一部分,你可能会看到 "来自格拉斯哥的其他艺术家"。Roon包含数以百计的用户界面元素,它们只在有相关支持数据的背景下呈现。

交错式图书馆

因为本地和流媒体内容是以相同的方式识别的,两者都用元数据充实并在Roon中交错。这消除了内容孤岛,并允许真正的意图驱动的浏览--重点是你想听什么,而不是那东西住在哪里。

新品发布

在Roon中,新发布的音乐会在不同的背景下显示,而在每个背景下,结果是完全不同的。主屏幕上的新版本是用品味档案过滤的,但艺术家屏幕上的新版本还包括流派和艺术家的活跃年份,以提高相关性。

每日混合

每天,Valence为每个Roon用户制作6个独特的25轨混音。每个混音都是以用户的收听历史中具有突出特点的艺术家为主题,并结合可能熟悉的选择和一些将挑战听众的品味。

垃圾邮件过滤器

像任何大型系统一样,音乐流媒体供应链会招致滥用。许多 "坏演员 "唱片公司发布不真实的唱片,试图让用户听他们的流媒体。Valence允许Roon过滤掉这些低质量的内容,只显示真正的版本。

焦点

在Roon中,Focus将Valence的功能直接暴露给用户,并能对艺术家的唱片和整个用户库进行多维过滤。

搜索

传统上,搜索一组本地文件是一回事,而通过API搜索远程数据集是另一回事。Roon通过使用Valance的聚合数据库和上下文感知搜索,在一个统一的用户界面上完成这两件事,提高了准确性和相关性。