Valence
Roon 通過使用數據、識別和機器學習為音樂提供豐富的背景並幫助聽眾更深入地參與其中,從而為音樂增加價值。 Valence 是使這成為可能的技術堆棧。
貢獻

從物理媒體到數字媒體的轉變為豐富音樂體驗帶來了巨大的希望,但到目前為止,這一承諾大多沒有實現。原因(我們認為)是成為音樂迷比聽音頻更重要。歌迷想了解音樂,了解製作音樂的人;他們想建立智力和情感上的聯繫,豐富自己的生活經歷。

黑膠唱片和 CD 等物理格式有包含大量信息的內襯註釋,但下載和流媒體已經將它們剝離了。我們的目標是從恢復所有這些數據開始,然後通過利用新技術進一步完成比物理媒體所能實現的更多。

Valence 允許我們分幾步完成。我們首先匯總各種數據源,包括商業元數據、眾包貢獻和專家聽眾的收聽歷史。接下來,我們識別系統遇到的每個數據對象,無論是硬盤上的文件、來自音樂服務的流,還是專輯文章中提到的製作人。使用這些構建塊,Valence 形成了一個數據庫,不僅包含藝術家、專輯和曲目,還包含作曲家、作品、表演、指揮、合奏、獨奏家、唱片公司和合作者。該數據庫使我們能夠了解音樂實體之間的關係、它們的受歡迎程度、相似性以及它們自然屬於的類別。其結果是一種推薦方法,它始終將權威元數據、專家意見、流行度、情境意識和個人用戶的品味概況考慮在內。

聚合

音樂元數據的來源很多。有些提供廣度(涵蓋大量版本),而另一些則提供深度(非常詳細或具體的數據),但沒有一個數據源擁有一切。許多專業來源只有一種數據類型(例如音樂會或歌詞)。

Valence 的基礎——它的音樂數據庫——是通過組合來自不同來源的多個數據集創建的。每天,都有數 TB 的信息被攝取、刪除重複和消除歧義;結果是錄音、表演者、作曲家和作品的詳盡綱要。

許可數據

我們從許多商業數據提供商處購買數據源,包括 Xperi(以前稱為 All Music Guide)、Songkick 和 LyricFind 等。許可數據通常相當全面,儘管其廣度通常有限。

眾包數據

MusicBrainz 和 Discogs 等一些提供商依賴其用戶貢獻的數據。眾包模式的主要優勢在於它提供了對商業來源無法獲得的數據的訪問;收集或創建某些數據可能沒有很好的經濟理由,所以這取決於愛好者去做,而且他們經常做得很出色。

收聽歷史

Roon 用戶僅通過聆聽自己喜歡的音樂來貢獻自己的知識。因為他們是非常有主見的聽眾,所以他們每天都在探索自己喜歡的流派和風格的深度,而這些聯繫構成了 Valence 模型和地圖的基礎。

社區貢獻

Valence 在清潔數據方面有一個秘密武器:Roon 社區的專業知識。這個充滿激情的團隊由音樂專業人士、發燒友和自稱音樂迷組成,他們提供了我們的本地化版本、互聯網廣播目錄,現在開始創建和管理 Valence 使用的新數據。

鑑別

因為 Valence 被設計成一張包含整個音樂庫的地圖,它必須能夠識別每個人可能會聽的每一個錄音。從任何給定來源(甚至唱片公司)獲得的音樂數據本質上也是不完美的,因此 Valence 假設它們都不是權威的。

數據識別

Valence 攝取的數據來自權利人(唱片公司)、商業數據提供商、非營利數據項目和 Roon 社區。 Valence 中的一條數據可以從這些來源中的任何一個產生,隨著在其他數據源中發現其準確性的確鑿證據而增長並變得更加詳細。這種獨特的聚合方法意味著在完成每日攝入後,Valence 的指數可以說是世界上最大和最準確的指數。

文件識別

Valence 使用一種考慮文件名、目錄結構、標籤數據和文件長度的方法來向 Roon 提供高可信度的專輯和曲目標識。

流識別

大多數音樂播放器使用用於搜索、瀏覽和播放的 API 與流媒體服務交互;他們的大部分或全部音樂元數據也依賴於這些 API。 Valence 實際上每天都會攝取集成音樂服務的完整目錄,然後(提前)確定自己的哪些數據應該應用於每個集成服務的每個流。

更豐富的模式

Valence 的聚合數據庫是聖杯:覆蓋範圍廣,數據深度豐富。

記錄數據

通常,“元數據”表示專輯的名稱及其包含的曲目。 Valence 通過捕獲專輯和曲目級別的學分、錄製日期、發行和重新發行日期、標籤、評級和評論,以及區分專輯的不同版本。

傳記資料

除了記錄數據外,Valence 還匯總了有關表演者、作曲家、製作人和指揮的信息,包括他們的重要統計數據、傳記,以及他們住過的地方、他們加入的樂隊或合唱團、社交鏈接和即將到來的音樂會日期。

成分數據

在 Valence 的數據模型中,錄音(曲目)是作品的實例,這是一個重要的概念,特別是當一位藝術家翻唱另一位藝術家的歌曲時,或者(不僅在古典和爵士樂中,而且在搖滾樂中也經常如此和流行音樂)作曲家和表演者不是同一個人。

建模與綜合

在元數據的基礎上,Valence 建立了音樂作品與創作者之間關係的模型。這些模型使從粉絲或專業聽眾的角度了解音樂世界成為可能。

顆粒度的人氣

Valence 生成各個級別的內部流行“圖表”:藝術家、專輯、曲目和作曲。它還為每個流派生成幾個更具體的圖表,以及一個專門針對古典音樂的系列。

角色與關係

人們在音樂中的所作所為為 Valence 的音樂世界模型提供了信息。例如,特倫特·雷茲諾 (Trent Reznor) 與他創作的音樂有不同的關係,當他面對九英寸釘子時,與阿提克斯·羅斯 (Atticus Ross) 合作製作電影配樂,或為哈爾西 (Halsey) 製作專輯時。

作曲錄音映射

一首具有三個樂章的奏鳴曲並不能保證在以該樂曲為特色的專輯中會有三首對應的曲目。了解基礎作品及其細分讓 Valence 能夠準確地描繪流行歌曲的翻唱、美國 Songbook 爵士樂標準和多部分古典作品。

相似模型

Valence 的相似度模型映射了某些藝術家、專輯和曲目與其他藝術家、專輯和曲目的相似程度。它基於用戶行為(喜歡 X 的人也喜歡 Y)和專家意見或基本事實。

藝人“全盛時期”

在藝術家或作曲家的職業生涯中,模式經常出現在特別受人尊敬的材料的啟發範圍內。 Valence 對這些範圍進行建模以創建“全盛時期”的概念——在該人的職業生涯中尤其值得注意的時期。

X度

音樂家經常在他們的職業生涯中不斷發展。 Valence 對“流派”和“作曲家”(以及許多其他向量)進行了評分,以幫助理解 Taylor Swift 是流行歌手還是鄉村歌手,或者 Bob Dylan 應該被視為表演者還是詞曲作者。

推薦

Valence 在提供音樂推薦時會考慮五個因素。一起使用,這些允許以音樂敏感的用戶為中心的建議,這些建議的準確性是不可思議的。

相關性和流行度模型

在元數據驅動連接的邊界內,Valence 使用其模型來改進和產生一組更細微和更有意義的可能建議。

情境意識

提出建議的背景會從根本上影響其準確性。在瀏覽 Aretha Franklin 和 Frank Ocean 的上下文中,R&B 專輯的精彩列表將完全不同;肖邦背景下的著名鋼琴家名單與後波普爵士樂背景下的鋼琴家沒有任何共同之處。

口味簡介

Valence 生成一個私人模型,存儲在每個用戶的個人資料中,該模型根據用戶的圖書館和收聽歷史記錄用戶品味的各個方面。考慮到這種口味特徵,對建議進行加權。

權威元數據

事實信息為推薦提供基礎;例如,知道兩位音樂家合作過就是他們之間聯繫的最好證據。編輯信息(如流派分類和專輯評級)提供了另一個衡量建議的維度。

專家意見

無論底層數據科學的技術方法如何,音樂領域的知識都是 Valence 的支柱。它與眾不同的是微妙之處,比如 60 年代和當代 R&B 之間的差異,或者泰勒斯威夫特從鄉村開始並最終統治流行排行榜的事實,或者你可能不想听到貝多芬的弦樂四重奏在他的交響樂樂章之間。

Roon 的效價
數據感知用戶界面

Roon 中 Valence 最顯著的例子之一是響應上下文出現的用戶界面元素。例如,如果您正在查看一位經常合作的藝術家,您可能會看到“特色合作者”,或者如果該藝術家是某個場景的一部分,您可能會看到“來自格拉斯哥的其他藝術家”。 Roon 包含數百個用戶界面元素,這些元素僅在具有相關支持數據的上下文中呈現。

交錯庫

因為本地和流媒體內容以相同的方式識別,所以兩者都豐富了元數據並在 Roon 中交錯。這消除了內容孤島,並允許真正的意圖驅動的瀏覽——重點是你想听的,而不是那些東西所在的地方。

新版本

新版本在 Roon 中顯示在各種上下文中,並且在每個上下文中結果完全不同。主屏幕上的新版本使用品味配置文件進行過濾,但藝術家屏幕上的新版本還包含流派和藝術家的活躍年份,以提高相關性。

每日合輯

每天,Valence 都會為每位 Roon 用戶製作六首獨特的 25 軌混音。每個混音都以一位在用戶收聽歷史中佔有突出地位的藝術家為主題,並結合了可能會挑戰聽眾品味的一些可能熟悉的選擇。

垃圾郵件過濾器

與任何大型系統一樣,音樂流媒體供應鏈會招致濫用。許多“壞演員”唱片公司發布不真實的錄音,以吸引用戶收聽他們的流媒體。 Valence 允許 Roon 過濾掉這些低質量的內容並只顯示正版。

重點

在 Roon 中,Focus 直接向用戶展示了 Valence 的功能,並實現了藝術家唱片目錄和整個用戶庫的多維過濾。

搜索

傳統上搜索一組本地文件是一回事,通過API搜索遠程數據集又是另一回事。 Roon 通過使用 Valance 的聚合數據庫和上下文感知搜索,通過統一的用戶界面來實現這兩項功能,從而提高準確性和相關性。