我們從許多商業數據提供商處購買數據源,包括 Xperi(以前稱為 All Music Guide)、Songkick 和 LyricFind 等。許可數據通常相當全面,儘管其廣度通常有限。
MusicBrainz 和 Discogs 等一些提供商依賴其用戶貢獻的數據。眾包模式的主要優勢在於它提供了對商業來源無法獲得的數據的訪問;收集或創建某些數據可能沒有很好的經濟理由,所以這取決於愛好者去做,而且他們經常做得很出色。
Roon 用戶僅通過聆聽自己喜歡的音樂來貢獻自己的知識。因為他們是非常有主見的聽眾,所以他們每天都在探索自己喜歡的流派和風格的深度,而這些聯繫構成了 Valence 模型和地圖的基礎。
Valence 在清潔數據方面有一個秘密武器:Roon 社區的專業知識。這個充滿激情的團隊由音樂專業人士、發燒友和自稱音樂迷組成,他們提供了我們的本地化版本、互聯網廣播目錄,現在開始創建和管理 Valence 使用的新數據。
Valence 攝取的數據來自權利人(唱片公司)、商業數據提供商、非營利數據項目和 Roon 社區。 Valence 中的一條數據可以從這些來源中的任何一個產生,隨著在其他數據源中發現其準確性的確鑿證據而增長並變得更加詳細。這種獨特的聚合方法意味著在完成每日攝入後,Valence 的指數可以說是世界上最大和最準確的指數。
Valence 使用一種考慮文件名、目錄結構、標籤數據和文件長度的方法來向 Roon 提供高可信度的專輯和曲目標識。
大多數音樂播放器使用用於搜索、瀏覽和播放的 API 與流媒體服務交互;他們的大部分或全部音樂元數據也依賴於這些 API。 Valence 實際上每天都會攝取集成音樂服務的完整目錄,然後(提前)確定自己的哪些數據應該應用於每個集成服務的每個流。
通常,“元數據”表示專輯的名稱及其包含的曲目。 Valence 通過捕獲專輯和曲目級別的學分、錄製日期、發行和重新發行日期、標籤、評級和評論,以及區分專輯的不同版本。
除了記錄數據外,Valence 還匯總了有關表演者、作曲家、製作人和指揮的信息,包括他們的重要統計數據、傳記,以及他們住過的地方、他們加入的樂隊或合唱團、社交鏈接和即將到來的音樂會日期。
在 Valence 的數據模型中,錄音(曲目)是作品的實例,這是一個重要的概念,特別是當一位藝術家翻唱另一位藝術家的歌曲時,或者(不僅在古典和爵士樂中,而且在搖滾樂中也經常如此和流行音樂)作曲家和表演者不是同一個人。
Valence 生成各個級別的內部流行“圖表”:藝術家、專輯、曲目和作曲。它還為每個流派生成幾個更具體的圖表,以及一個專門針對古典音樂的系列。
人們在音樂中的所作所為為 Valence 的音樂世界模型提供了信息。例如,特倫特·雷茲諾 (Trent Reznor) 與他創作的音樂有不同的關係,當他面對九英寸釘子時,與阿提克斯·羅斯 (Atticus Ross) 合作製作電影配樂,或為哈爾西 (Halsey) 製作專輯時。
一首具有三個樂章的奏鳴曲並不能保證在以該樂曲為特色的專輯中會有三首對應的曲目。了解基礎作品及其細分讓 Valence 能夠準確地描繪流行歌曲的翻唱、美國 Songbook 爵士樂標準和多部分古典作品。
Valence 的相似度模型映射了某些藝術家、專輯和曲目與其他藝術家、專輯和曲目的相似程度。它基於用戶行為(喜歡 X 的人也喜歡 Y)和專家意見或基本事實。
在藝術家或作曲家的職業生涯中,模式經常出現在特別受人尊敬的材料的啟發範圍內。 Valence 對這些範圍進行建模以創建“全盛時期”的概念——在該人的職業生涯中尤其值得注意的時期。
音樂家經常在他們的職業生涯中不斷發展。 Valence 對“流派”和“作曲家”(以及許多其他向量)進行了評分,以幫助理解 Taylor Swift 是流行歌手還是鄉村歌手,或者 Bob Dylan 應該被視為表演者還是詞曲作者。
在元數據驅動連接的邊界內,Valence 使用其模型來改進和產生一組更細微和更有意義的可能建議。
提出建議的背景會從根本上影響其準確性。在瀏覽 Aretha Franklin 和 Frank Ocean 的上下文中,R&B 專輯的精彩列表將完全不同;肖邦背景下的著名鋼琴家名單與後波普爵士樂背景下的鋼琴家沒有任何共同之處。
Valence 生成一個私人模型,存儲在每個用戶的個人資料中,該模型根據用戶的圖書館和收聽歷史記錄用戶品味的各個方面。考慮到這種口味特徵,對建議進行加權。
事實信息為推薦提供基礎;例如,知道兩位音樂家合作過就是他們之間聯繫的最好證據。編輯信息(如流派分類和專輯評級)提供了另一個衡量建議的維度。
無論底層數據科學的技術方法如何,音樂領域的知識都是 Valence 的支柱。它與眾不同的是微妙之處,比如 60 年代和當代 R&B 之間的差異,或者泰勒斯威夫特從鄉村開始並最終統治流行排行榜的事實,或者你可能不想听到貝多芬的弦樂四重奏在他的交響樂樂章之間。
Roon 中 Valence 最顯著的例子之一是響應上下文出現的用戶界面元素。例如,如果您正在查看一位經常合作的藝術家,您可能會看到“特色合作者”,或者如果該藝術家是某個場景的一部分,您可能會看到“來自格拉斯哥的其他藝術家”。 Roon 包含數百個用戶界面元素,這些元素僅在具有相關支持數據的上下文中呈現。
因為本地和流媒體內容以相同的方式識別,所以兩者都豐富了元數據並在 Roon 中交錯。這消除了內容孤島,並允許真正的意圖驅動的瀏覽——重點是你想听的,而不是那些東西所在的地方。
新版本在 Roon 中顯示在各種上下文中,並且在每個上下文中結果完全不同。主屏幕上的新版本使用品味配置文件進行過濾,但藝術家屏幕上的新版本還包含流派和藝術家的活躍年份,以提高相關性。
每天,Valence 都會為每位 Roon 用戶製作六首獨特的 25 軌混音。每個混音都以一位在用戶收聽歷史中佔有突出地位的藝術家為主題,並結合了可能會挑戰聽眾品味的一些可能熟悉的選擇。
與任何大型系統一樣,音樂流媒體供應鏈會招致濫用。許多“壞演員”唱片公司發布不真實的錄音,以吸引用戶收聽他們的流媒體。 Valence 允許 Roon 過濾掉這些低質量的內容並只顯示正版。
在 Roon 中,Focus 直接向用戶展示了 Valence 的功能,並實現了藝術家唱片目錄和整個用戶庫的多維過濾。
傳統上搜索一組本地文件是一回事,通過API搜索遠程數據集又是另一回事。 Roon 通過使用 Valance 的聚合數據庫和上下文感知搜索,通過統一的用戶界面來實現這兩項功能,從而提高準確性和相關性。