Kupujemy dane od wielu komercyjnych dostawców danych, w tym między innymi od Xperi (dawniej All Music Guide), Songkick i LyricFind. Licencjonowane dane są na ogół dość kompleksowe, choć ich zakres jest często ograniczony.
Niektórzy dostawcy, tacy jak MusicBrainz i Discogs, polegają na datkach od swoich użytkowników. Kluczową zaletą modelu crowdsourcingu jest to, że zapewnia on dostęp do danych, które nie są dostępne ze źródeł komercyjnych; może nie być dobrego powodu ekonomicznego do gromadzenia lub tworzenia pewnych danych, więc entuzjaści muszą to zrobić, a często wykonują świetną robotę.
Użytkownicy Roon dzielą się swoją wiedzą po prostu słuchając ulubionej muzyki. Ponieważ są bardzo opiniotwórczymi słuchaczami, każdego dnia zagłębiają się w swoje ulubione gatunki i style, a te połączenia stanowią podstawę modeli i map Valence.
Valence ma tajną broń, jeśli chodzi o czyste dane: wiedzę społeczności Roon. Złożona z profesjonalistów muzycznych, audiofilów i samozwańczych maniaków muzyki, ta pełna pasji grupa zapewniła nasze lokalizacje, katalog radia internetowego, a teraz zaczyna tworzyć i selekcjonować nowe dane wykorzystywane przez Valence.
Dane pozyskiwane przez Valence pochodzą od właścicieli praw (wytwórni płytowych), komercyjnych dostawców danych, projektów non-profit i społeczności Roon. Fragment danych w Valence może pochodzić z dowolnego z tych źródeł, rozwijając się i stając się bardziej szczegółowym, gdy dowody potwierdzające jego dokładność znajdują się w dodatkowych źródłach danych. To unikalne podejście do agregacji oznacza, że po codziennym kompletnym pobraniu danych, indeks Valence jest prawdopodobnie największy i najdokładniejszy na świecie.
Valence wykorzystuje podejście, które uwzględnia nazwy plików, strukturę katalogów, dane znaczników i długość plików, aby zapewnić wysoką pewność identyfikacji albumów i utworów w Roon.
Większość odtwarzaczy muzycznych wchodzi w interakcję z serwisami streamingowymi za pomocą interfejsu API do wyszukiwania, przeglądania i odtwarzania; zależą one również od tych interfejsów API dla większości lub wszystkich metadanych muzycznych. Valence codziennie pobiera pełne katalogi zintegrowanych usług muzycznych, a następnie określa (z wyprzedzeniem), które z własnych danych powinny być stosowane do każdego strumienia z każdej zintegrowanej usługi.
Konwencjonalnie "metadane" oznaczają nazwę albumu i zawarte w nim utwory. Valence idzie dalej, przechwytując napisy na poziomie albumu i ścieżki, daty nagrań, daty wydania i wznowienia, wytwórnię, ocenę i recenzję, a także rozróżniając różne wersje albumu.
Oprócz danych dotyczących nagrań, Valence gromadzi informacje o wykonawcach, kompozytorach, producentach i dyrygentach, w tym ich życiorysy, biografie, a także miejsca zamieszkania, zespoły, do których dołączyli, linki społecznościowe i nadchodzące daty koncertów.
W modelu danych Valence nagrania (ścieżki) są instancjami kompozycji, co jest ważnym pojęciem, szczególnie gdy jeden artysta coveruje utwór innego artysty lub (co często ma miejsce nie tylko w muzyce klasycznej i jazzowej, ale także w rocku i popie) kompozytor i wykonawca nie są tą samą osobą.
Valence tworzy wewnętrzne "wykresy" popularności na wszystkich poziomach: artysty, albumu, utworu i kompozycji. Generuje również kilka bardziej szczegółowych wykresów dla każdego gatunku, a także serię poświęconą muzyce klasycznej.
To, co ludzie robią w muzyce, informuje Valence'a o modelu świata muzyki. Na przykład Trent Reznor ma różne relacje z muzyką, którą tworzy, gdy jest liderem Nine Inch Nails, współpracuje przy ścieżce dźwiękowej do filmu z Atticusem Rossem lub produkuje album dla Halsey.
Sonata składająca się z trzech części nie gwarantuje, że na albumie z tą kompozycją znajdą się trzy odpowiadające jej utwory. Zrozumienie podstawowych utworów i ich podziałów pozwala Valence na dokładne przedstawienie coverów piosenek pop, standardów jazzowych American Songbook i wieloczęściowych utworów klasycznych.
Model podobieństwa Valence odwzorowuje podobieństwo określonych wykonawców, albumów i utworów do innych wykonawców, albumów i utworów. Opiera się on zarówno na zachowaniu użytkowników (ludzie, którzy lubią X, lubią również Y), jak i na opinii ekspertów lub podstawowej prawdzie.
Na przestrzeni kariery artysty lub kompozytora często pojawiają się wzorce, które wskazują zakresy szczególnie dobrze ocenianego materiału. Valence modeluje te zakresy, aby stworzyć pojęcie "rozkwitu" - czasów, które są szczególnie znaczące w karierze danej osoby.
Muzycy często ewoluują w trakcie swojej kariery. Valence przypisuje punkty za "genialność" i "kompozycyjność" (wśród wielu innych wektorów), aby pomóc zrozumieć, czy Taylor Swift jest artystką pop czy country, lub czy Bob Dylan powinien być postrzegany jako wykonawca czy autor piosenek.
W ramach połączeń opartych na metadanych Valence wykorzystuje swoje modele do udoskonalania i tworzenia bardziej zniuansowanego i znaczącego zestawu możliwych rekomendacji.
Kontekst, w którym dokonywana jest rekomendacja, może radykalnie wpłynąć na jej dokładność. Świetna lista albumów R&B byłaby zupełnie inna w kontekście przeglądania Arethy Franklin niż Franka Oceana; lista wybitnych pianistów w kontekście Chopina nie ma nic wspólnego z tymi w kontekście post-bop jazzu.
Valence generuje prywatny model, przechowywany w profilu każdego użytkownika, który dokumentuje aspekty gustu użytkownika w oparciu o jego bibliotekę i historię słuchania. Rekomendacje są ważone z uwzględnieniem tego profilu gustu.
Informacje faktograficzne stanowią podstawę rekomendacji; na przykład wiedza o współpracy dwóch muzyków jest najlepszym dowodem na ich powiązanie. Informacje redakcyjne (takie jak kategoryzacje gatunków i oceny albumów) zapewniają kolejny wymiar, na którym można ważyć sugestie.
Niezależnie od technicznego podejścia do podstawowej nauki o danych, wiedza o domenie muzycznej jest podstawą Valence. To, co ją wyróżnia, to subtelności, takie jak różnice między latami 60. a współczesnym R&B, lub fakt, że Taylor Swift zaczynała od country, a ostatecznie rządziła listami przebojów pop, lub że prawdopodobnie nie chcesz słuchać kwartetów smyczkowych Beethovena pomiędzy częściami jego symfonii.
Jednym z najbardziej uderzających przykładów Valence w Roon są elementy interfejsu użytkownika, które pojawiają się w odpowiedzi na kontekst. Na przykład, jeśli patrzysz na artystę, który często współpracował, możesz zobaczyć "polecanych współpracowników" lub jeśli artysta jest częścią sceny, możesz zobaczyć "innych artystów z Glasgow". Roon zawiera setki elementów interfejsu użytkownika, które są renderowane tylko w kontekstach z odpowiednimi danymi pomocniczymi.
Ponieważ zawartość lokalna i strumieniowa są identyfikowane w ten sam sposób, obie są wzbogacane o metadane i przeplatane w Roon. Eliminuje to silosy treści i umożliwia prawdziwe przeglądanie oparte na intencjach - skupiamy się na tym, co chcemy usłyszeć, a nie na tym, gdzie to coś się znajduje.
Nowe wydania są wyświetlane w Roon w różnych kontekstach, a w każdym z nich wyniki są zupełnie inne. Nowe wydawnictwa na ekranie głównym są filtrowane przy użyciu profilu gustu, ale te na ekranie wykonawcy dodatkowo uwzględniają gatunek i aktywne lata artysty, aby zapewnić większą trafność.
Każdego dnia Valence tworzy sześć unikalnych 25-ścieżkowych miksów dla każdego użytkownika Roon. Każdy miks jest tematycznie związany z artystą, który zajmuje ważne miejsce w historii słuchania użytkownika i łączy w sobie utwory, które prawdopodobnie są znane z niektórymi, które będą wyzwaniem dla gustu słuchacza.
Jak każdy duży system, łańcuch dostaw streamingu muzyki zachęca do nadużyć. Wiele wytwórni "złych aktorów" wydaje nieautentyczne nagrania, starając się zachęcić użytkowników do słuchania ich strumieni. Valence pozwala Roonowi odfiltrować te niskiej jakości treści i wyświetlać tylko oryginalne wydania.
W Roon, Focus udostępnia możliwości Valence bezpośrednio użytkownikowi i umożliwia wielowymiarowe filtrowanie dyskografii artystów i całych bibliotek użytkowników.
Tradycyjnie przeszukiwanie zestawu plików lokalnych to jedno, a przeszukiwanie zdalnego zestawu danych przez API to drugie. Roon robi jedno i drugie z ujednoliconym interfejsem użytkownika, wykorzystując zagregowaną bazę danych Valance i wyszukiwanie kontekstowe, poprawiając zarówno dokładność, jak i trafność.