Standort: fm4.ORF.at / Meldung: "Der Soundpark wird künstlich intelligenter"

30. 12. 2010 - 12:00

Der Soundpark wird künstlich intelligenter

Der Soundpark Navigator findet anhand der Klangfarbe ähnliche Songs - und erleichtert das Entdecken neuer Bands im Soundpark.

Der Soundpark ist immer am Wachsen. Die Masse an Bands und Musikern machte es aber zunehmend schwerer, möglichst schnell die dem jeweiligen Geschmack entsprechenden Songs zu finden. Eine mögliche Lösung gibt es nun im Soundpark zu bewundern. Der neue Audio-Player zeigt nämlich zu jedem abgespielten Song automatisch drei ähnlich klingende Musikstücke an.

Hinter diesen 'recommendations' steckt das Österreichische Forschungsinstitut für Artificial Intelligence, das sich seit Jahren mit automatisierter Musikerfassung beschäftigt. Durch genaue Frequenzanalyse gewinnen die Forscher ein statistisches Modell der 'Klangfarbe' einzelner Songs, die sie dann mit anderen vergleichen und in Beziehung setzen können. Wenn man also den 'Sound' einer Band schätzt, wird man automatisch zu ähnlich klingenden Musikern und Gruppen weiterverwiesen. Wie das genau funktioniert, wollten wir von Dr. Arthur Flexer (früher auch als DJ Homeboy 3 bekannt) wissen.

Nach welchen Parametern wird der Klang eines Songs erfasst?

Dr. Arthur Flexer

Dr. Arthur Flexer

Die zugrunde liegende Technologie ist die Frequenzanalyse von MP3- oder WAV-Dateien mit anschließender statistischer Modellierung der daraus gewonnen Daten. Jedes Musikinstrument und jede Stimme hinterlassen ein ganz bestimmtes Muster in der Frequenzdarstellung eines Musikstücks. Statistische Modelle fassen dieses Timbre (Klangfarbe) eines Musikstückes zusammen. Die Ähnlichkeit zwischen zwei Musikstücken wird aus der Ähnlichkeit ihrer statistischen Modelle berechnet. Wichtig ist, dass ausschließlich Audiosignale Eingang in die Berechnung finden. Das ist ein wesentlicher Unterschied zum sogenannten kollaborativen Filtern: dort wird das Musikkonsumverhalten eines Konsumenten mit dem vieler anderer Nutzer verglichen, um Vorhersagen über den Geschmack dieses Konsumenten zu treffen. Dabei wird im Gegensatz zu unserem Projekt der tatsächliche Audioinhalt der Musikstücke gar nicht berücksichtigt.

In welchem Verhältnis steht die technisch erfassbare Ähnlichkeit deiner Erfahrung nach mit menschlich-subjektivem Geschmack?

Wie oben beschrieben, geht in die Berechnungen nur der Aspekt der Klangfarbe ein. Andere Dimensionen der Musikähnlichkeit, wie Rhythmus, Tempo oder Melodie, werden nicht erfasst. Mit dieser Einschränkung funktioniert die Ähnlichkeitsberechnung recht gut. Es werden tatsächlich Musikstücke gefunden, die einen ähnlichen "Sound" haben.

In welche Richtungen wird in den nächsten Schritten weitergeforscht?

Der nächste große Schritt ist die Verbesserung von Musikempfehlungen durch adaptives Lernen individueller Musikvorlieben. Denn schließlich haben verschiedene Menschen oft sehr verschiedene Geschmäcker. Der persönliche Musikgeschmack soll über das Nutzungsverhalten der UserInnen im FM4 Soundpark erfasst werden. Der entscheidende innovative Schritt dabei, wird die Kombination von direkt aus den Audiodaten berechneten Daten der Musikähnlichkeit mit dem persönlichen Musikgeschmack sein.

Viel Spaß beim Navigieren!