Musikinformationssökning

Automatisk genreklassificering utifrån akustiska egenskaper

Författare: Daniel Rönnow & Theodor Twetman

Sammanfattning

Syftet med den här studien var att hitta en kombination av maskininlärningsalgoritmer och musikaliska parametrar som automatiskt kan klassificera en stor mängd låtar med rätt genre med hög noggrannhet.

För att efterlikna en verklig musikalisk situation använde vi the Million Song Dataset eftersom den innehåller resultaten från musikaliska analyser av en stor mängd samtida låtar. På basis av tidigare studier och våra utvärderingar av de tillgängliga musikaliska parametrarna gjorde vi ett urval av fyra algoritmer och fyra kombinationer av parametrar. Samtliga kombinationer av parametrar utvärderades med var och en av algoritmerna.

Den bästa algoritmen resulterade i 49% respektive 51% noggrannhet när den användes tillsammans med de två bästa kombinationerna av parametrar. Jämfört med resultat från några av de tidigare studierna inom samma område är våra resultat inte enastående, men vi anser att våra resultat är mer relevanta i en verklig musikalisk situation på grund av vårt val av datamängd, parametrar och genrer. När vi utvärderade parametrarna upptäckte vi att de differentierade väldigt lite mellan genrerna.

Även om våra resultat visar att vår tillämpning inte är tillräckligt bra för att använda i ett riktigt program utesluter det inte möjligheten att skapa en applikation för automatisk genreklassificering av spår med hög noggrannhet. Det faktum att parametrarna inte skiljer sig åt mellan genrer indikerar dock att det kan vara en mycket omfattande uppgift att uppnå målet om hög noggrannhet.