Dva studenta Univerziteta u San Francisku odlučila su da otkriju razlog zbog koga neke pjesme postaju hitovi, a neke druge ne, i pored toga što su naizgled dosta slične.
Prikupili su podatke sa striming servisa Spotify i potom ih "ubacili" u četiri različita modela mašinskog učenja, kako bi predvidjeli da li će neka pjesma postati hit ili ne, i to isključivo na osnovu audio zapisa.
Željeli su da saznaju da li postoje neki elementi koji su zajednički za sve ili bar većinu uspešnih pjesama. Fokusirali su se na elemente kao što su tempo, tonalitet, da li pjesma zvuči pozitivno ili negativno, da uz nju može da se igra, koliko je glasna i slično...
U obradi podataka, između ostalog, koristili su logističku regresiju, arhitekturu Random Forest i neuralne mreže.
Rezultate do kojih su četiri primjenjena modela došla, testirali su pomoću arhivskih podataka sa Bilbordove top liste Hot 100. Obrada podataka je trajala nekoliko nedjelja.
Jedan od modela (Support Vector Machine) mogao je da pogodi hitove sa preciznošću od 99,53 odsto. Ostali modeli bili su manje uspješni, ali i pored toga prilično precizni (iznad 85 odsto).
U svojim budućim istraživanjima, studenti će nastojati da u analizu uvrste i druge faktore, kao što su prisutnosti na društvenim medijima, nivo iskustva muzičara, kao i uticaj diskografske kuće.