Nach fast einem Jahr geht es weiter – anders als gedacht. Zum einen wollte ich mir nicht 1 Jahr Zeit lassen, um zum Thema meiner Musik-Datenanalyse zu schreiben und zum anderen wollte ich gar nicht konkret über Datenanalyse schreiben. Jetzt mache ich es doch. Zum einen, weil ich Daten liebe und zum anderen, weil ich Musik liebe.
Die Ausgangssituation
Nachdem ich meinen last.fm Account mit meinem Spotify Account verknüpft haben, kann ich bequem über die last.fm API meine Daten ziehen. Anschließend liegen die Daten etwa in folgender Form vor:
artistName | trackName | datetime |
The Blue Stones | Let Me Out | 2023-02-28 15:23:37 |
Ocean Alley | Confidence | 2023-02-28 14:15:53 |
Johann Sebastian Bach | “Du wahrer Gott und Davids Sohn, BWV 23: Aller Augen warten, Herr (Chorus)” | 2023-02-27 13:58:20 |
The Offspring | Hit That | 2023-02-24 21:24:02 |
Wir wissen also wann, wir welchen Song gehört haben. Wie geht es jetzt weiter? Schauen wir doch einmal, wer unserer meist gehörteste Künstler ist.
Anfänge der Datenanalyse
Im Prinzip sind es nur wenige Zeilen Code:
- Einlesen der CSV-Datei in Python als Pandas Dataframe
- Ein
groupby(artistName)
ausführen - Durch die einzelnen Künstler iterieren und die Anzahl an abgespielten Songs einer Liste hinzufügen
- Hieraus ein neues Dataframe bauen
Das neu erstellte Dataframe hat folgende Form
artistName | count |
Baroness | 477 |
Red Hot Chili Peppers | 115 |
NOFX | 62 |
Matula | 40 |
Schon wissen wir, wer unsere Lieblingskünstler sind.
Dies kann man nun in den unterschiedlichen Varianten nutzen, indem wir die ursprüngliche CSV-Datei in bestimmte Zeitabschnitte unterteilen, können wir uns unseren Lieblingskünstler in einem konkreten Zeitraumen bestimmen. Selbiges gilt natürlich für den Lieblingssong.
Einen Schritt weiter in der Datenanalyse
Nachdem ich weiß, wer meine Lieblingskünstler in den letzten Jahren jeweils waren, möchte ich einen Schritt weiter gehen. Wann habe ich diese Künstler viel gehört? Dafür schaut man sich immer einen gewissen Zeitraum des Dataframes an, zählt, wie oft man Künstler x gehört hat und schreibt es in eine neue Tabelle. Eine geeignete Zeitspanne scheint mir hier 1 Monat zu sein. Das Ergebnis sieht man im Titelbild. Witzig ist, dass Johann Sebastian Bach jeden Dezember heraussticht. Wahrscheinlich, weil ich in der Weihnachtszeit immer das Weihnachtsoratorium höre.
Ein letzter Schritt für heute
Was ich sehr spannend finde, ist wie sich das Musik Hörverhalten über die Jahre verändert. Welche Bands landen in der Schublade des langsamen Vergessens, welche kramt man aus alten Schubladen hervor und welche Künstler kommen ganz neu dazu? Dafür bräuchte ich gewiss Daten über einen etwas längeren Zeitraum. Meine Aufzeichnungen enden leider bereits im Jahr 2019. Aber in den Daten der letzten Jahren sehe ich z.B. dass ich In Vain 280 mal gehört habe und in den Jahren 2019, 2020 und 2021 lediglich einmal. Ähnlich sieht es mit Becoming the archetype aus nur hier weiß ich, dass ich diese vor 10 Jahren sehr viel gehört habe, sie kommen also aus einer Schublade des fast Vergessens. Andere Bands habe ich sehr vernachlässigt, z.B.: Arctic Monkeys nur 3 mal gehört im Jahr 2022, Yawners auch nur 3 mal gehört GoGo Penguin gerade mal 2 Songs und die Liste geht immer weiter.
Ein Ausblick
Ich will auf jeden Fall noch weiter in der Spotify-Datenanalyse mit Python gehen. Es fehlen noch gescheite Graphen, geordneter Code und ein Blick in die Spotify Song-Klassifizierung steht auch noch auf meinem Plan. Ich hoffe der nächste Artikel lässt nicht so lange auf sich warten.
Vorgänger Artikel
Meine Daten gehören mir
Und wieder ist ein Spotify Jahr rum