Kategorien
Coden Musik

Die ersten Daten, Zahlen und Fakten

Nach fast einem Jahr geht es weiter – anders als gedacht. Zum einen wollte ich mir nicht 1 Jahr Zeit lassen, um zum Thema meiner Musik-Datenanalyse zu schreiben und zum anderen wollte ich gar nicht konkret über Datenanalyse schreiben. Jetzt mache ich es doch. Zum einen, weil ich Daten liebe und zum anderen, weil ich Musik liebe.

Die Ausgangssituation

Nachdem ich meinen last.fm Account mit meinem Spotify Account verknüpft haben, kann ich bequem über die last.fm API meine Daten ziehen. Anschließend liegen die Daten etwa in folgender Form vor:

artistNametrackNamedatetime
The Blue StonesLet Me Out2023-02-28 15:23:37
Ocean AlleyConfidence2023-02-28 14:15:53
Johann Sebastian Bach“Du wahrer Gott und Davids Sohn, BWV 23: Aller Augen warten, Herr (Chorus)”2023-02-27 13:58:20  
The OffspringHit That2023-02-24 21:24:02

Wir wissen also wann, wir welchen Song gehört haben. Wie geht es jetzt weiter? Schauen wir doch einmal, wer unserer meist gehörteste Künstler ist.

Anfänge der Datenanalyse

Im Prinzip sind es nur wenige Zeilen Code:

  1. Einlesen der CSV-Datei in Python als Pandas Dataframe
  2. Ein groupby(artistName) ausführen
  3. Durch die einzelnen Künstler iterieren und die Anzahl an abgespielten Songs einer Liste hinzufügen
  4. Hieraus ein neues Dataframe bauen

Das neu erstellte Dataframe hat folgende Form

artistNamecount
Baroness477
Red Hot Chili Peppers115
NOFX62
Matula40

Schon wissen wir, wer unsere Lieblingskünstler sind.

Dies kann man nun in den unterschiedlichen Varianten nutzen, indem wir die ursprüngliche CSV-Datei in bestimmte Zeitabschnitte unterteilen, können wir uns unseren Lieblingskünstler in einem konkreten Zeitraumen bestimmen. Selbiges gilt natürlich für den Lieblingssong.

Einen Schritt weiter in der Datenanalyse

Nachdem ich weiß, wer meine Lieblingskünstler in den letzten Jahren jeweils waren, möchte ich einen Schritt weiter gehen. Wann habe ich diese Künstler viel gehört? Dafür schaut man sich immer einen gewissen Zeitraum des Dataframes an, zählt, wie oft man Künstler x gehört hat und schreibt es in eine neue Tabelle. Eine geeignete Zeitspanne scheint mir hier 1 Monat zu sein. Das Ergebnis sieht man im Titelbild. Witzig ist, dass Johann Sebastian Bach jeden Dezember heraussticht. Wahrscheinlich, weil ich in der Weihnachtszeit immer das Weihnachtsoratorium höre.

Ein letzter Schritt für heute

Was ich sehr spannend finde, ist wie sich das Musik Hörverhalten über die Jahre verändert. Welche Bands landen in der Schublade des langsamen Vergessens, welche kramt man aus alten Schubladen hervor und welche Künstler kommen ganz neu dazu? Dafür bräuchte ich gewiss Daten über einen etwas längeren Zeitraum. Meine Aufzeichnungen enden leider bereits im Jahr 2019. Aber in den Daten der letzten Jahren sehe ich z.B. dass ich In Vain 280 mal gehört habe und in den Jahren 2019, 2020 und 2021 lediglich einmal. Ähnlich sieht es mit Becoming the archetype aus nur hier weiß ich, dass ich diese vor 10 Jahren sehr viel gehört habe, sie kommen also aus einer Schublade des fast Vergessens. Andere Bands habe ich sehr vernachlässigt, z.B.: Arctic Monkeys nur 3 mal gehört im Jahr 2022, Yawners auch nur 3 mal gehört GoGo Penguin gerade mal 2 Songs und die Liste geht immer weiter.

Ein Ausblick

Ich will auf jeden Fall noch weiter in der Spotify-Datenanalyse mit Python gehen. Es fehlen noch gescheite Graphen, geordneter Code und ein Blick in die Spotify Song-Klassifizierung steht auch noch auf meinem Plan. Ich hoffe der nächste Artikel lässt nicht so lange auf sich warten.


Vorgänger Artikel
Meine Daten gehören mir
Und wieder ist ein Spotify Jahr rum

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert