Zum Hauptinhalt springen

Wie man eine Excel-Datei in Python liest.

Hier ist eine schrittweise Anleitung, wie man eine Excel-Datei in Python liest.

Schritt 1: Erforderliche Bibliotheken installieren

Zuerst müssen Sie die erforderlichen Bibliotheken installieren, um mit Excel-Dateien in Python zu arbeiten. Öffnen Sie Ihr Terminal oder die Eingabeaufforderung und führen Sie den folgenden Befehl aus:

pip install pandas openpyxl xlrd

Schritt 2: Bibliotheken importieren

Nachdem die Bibliotheken installiert sind, müssen Sie sie in Ihr Python-Skript importieren. Fügen Sie am Anfang Ihres Codes die folgenden Zeilen hinzu:

import pandas as pd

Schritt 3: Excel-Datei laden

Der nächste Schritt besteht darin, die Excel-Datei in Ihr Python-Skript zu laden. Sie können die Funktion read_excel() aus der pandas-Bibliothek verwenden, um dies zu tun. Hier ist ein Beispiel:

data = pd.read_excel('dateiname.xlsx')

Ersetzen Sie 'dateiname.xlsx' durch den Pfad zu Ihrer Excel-Datei. Wenn sich die Excel-Datei im selben Verzeichnis wie Ihr Python-Skript befindet, können Sie einfach den Dateinamen angeben.

Schritt 4: Daten erkunden

Sobald die Excel-Datei geladen ist, können Sie deren Inhalt erkunden. Die Daten werden in einem pandas DataFrame-Objekt gespeichert. Sie können die Daten ausgeben oder verschiedene Operationen darauf durchführen. Um zum Beispiel die ersten paar Zeilen der Daten auszugeben, verwenden Sie die Funktion head():

print(data.head())

Schritt 5: Auf bestimmte Daten zugreifen

Sie können auf bestimmte Zeilen oder Spalten der Excel-Datei über den pandas DataFrame zugreifen. Hier sind einige Beispiele:

Um auf eine bestimmte Spalte zuzugreifen, verwenden Sie den Spaltennamen als Index:

spaltendaten = data['Spaltenname']

Um auf eine bestimmte Zeile zuzugreifen, verwenden Sie das Attribut loc und geben Sie den Zeilenindex an:

zeilendaten = data.loc[zeilenindex]

Um auf eine bestimmte Zelle zuzugreifen, kombinieren Sie die beiden obigen Methoden:

zellendaten = data.loc[zeilenindex, 'Spaltenname']

Schritt 6: Durch die Zeilen iterieren

Wenn Sie durch jede Zeile in der Excel-Datei iterieren möchten, können Sie eine Schleife verwenden. Hier ist ein Beispiel:

for index, zeile in data.iterrows():
print(zeile['Spaltenname'])

Ersetzen Sie 'Spaltenname' durch den Namen der Spalte, auf die Sie zugreifen möchten.

Schritt 7: Daten in einer neuen Excel-Datei speichern

Wenn Sie die Daten in einer neuen Excel-Datei speichern möchten, können Sie die Funktion to_excel() verwenden. Hier ist ein Beispiel:

data.to_excel('neuer_dateiname.xlsx', index=False)

Ersetzen Sie 'neuer_dateiname.xlsx' durch den gewünschten Namen und Pfad der neuen Excel-Datei.

Das ist alles! Sie wissen jetzt, wie man eine Excel-Datei in Python mit der pandas-Bibliothek liest. Erkunden Sie gerne weitere Funktionen und Möglichkeiten, die pandas bietet, um Excel-Daten zu manipulieren und zu analysieren.