Wie man eine Excel-Datei in Python liest.
Hier ist eine schrittweise Anleitung, wie man eine Excel-Datei in Python liest.
Schritt 1: Erforderliche Bibliotheken installieren
Zuerst müssen Sie die erforderlichen Bibliotheken installieren, um mit Excel-Dateien in Python zu arbeiten. Öffnen Sie Ihr Terminal oder die Eingabeaufforderung und führen Sie den folgenden Befehl aus:
pip install pandas openpyxl xlrd
Schritt 2: Bibliotheken importieren
Nachdem die Bibliotheken installiert sind, müssen Sie sie in Ihr Python-Skript importieren. Fügen Sie am Anfang Ihres Codes die folgenden Zeilen hinzu:
import pandas as pd
Schritt 3: Excel-Datei laden
Der nächste Schritt besteht darin, die Excel-Datei in Ihr Python-Skript zu laden. Sie können die Funktion read_excel() aus der pandas-Bibliothek verwenden, um dies zu tun. Hier ist ein Beispiel:
data = pd.read_excel('dateiname.xlsx')
Ersetzen Sie 'dateiname.xlsx' durch den Pfad zu Ihrer Excel-Datei. Wenn sich die Excel-Datei im selben Verzeichnis wie Ihr Python-Skript befindet, können Sie einfach den Dateinamen angeben.
Schritt 4: Daten erkunden
Sobald die Excel-Datei geladen ist, können Sie deren Inhalt erkunden. Die Daten werden in einem pandas DataFrame-Objekt gespeichert. Sie können die Daten ausgeben oder verschiedene Operationen darauf durchführen. Um zum Beispiel die ersten paar Zeilen der Daten auszugeben, verwenden Sie die Funktion head():
print(data.head())
Schritt 5: Auf bestimmte Daten zugreifen
Sie können auf bestimmte Zeilen oder Spalten der Excel-Datei über den pandas DataFrame zugreifen. Hier sind einige Beispiele:
Um auf eine bestimmte Spalte zuzugreifen, verwenden Sie den Spaltennamen als Index:
spaltendaten = data['Spaltenname']
Um auf eine bestimmte Zeile zuzugreifen, verwenden Sie das Attribut loc und geben Sie den Zeilenindex an:
zeilendaten = data.loc[zeilenindex]
Um auf eine bestimmte Zelle zuzugreifen, kombinieren Sie die beiden obigen Methoden:
zellendaten = data.loc[zeilenindex, 'Spaltenname']
Schritt 6: Durch die Zeilen iterieren
Wenn Sie durch jede Zeile in der Excel-Datei iterieren möchten, können Sie eine Schleife verwenden. Hier ist ein Beispiel:
for index, zeile in data.iterrows():
print(zeile['Spaltenname'])
Ersetzen Sie 'Spaltenname' durch den Namen der Spalte, auf die Sie zugreifen möchten.
Schritt 7: Daten in einer neuen Excel-Datei speichern
Wenn Sie die Daten in einer neuen Excel-Datei speichern möchten, können Sie die Funktion to_excel() verwenden. Hier ist ein Beispiel:
data.to_excel('neuer_dateiname.xlsx', index=False)
Ersetzen Sie 'neuer_dateiname.xlsx' durch den gewünschten Namen und Pfad der neuen Excel-Datei.
Das ist alles! Sie wissen jetzt, wie man eine Excel-Datei in Python mit der pandas-Bibliothek liest. Erkunden Sie gerne weitere Funktionen und Möglichkeiten, die pandas bietet, um Excel-Daten zu manipulieren und zu analysieren.