Aller au contenu principal

Comment lire un fichier Excel en Python.

Voici un tutoriel étape par étape sur la façon de lire un fichier Excel en Python.

Étape 1 : Installer les bibliothèques requises

Tout d'abord, vous devez installer les bibliothèques requises pour travailler avec les fichiers Excel en Python. Ouvrez votre terminal ou votre invite de commande et exécutez la commande suivante :

pip install pandas openpyxl xlrd

Étape 2 : Importer les bibliothèques

Une fois les bibliothèques installées, vous devez les importer dans votre script Python. Ajoutez les lignes suivantes au début de votre code :

import pandas as pd

Étape 3 : Charger le fichier Excel

La prochaine étape consiste à charger le fichier Excel dans votre script Python. Vous pouvez utiliser la fonction read_excel() de la bibliothèque pandas pour cela. Voici un exemple :

data = pd.read_excel('nom_fichier.xlsx')

Remplacez 'nom_fichier.xlsx' par le chemin d'accès à votre fichier Excel. Si le fichier Excel se trouve dans le même répertoire que votre script Python, vous pouvez simplement fournir le nom de fichier.

Étape 4 : Explorer les données

Une fois le fichier Excel chargé, vous pouvez explorer son contenu. Les données seront stockées dans un objet DataFrame de pandas. Vous pouvez afficher les données ou effectuer différentes opérations dessus. Par exemple, pour afficher les premières lignes des données, utilisez la fonction head() :

print(data.head())

Étape 5 : Accéder à des données spécifiques

Vous pouvez accéder à des lignes ou des colonnes spécifiques du fichier Excel en utilisant le DataFrame de pandas. Voici quelques exemples :

Pour accéder à une colonne spécifique, utilisez le nom de la colonne comme index :

donnees_colonne = data['Nom de la colonne']

Pour accéder à une ligne spécifique, utilisez l'attribut loc et fournissez l'index de la ligne :

donnees_ligne = data.loc[index_ligne]

Pour accéder à une cellule spécifique, combinez les deux méthodes ci-dessus :

donnees_cellule = data.loc[index_ligne, 'Nom de la colonne']

Étape 6 : Parcourir les lignes

Si vous souhaitez parcourir chaque ligne du fichier Excel, vous pouvez utiliser une boucle for. Voici un exemple :

for index, ligne in data.iterrows():
print(ligne['Nom de la colonne'])

Remplacez 'Nom de la colonne' par le nom de la colonne que vous souhaitez accéder.

Étape 7 : Enregistrer les données dans un nouveau fichier Excel

Si vous souhaitez enregistrer les données dans un nouveau fichier Excel, vous pouvez utiliser la fonction to_excel(). Voici un exemple :

data.to_excel('nouveau_nom_fichier.xlsx', index=False)

Remplacez 'nouveau_nom_fichier.xlsx' par le nom et le chemin d'accès souhaités du nouveau fichier Excel.

Et voilà ! Vous savez maintenant comment lire un fichier Excel en Python en utilisant la bibliothèque pandas. N'hésitez pas à explorer davantage les fonctionnalités offertes par pandas pour manipuler et analyser les données Excel.