파이썬에서 Excel 파일을 읽는 방법
파이썬에서 Excel 파일을 읽는 방법에 대한 단계별 튜토리얼을 제공합니다.
단계 1: 필요한 라이브러리 설치
먼저, 파이썬에서 Excel 파일을 처리하기 위해 필요한 라이브러리를 설치해야 합니다. 터미널 또는 명령 프롬프트를 열고 다음 명령을 실행하세요:
pip install pandas openpyxl xlrd
단계 2: 라이브러리 가져오기
라이브러리가 설치되었으면, 파이썬 스크립트에 이를 가져와야 합니다. 코드의 시작 부분에 다음 줄을 추가하세요:
import pandas as pd
단계 3: Excel 파일 로드
다음 단계는 Excel 파일을 파이썬 스크립트에 로드하는 것입니다. 이를 위해 pandas 라이브러리의 read_excel() 함수를 사용할 수 있습니다. 다음은 예시입니다:
data = pd.read_excel('filename.xlsx')
'filename.xlsx'을 사용자의 Excel 파일 경로로 바꾸세요. Excel 파일이 파이썬 스크립트와 같은 디렉토리에 있는 경우, 파일 이름만 제공하면 됩니다.
단계 4: 데이터 탐색
Excel 파일이 로드되면, 그 내용을 탐색할 수 있습니다. 데이터는 pandas의 DataFrame 객체에 저장됩니다. 데이터를 출력하거나 다양한 작업을 수행할 수 있습니다. 예를 들어, 데이터의 처음 몇 줄을 출력하려면 head() 함수를 사용하세요:
print(data.head())
단계 5: 특정 데이터 접근
pandas DataFrame을 사용하여 Excel 파일의 특정 행 또는 열에 접근할 수 있습니다. 몇 가지 예시를 살펴보겠습니다:
특정 열에 접근하려면 열 이름을 인덱스로 사용하세요:
column_data = data['Column Name']
특정 행에 접근하려면 loc 속성을 사용하고 행 인덱스를 제공하세요:
row_data = data.loc[row_index]
특정 셀에 접근하려면 위의 두 방법을 결합하세요:
cell_data = data.loc[row_index, 'Column Name']
단계 6: 행 반복
Excel 파일의 각 행을 반복하려면 for 루프를 사용할 수 있습니다. 다음은 예시입니다:
for index, row in data.iterrows():
print(row['Column Name'])
'Column Name'을 접근하려는 열의 이름으로 바꾸세요.
단계 7: 새 Excel 파일로 데이터 저장
데이터를 새 Excel 파일로 저장하려면 to_excel() 함수를 사용할 수 있습니다. 다음은 예시입니다:
data.to_excel('new_filename.xlsx', index=False)
'new_filename.xlsx'를 새 Excel 파일의 이름과 경로로 바꾸세요.
끝났습니다! 이제 pandas 라이브러리를 사용하여 파이썬에서 Excel 파일을 읽는 방법을 알았습니다. pandas가 제공하는 더 많은 기능과 함수를 사용하여 Excel 데이터를 조작하고 분석해보세요.