반응형
오늘은 pandas를 사용할 때 흔히 마주치는 오류 중 하나인
ModuleNotFoundError: No module named 'xlrd' 에러의 원인과 해결 방법에 대해 알아보겠습니다.
문제 상황
엑셀 파일을 불러오기 위해 아래와 같은 코드를 실행했을 때:
import pandas as pd
df = pd.read_excel('mydata.xls') # 또는 'mydata.xlsx'
다음과 같은 에러가 발생합니다:
ModuleNotFoundError: No module named 'xlrd'
...
ImportError: Missing optional dependency 'xlrd'. Install xlrd >= 2.0.1 for xls Excel support
원인
pandas.read_excel() 함수는 내부적으로 엑셀 파일을 읽기 위해 외부 라이브러리를 사용합니다.
엑셀 파일의 확장자에 따라 필요한 엔진이 다르며, 그중 .xls 파일은 xlrd 패키지를 필요로 합니다.
하지만 xlrd는 기본적으로 pandas에 포함되어 있지 않기 때문에 별도로 설치해주어야 합니다.
또한 주의할 점은 xlrd 버전 2.0.0 이상부터는 .xlsx 파일을 지원하지 않고 .xls만 지원한다는 것입니다.
해결 방법
xlrd를 설치하면 금방 해결할 수 있습니다.
pip install xlrd
# 또는
conda install xlrd
이렇게 설치하면 .xls 파일을 정상적으로 불러올 수 있습니다.
반응형