View
<목차>
Jupyter Notebook을 사용하는 경우입니다.
데이터 양이 많거나 길이가 길면, "..." 으로 대부분 생략되어 출력됩니다.
길이가 긴 정보를 원하는 크기만큼 출력해보려면, pandas 설정을 수정해주면 됩니다.
1. pandas 옵션 확인, 수정하기
옵션 목록 확인하기
pd.describe_option() 을 실행하면 옵션 목록과 설명을 확인할 수 있습니다.
설명이 잘 나와있으니 원하는 옵션 이름만 찾으면 이후에는 쉽습니다.
pd.describe_option()
옵션 목록은 공식 문서에서도 확인할 수 있습니다. (링크)
Options and settings — pandas 1.2.1 documentation
Getting and setting options As described above, get_option() and set_option() are available from the pandas namespace. To change an option, call set_option('option regex', new_value). In [11]: pd.get_option("mode.sim_interactive") Out[11]: False In [12]: p
pandas.pydata.org
Jupyter 상에 출력되는 것보다 가독성이 좋으니 종류나 설명을 읽을 때 좋을 것 같습니다.
수정하기
pd.set_option으로 옵션 이름과 수정값을 넣어주면, 이후에 실행되는 코드에 적용됩니다.
#pd.set_option('옵션 이름', 수정할 값)
pd.set_option('display.max_columns', 10)
2. Columns 리스트 전부 출력하기
columns 수가 매우 많은 경우에, 이를 생략없이 출력하려고 합니다.
display.max_seq_items 옵션을 None으로 설정하면 생략없이 무제한으로 출력됩니다.
pd.set_option('display.max_seq_items', None)
만약 한줄에 하나씩 출력하고 싶다면, display.width를 10정도로 작은 숫자로 설정해주면 됩니다. (기본값=80)
pd.set_option('display.width', 10)
3. DataFrame 생략 없이 출력하기
row 설정은 특정 열의 값들을 전부 확인해볼 때 유용한 것 같습니다.
# row 생략 없이 출력
pd.set_option('display.max_rows', None)
# col 생략 없이 출력
pd.set_option('display.max_columns', None)
데이터 개수가 많을 경우 출력할 때 속도가 꽤 느려지니 주의합시다!
'Data Science' 카테고리의 다른 글
[pandas] csv와 json이 혼합된 파일 형식 (0) | 2021.01.04 |
---|---|
pycaret으로 타이타닉 생존자 예측 (2) (1) | 2020.12.24 |
pycaret으로 타이타닉 생존자 예측 (1) (0) | 2020.12.22 |