Python/데이터 분석 4

[python] datetime 활용 날짜별(년, 월, 일, 요일) 인덱싱 방법

데이터를 분석하다 보면 자주 사용하게 되는 것 중 하나가 날짜가 아닐까 싶다. 원본 데이터의 날짜 컬럼을 사용할 수도 있지만, 만약 특정 년, 월, 일, 요일 등을 따로 뽑아내어 분석하고 싶다면 어떻게 해야할까? 날짜 데이터를 활용할 때 사용하는 모듈인 datetime에 대하여 정리해보자. datetime 모듈의 자료형 자료형 date: 그레고리안 달력을 사용해서 날짜(연, 월, 일)를 저장 자료형 time: 하루의 시간을 시, 분, 초, 마이크로초 단위로 저장 자료형 datetime: 날짜와 시간을 저장 자료형 timedelta: 두 datetime 값 간의 차이(일, 초, 마이크로초)를 표현 자료형 tzinfo: 지역시간대를 저장하기 위한 기본 자료형 data_range: 날짜 범위 생성 pandas..

[python] matplotlib 시각화 한글 폰트 오류 문제 해결법 (맥, 윈도우)

파이썬을 통해 matplotlib 시각화를 할 경우에, 한글 폰트가 지원되지 않아 아래 이미지처럼 글자가 제대로 보이지 않고, 네모로 보이는 문제가 생긴다. 따라서, 미리 폰트 매니저를 임포트해서 설정을 해주어야 한다. 운영체제별 이름(OS별 PLATFORM) * Mac : 'Darwin' * Windows : 'Windows' * Linux : 'Linux' import platform import matplotlib.font_manager as fm if platform.system() == 'Darwin': # Mac 환경 폰트 설정 plt.rc('font', family='AppleGothic') elif platform.system() == 'Windows': # Windows 환경 폰트 설정 ..

[python] 결측치 확인 및 데이터프레임 병합

오늘은 데이터의 결측치를 확인하고, 데이터프레임을 병합하는 방법을 정리해보았다. 결측치 확인 df.isnull() df.isnull().sum() # 결측치 시각화 df.isnull().sum().plot.barh(figsize=(7,8)) fig, axes = plt.subplots(2, 1) plt.subplots_adjust(wspace=0, hspace=1) # alpha는 투명도를 의미 df1.isnull().sum().plot.bar(ax=axes[0], color='b', alpha=0.8) df2.isnull().sum().plot.bar(ax=axes[1], color='r', alpha=0.7) 데이터 프레임 병합 concat : 두개의 데이터 프레임을 하나로 병합 (이어 붙여줌; 데이..

[python] seaborn 데이터 시각화 라이브러리 활용

파이썬의 데이터 시각화 라이브러리인 seaborn을 활용해보자. 라이브러리 불러오기 및 설정 import seaborn as sns sns.set_style({'font.family':'serif', 'font.serif':['Times New Roman']}) sns.set_style('darkgrid') Figure 여러개 그리기 figure, ((ax1, ax2, ax3),(ax4, ax5,ax6)) = plt.subplots(nrows=2,ncols=3) figure.set_size_inches(10,6) sns.barplot(x='pclass', y='survived', hue='sex', data=df, ax=ax1) sns.barplot(x='pclass', y='survived', hue=..