본문 바로가기

분류 전체보기

(229)
시각화_02. matplotlib Matplotlib 시각화¶ 데이터 시각화를 위한 파이썬 라이브러리 https://matplotlib.org/ In [75]: import numpy as np import pandas as pd matplotlib 임포트와 매직명령어¶ In [76]: import matplotlib import matplotlib.pyplot as plt In [77]: matplotlib.__version__ Out[77]: '3.1.0' matplotlib 매직 명령어¶ 자동으로 리사이징 옵션 지정 In [78]: %matplotlib inline Figure 객체 생성하기¶ Figure : 도식. 그래프가 삽입되는 객체 var = plt.figure() In [79]: fig = plt.figure..
시각화_01. seaborn Seaborn¶ Matplotlib을 기반으로 다양한 색상 테마와 통계용 차트 등의 기능을 추가한 시각화 패키지 https://seaborn.github.io/ In [1]: import numpy as np import pandas as pd import matplotlib import matplotlib.pyplot as plt # seaborn 임포트 import seaborn as sns # 한글 폰트 패스로 지정 import matplotlib.font_manager as fm path = 'C:\Windows\Fonts\malgunbd.ttf' font_name = fm.FontProperties(fname=path).get_name() plt.rc('font', ..
Pandas_06. 타이타닉 In [1]: import numpy as np import pandas as pd csv 데이타 파일 읽어오기¶ 데이타프레임이름 = pd.read_csv(dataFile경로, index_col='인덱스로사용할컬럼') 데이타프레임이름.shape : 구조 확인 In [49]: train = pd.read_csv('data/train.csv',index_col='PassengerId') train.shape Out[49]: (891, 11) 데이타프레임에서 앞과 뒤에 갯수 정해서 표시하기¶ 데이타프레임명.head() : 5개 데이타프레임명.tail() : 5개 데이타프레임명.head(숫자) 데이타프레임명.tail(숫자) In [9]: train.tail() Out[9]: Surv..
무단 횡단 사고 분석
서울시 흡연부스 입지추천
Pandas_05 In [2]: import numpy as np import pandas as pd 행또는 열 별로 합 구하기¶ df.sum(axis=0) df.sum(axis=1) df[컬럼명].sum(axis=0) df.loc[인덱스명].sum() skipna = False 결측치가 있는 데이타프레임 생성하기¶ In [3]: data = [[1.4, np.nan], [7.1, -4.5], [np.nan, np.nan], [0.75, -1.3]] In [4]: df = pd.DataFrame(data, columns=["one","two"], index=["a", "b", "c", "d"]) df Out[4]: one two a 1.40 NaN b 7.10 -4.5 c NaN NaN d 0.75 -1.3 df.sum(..
Pandas_04 In [2]: import numpy as np import pandas as pd 행또는 열 별로 합 구하기¶ df.sum(axis=0) df.sum(axis=1) df[컬럼명].sum(axis=0) df.loc[인덱스명].sum() skipna = False 결측치가 있는 데이타프레임 생성하기¶ In [3]: data = [[1.4, np.nan], [7.1, -4.5], [np.nan, np.nan], [0.75, -1.3]] In [4]: df = pd.DataFrame(data, columns=["one","two"], index=["a", "b", "c", "d"]) df Out[4]: one two a 1.40 NaN b 7.10 -4.5 c NaN NaN d 0.75 -1.3 df.sum(..
Pandas_03 In [3]: import numpy as np import pandas as pd Dataframe Boolean Index¶ 데이타프레임 인덱스시 사용됨 마스크(Mask)라고도 함 조건에 맞으면 결과값이 True/False 형태의 Boolean으로 표시 df.loc [ df[ 컬럼인덱스] 비교연산자 ] df.loc [ df[ 행인덱스] 비교연산자 ] 다중 조건시 논리 연산자 사용 In [42]: data = { "year":[2014, 2015, 2016, 2015, 2017,2013] ,"name":['Haidi', 'Haidi', 'Haidi', 'Charles', 'Charles', 'Hayoung'] , "p..