본문 바로가기

Python

(15)
Pandas_03 In [3]: import numpy as np import pandas as pd Dataframe Boolean Index¶ 데이타프레임 인덱스시 사용됨 마스크(Mask)라고도 함 조건에 맞으면 결과값이 True/False 형태의 Boolean으로 표시 df.loc [ df[ 컬럼인덱스] 비교연산자 ] df.loc [ df[ 행인덱스] 비교연산자 ] 다중 조건시 논리 연산자 사용 In [42]: data = { "year":[2014, 2015, 2016, 2015, 2017,2013] ,"name":['Haidi', 'Haidi', 'Haidi', 'Charles', 'Charles', 'Hayoung'] , "p..
Pandas_02 In [2]: import numpy as np import pandas as pd DataFrame 생성하기¶ 데이타프레임이름 = pd.DataFrame(딕셔너리리스트) 딕셔너리 리스트 : 딕셔너리 구조인데 값이 리스트인 구조 데이타프레임을 딕셔너리 리스트로 만들면 키는 컬럼명으로 지정된다. { 키1:[리스트1], 키2:[리스트2] ... } 딕셔너리 리스트 생성하기¶ { 키1:[값1, 값2, 값3 ...], 키2:[값1, 값2, 값3 ...] ... } In [5]: data = { "name":['Elise', 'Julia', 'Jhon', 'Charles', 'Charles'], "year":[2014, 2015, 2016, ..
Pandas_01 판다스(Pandas) 란?¶ 데이터 처리와 분석을 위한 파이썬 라이브러리 파이썬계의 엑셀 http://pandas.pydata.org 아나콘다 설치시 자동으로 설치 외부모듈이라서 임포트는? import pandas as pd Pandas의 자료구조¶ 시리즈(Series) : 리스트와 딕셔너리 두가지의 장점을 섞어놓은 듯한 자료구조 데이타프레임(DataFrame) : Row와 Column으로 이뤄진 2차원 형태의 자료구조. 시리즈(Series)의 결합체 pandas, numpy import¶ In [2]: import numpy as np import pandas as pd pandas 버전 확인하기¶ In [3]: pd.__version__ Out[3]: '0.24.2' Series 만들기..
Numpy_04 In [1]: import numpy as np Numpy 배열의 Boolean Indexing¶ 다수개의 배열에서 특정 값을 추출할 때 사용한다. 배열이름[조건] TRUE, FALSE로 값이 표시된다. names ndArray 배열에서 True, False로 표시된다.¶ In [2]: names = np.array(['Charles','Jhon', 'Hayoung','Charles', 'Hayoung','Jhon', 'Elise']) names Out[2]: array(['Charles', 'Jhon', 'Hayoung', 'Charles', &#..
Numpy_03 In [3]: import numpy as np Numpy 배열의 함수 이용하기¶ np.sqrt(배열명) : 제곱근 구하기¶np.log10(배열명) : 로그 구하기¶ In [4]: np.sqrt([1,2,3,4,5]) Out[4]: array([1. , 1.41421356, 1.73205081, 2. , 2.23606798]) In [5]: np.log10([10,100,2000]) Out[5]: array([1. , 2. , 3.30103]) 퀴즈¶: 1~10까지의 ndarray 배열 생성후¶np.log10(), np.sqrt() 함수 적용하기¶소숫점 결과는 3번째 자리에서 반올림한다.¶ In [9]: np.set_printoptions(precision=2) In [10]: arr = np.arang..
Numpy_02 random 모듈¶ 외부 모듈 : import random random.random(): 0 부터 1 사이의 부동소수점(float) 숫자를 리턴한다 random.randint(최소, 최대) : 입력 파라미터인 최소부터 최대까지 중 임의의 정수를 리턴한다 random.randrange(시작,끝[,간격]) : 입력 파라미터인 시작부터 끝값까지 (지정된 간격으로 나열된) 숫자 중 임의의 정수를 리턴한다 random.uniform(최소, 최대) : 입력 파라미터인 최소부터 최대까지 중 임의의 부동소수점(float) 숫자를 리턴한다 In [1]: import random In [5]: # 0~1 사이 1개 실수형 난수 random.random() Out[5]: 0.8743363759284282 In [6]: ra..
Numpy_01 넘파이란?¶ Numeric + Python = Numpy(넘파이, 늄파이) 수학 및 과학 연산을 위한 파이썬 패키지 관련 사이트 : http://www.numpy.org 리스트와의 차이점 : 하나의 데이터형만 지원 np.array 함수를 활용하여 ndarray 배열을 생성함 # 주의사항 : numpy 외부 모듈을 임포트하고 사용 import numpy as np # 통상적으로 np로 별칭한다. 넘파이 임포트¶ In [1]: import numpy as np 넘파이 버전 확인¶ In [2]: np.__version__ Out[2]: '1.16.3' 넘파이 배열 만들기¶ np.array(리스트) 리스트 형태는 실수, 정수, 문자 넘파이 배열 가능 In [4]: arrA = [ 1, 2, 3, ..