분류 전체보기 85

실제값은 레이블 인코딩이고, 예측값은 소프트맥스로 나왔을때, 컨퓨전 매트릭스 만드는 방법

# 어떤것을 많이 틀리는지 확인한다. # 이런것은 컨퓨전 매트릭스로 확인하는 것! from sklearn.metrics import confusion_matrix y_pred = model.predict(X_test) y_pred.shape # 테스트 이미자가 10000개 (10000, 10) # 출력 y_test[0] 9 #출력 y_pred[0] # 출력 array([4.27080568e-06, 1.02400215e-07, 6.76651825e-06, 5.95587892e-07, 2.32840534e-06, 1.21201472e-02, 4.48114770e-06, 1.23955883e-01, 3.06501424e-05, 8.63874733e-01], dtype=float32) y_pred[0].argm..

Python 2021.12.01

뉴럴넷에 이미지를 학습시킬때, 텐서플로우로 사용하는 코드

# 라이브러리 임포트 import tensorflow as tf from keras.models import Sequential from keras.layers import Dense, Flatten model = Sequential() model.add( Flatten()) # 알아서 이미지 사이즈 계산해서, 인풋레이어 만들어 준다. # 히든 레이어 1개 model.add( Dense(units= 128, activation='relu')) # 아웃풋 레이어 셋팅 # 아웃풋 레이어는, 10개로 분류하는 문제이므로, # 노드 10개를 셋팅하고, 액티베이션 함수에는 소프트맥스(softmax)를 설정한다. model.add( Dense(units=10, activation='softmax' 이미지의 가로 세..

Python 2021.12.01

이미지를 피처 스케일링 하는 방법

학습이 잘되도록 0과 1사이의 값으로 노말라이징(normalizing) 한다. 우리가 기본적으로 하는 피처 스케일링은 두가지를 가장 많이 사용한다. StandardScaler, MinMaxScaler 를 많이 사용한다. (Standardiztion, Normalization) 그러나 이미지는, 범위가 0과 255사이로 정해져 있기 때문에 굳이 피처 스케일러를 사용할 필요없이 255로 그냥 나눠주기만 하면, 자동으로 0과 1사이의 값으로 피처스케일링 된다. X_train = X_train / 255.0 X_test = X_test / 255.0

Python 2021.12.01

이미지의 행렬, Gray Scale Image. Color Image

import tensorflow as tf # 라이브러리 임포트 # Fashion MNIST 데이터는 tf.keras datasets API에 들어있다. mnist = tf.keras.datasets.fashion_mnist # 트레이닝과 테스트셋 가져온다. (X_train, y_train), (X_test, y_test) = mnist.load_data() X_train # 출력 array([[[0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0], ..., [0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0]], [[0, 0, 0, ..., 0, ..

Python 2021.12.01

텐서플로우의 리그레션 문제 모델링 하는 코드

# 라이브러리 임포트 import tensorflow.keras from keras.models import Sequential from keras.lavers import Dense # 딥러닝을 이용한 모델링 model = Swquential() X_train.shape # 첫번째 히든레이어의 인풋 레이어의 숫자 셋팅을 위해 확인 (400, 5) # 첫번째 히든레이어 생성 : 이때는 인풋 레이어의 숫자도 셋팅해준다. input_dim = 5 model.add( Dense(units = 20, activation = 'relu', input_dim = 5 ) ) # 두번째 히든레이어 생성 model.add( Dense(units = 10, activation = 'relu')) # 아웃풋 레이어 생성 #..

Python 2021.11.30

원 핫 인코딩 Dummy variable trap

one hot encoding이란? 범주를 벡터 방식으로 표현하기 위한 방법 예를 들면 프랑스, 스페인, 영국의 세 나라가 있다고 하면 프랑스 = [1, 0, 0] 스페인 = [0, 1, 0] 영국 = [0, 0, 1] 이렇게 매칭을 시킵니다. dummy variable trap이란? dummy variable trap이라는 것은 범주를 나누는데 불필요한 컬럼을 제거하는 것입니다. 위에서 프랑스 = [1, 0, 0] 스페인 = [0, 1, 0] 영국 = [0, 0, 1] 라고 분류를 했는데 사실 이 상태는 dummy variable trap에 빠진 상태입니다. 원 핫 인코딩한 결과의 맨 왼쪽 컬럼은, 삭제를 해도, 0과 1로 모두 3개 데이터표현가능 프랑스 = [1, 0] 스페인 = [0, 1] 영국 =..

Python 2021.11.30

파이썬 Pandas Series 데이터 액세스 방법 pd.Series()

Pandas Series 데이터 생성 import pandas as pd index = ['eggs', 'apple', 'milk', 'bread'] data = [30, 6, 'Yes', 'No'] # 용어 필수 암기 : 판다스의 1차원 데이터를 Series(시리즈)라구 부른다. pd.Series(data = data) # 판다스의 시리즈 030 16 2Yes 3No dtype: object 시리즈의 왼쪽을 인덱스라고 부른다. 전에 리스트를 할대 배웠던 인덱스는, 컴퓨터가 자동으로 매기는 인덱스라고 할것 판다스에서의 인덱스는 사람용 인덱스 시리즈의 오른쪽을 values 라고 부른다. import pandas as pd groceries = pd.Series(data = data, index = inde..

Python 2021.11.26

파이썬 Pandas의 피벗 테이블 생성 pd.pivot_table()

pivot : 피벗 테이블 데이터 프레임에서 두 개의 열을 이용하여 행/열 인덱스 reshape 된 테이블 새로운 테이블에서 새로운 기준으로 집계 피벗테이블 만드는 방법 pd.pivot_table(data, values, index, columns, aggfunc='mean(함수)' ) # 피봇팅 한다. 즉 컬럼의 값을 열로 만드는것. import pandas as pd import numpy as np df = pd.read_excel('sales-funnel.xlsx') df pd.pivot_table(df, index=['Name']) # 평균 pd.pivot_table(df, index=['Name'], aggfunc= np.sum ) # 합 구별로 정리하기 pd.pivot_table(df, in..

Python 2021.11.26