목록데이터 마이닝/딥러닝 (9)
박가방
딥러닝에서 fit 메소드의 batch_size 매개변수는 한 번에 처리할 데이터의 수를 의미합니다. 이 매개변수는 모델이 학습하는 동안 한 번에 처리할 데이터의 크기를 결정합니다. batch_size가 작으면 모델이 학습하는 동안 더 많은 반복이 필요하며, 더 많은 시간이 걸릴 수 있습니다. 하지만 batch_size가 작으면 모델이 데이터의 세부적인 특징을 더 잘 학습할 수 있습니다. 반대로 batch_size가 크면 모델이 학습하는 동안 더 적은 반복이 필요하며, 더 적은 시간이 걸릴 수 있습니다. 하지만 batch_size가 크면 모델이 데이터의 세부적인 특징을 놓칠 수 있습니다. 따라서 batch_size는 모델의 성능과 학습 속도 사이의 균형을 맞추기 위해 조절해야 하는 중요한 매개변수입니다.

- 본문에서는 Minst 손 글씨 예제와 추가적으로 EalryStopping 기법에 대해 공부하고자 한다. - 학습 곡선에서 train loss는 당연히 떨어질 수 밖에 없다. 거의 증가하지 않는다. - 따라서 validation loss를 보면서 과적합을 막아보자 1. 환경준비 ① 라이브러리 불러오기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.metrics import * from sklearn.preprocessing import MinMaxScaler from ..

사전 짧은 지식 #1. data의 quality 열에서, # 3인 경우 4로 변경 # 3이 아닌경우 # 2. 다음 data['quality']==9인 조건으로 가는데 # 9인 경우 8로 변경 # 9가 아닌 경우 # 3. data['quality']를 그대로 둔다. data['quality'] = np.where(data['quality'] == 3, 4, np.where(data['quality'] == 9, 8, data['quality'])) 이전 변경 후 1. 환경 설정 ① 라이브러리 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection..

회사 이직률 예측 - 분류(0 , 1) 1. 환경 준비 ① 라이브러리 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.metrics import * from sklearn.preprocessing import MinMaxScaler from keras.models import Sequential from keras.layers import Dense from keras.backend import clear_session from keras.optimizers import ..
목적 : Sigmoid는 무엇이고, 어떤 차이를 갖나? 선형 회귀시 당연히, features 내 다중 공선성 발생가능. 다중 공선성 : 서로, 선형 관계가 형성이된 feature들 x1 = 2x_2 +3x_3 y빼고 x들끼리 설명이 가능해져버림. 이 경우, 원래 식이 y = x_1 + x_2+x_3 이였다면 y = 3x_2 + 4x_3이 됨. (x_2 x_3이 가중치가 더 심해짐) 파라미터가 최적화되기 어려움. 따라서 선형 회귀 때 둘 관계가 아무런 관계가없는 독립이여야한다는 가정 필요 #relu (Rectified Linear Unit) 선형함수를 비선형으로 바꾸어주는것 집값이 마이너스로 나오면 안되는데 나오는 경우가 발생해서 그걸 방지하고자 쓴다고 생각하면 될듯