본문 바로가기

ML, DL/머신러닝

(5)
머신러닝 기초 [기계학습 문제 해결 순서] 1. 해결 할 일(task) 에 대해 input, ouput 이 무엇인지 분석한다. - 회귀인지, 분류인지 - 라벨링이 되어있는지, 아닌지 2. 데이터를 이해한다 (EDA) - Missing value 채움, Outlier 제거 - 데이터 분포 및 값을 검토 - 모델링 시 주의점 파악 - 모델 선택 가설 수립 3. Train, Test 데이터를 대표성을 띄도록 임의로 나누고, metric 을 정의한다. *Validation set 이 필요한 이유 : 학습 중간 과정에 Model 성능 평가 가능, 모델링 진행자를 위해 존재 4. 피처엔지니어링과 모델링을 한다 - 피처엔지니어링 : 데이터 도메인 지긱을 활용하여 데이터 Feature 를 추가로 만들어 주는 과정 (고도화된 DL 에..
소프트맥스 회귀(Softmax Regression) 원글 출처 : https://wikidocs.net/35476 09) 소프트맥스 회귀(Softmax Regression) 앞서 로지스틱 회귀를 통해 2개의 선택지 중에서 1개를 고르는 이진 분류(Binary Classification)를 풀어봤습니다. 이번에는 3개 이상의 선택지 중에서 1개를 ... wikidocs.net 3개 이상의 선택지 중에서 1개를 고르는 다중 클래스 분류 문제를 위한 소프트맥스 회귀(Softmax Regression)에 대해서 배웁니다. 1. 다중 클래스 분류(Multi-class Classification) 앞서 로지스틱 회귀에서 사용한 시그모이드 함수는 입력된 데이터에 대해서 0과 1사이의 값을 출력하여 해당 값이 둘 중 하나에 속할 확률로 해석할 수 있도록 만들어주었습니다..
다중 선형 회귀 행렬 연산으로 이해하기 원글 출처 : https://wikidocs.net/37001 08) 벡터와 행렬 연산 앞서 독립 변수 $x$가 2개 이상인 선형 회귀와 로지스틱 회귀에 대해서 배웠습니다. 그런데 다음 실습인 소프트맥스 회귀에서는 종속 변수 $y$의 종류도 3개 이상이 되면서 ... wikidocs.net 독립 변수가 2개 이상일 때, 1개의 종속 변수를 예측하는 문제를 행렬의 연산으로 표현한다면 어떻게 될까요? 다중 선형 회귀나 다중 로지스틱 회귀가 이러한 연산의 예인데, 여기서는 다중 선형 회귀를 통해 예를 들어보겠습니다. 다음은 독립 변수 x가 n개인 다중 선형 회귀 수식입니다. 이는 입력 벡터 [x1,...xn]와 가중치 벡터 [w1,...,wn]의 내적으로 표현할 수 있습니다. 또는 가중치 벡터 [w1,...,..
로지스틱 회귀(Logistic Regression) 원글 출처 : https://wikidocs.net/22881 05) 로지스틱 회귀(Logistic Regression) 일상 속 풀고자하는 많은 문제 중에서는 두 개의 선택지 중에서 정답을 고르는 문제가 많습니다. 예를 들어 시험을 봤는데 이 시험 점수가 합격인지 불합격인지가 궁금할 수도 있 ... wikidocs.net 1. 이진 분류(Binary Classification) 앞서 선형 회귀를 설명하며 공부 시간과 성적 간의 관계를 직선의 방정식으로 표현한다는 가설 하에, 주어진 데이터로부터 가중치 w와 편향 b를 찾아 데이터를 가장 잘 표현하는 직선을 찾았습니다. 그런데 이번에 배울 둘 중 하나의 선택지 중에서 정답을 고르는 이진 분류 문제는 직선으로 표현하는 것이 적절하지 않습니다. 학생들이 시험..
머신 러닝 모델 평가, Sample/Feature 출처 : https://wikidocs.net/32012 02) 머신 러닝 훑어보기 머신 러닝의 특징을 이해하고, 주요 용어에 미리 친숙해져봅시다. ## 1. 머신 러닝 모델의 평가** ![](https://wikidocs.net/images/page ... wikidocs.net 1. 머신 러닝 모델의 평가** - 검증용 데이터 : 모델의 성능을 평가하기 위한 용도가 아니라 모델의 성능을 조정하기 위한 용. 더 정확히는 모델이 훈련 데이터에 과적합(overfitting) 이 되고 있는지 판단하거나 하이퍼파라미터의 조정을 위한 용도입니다. 훈련용 데이터로 훈련을 모두 시킨 모델은 검증용 데이터를 사용하여 정확도를 검증하며 하이퍼파라미터를 튜닝(tuning) 합니다. 검증용 데이터에 대해서 높은 정확도를 ..