기본 지도 학습 알고리즘들선형 회귀 (Linear Regression)모델 평가하기 노트

Q

학습데이터 & 평가데이터

조회 481

좋아요 3

2021년 9월 5일

댓글 1

2023년 7월 1일
30개 모두 써서 학습데이터로만 하면 31번째 데이터 들어오면 최적선이 또달라져요. 과대적합이라고 하죠. 이미 학습된 데이터 30개에만 예측을 잘할수있는 최적선인거지 앞으로 들어올 데이터에 대해선 예측이 어려울 겁니다. 그래서 train/test data를 나누는 겁니다.
A
1개의 답변이 있어요
2021년 9월 18일

댓글 2

2021년 10월 4일
그럼 혹시 유한한 n개의 데이터 있다고 하면 몇개를 최적선을 만드는데쓰고 몇개를 평가하는데 쓰는지 n에따라 갯수가 구분되는 기준이 있나요??
아니면 그때에 따라서 여러가지 경우를 해보았을때 나오는 최적의 결과값을 기준으로 그 갯수를 구분하는건가요??
2022년 11월 13일
training set과 test set의 비율에 대해 정해진건 없지만, 통상 8:2의 비율로 랜덤하게 선택해서 사용하는 것 같습니다

(주) 코드잇

대표강영훈

개인정보보호책임자강영훈

이메일support@codeit.kr

사업자 번호313-86-00797

통신판매업제 2019-서울중구-1034 호

주소서울특별시 중구 청계천로 100 시그니쳐타워 동관 10층 코드잇