기본 지도 학습 알고리즘들다중 선형 회귀 (Multiple Linear Regression)scikit-learn으로 당뇨 수치 예측하기

Q

target변수

조회 1284

좋아요 9

2020년 10월 3일




댓글 3

2022년 9월 28일
DESCR 을 보면, 링크주소가 나와요. 거기 들어가면 타겟변수가 y로 나옵니다. ;; 그런데, 위에처럼 판다스DataFrame 자료로 변환하지 않고, 그냥 사용해도 되요. X = diabets_dataset.data, y = diabets_dataset.target 이런 식으로요. ;; 위에서 판다스데이타프레임으로 변환한 것은 시각적으로 잘 보기 위한 편의사항이고, 그래서 임시로 'diabetes'라는 칼럼이름을 달 수도 있었던 것입니다.
2022년 9월 28일
맨처음 실습에서는 X 변수가 하나인 것을 실습하느라, 어쩔 수 없이 판다스데이타프레임으로 변환하고, 거기서 하나의 행을 뽑아온 것이고, 지금 다중선형모델에서는 기존에 제공하는 행렬을 그대로 사용하기 때문에 판다스데이타프레임파일로 변환할 필요없이 그냥 사용하면 됩니다.
2022년 9월 28일
diabetes_dataset.target 는 y값 입니다. S6는 X값에 들어 있어요.
A
2개의 답변이 있어요



2020년 10월 4일

댓글 2

2020년 10월 4일
혹시 그러면 앞선 설명에서 목표변수로 MEDV가 설정되었었는데, 그 데이터에서 타겟이 집값이었다는건 어떻게 알 수 있는거죠? 얘같은 경우에는 타겟변수를 출력해봤을 때 그 데이터의 내용이 MEDV열 데이터의 내용과 일치해서 아 타겟변수가 집값(MEDV)구나 알 수 있는거였나요? 감사합니다 ㅎㅎ!
2023년 12월 9일
boston_dataset에서의 타겟이 집값인 것은 그 데이터셋의 목적이 집값을 예측하는 모델을 학습시키도록 설계한 것이라고 생각합니다.

(주) 코드잇

대표강영훈

개인정보보호책임자강영훈

이메일support@codeit.kr

사업자 번호313-86-00797

통신판매업제 2019-서울중구-1034 호

주소서울특별시 중구 청계천로 100 시그니쳐타워 동관 10층 코드잇