'height' 열의 분산을 구하는 함수 var을 이용해 위 사진처럼 출력해봤지만 116.666... 이 나왔네요... 그래서 찾아보니 해당 레슨에서도 나왔던 내용인 표본분산 계산 시 pandas는 N - 1 (N = 데이터의 개수)로 계산한다는 것을 알아냈습니다. 모분산을 계산하는 것처럼 N으로 나누고 싶다면 df1['height'].var(ddof=0) 이런식으로 파라미터에 ddof=0을 넣어주면 된다고 합니다! 실제로 해보니 87.5가 출력되었습니다.
댓글 3개
그래서 찾아보니 해당 레슨에서도 나왔던 내용인 표본분산 계산 시 pandas는 N - 1 (N = 데이터의 개수)로 계산한다는 것을 알아냈습니다.
모분산을 계산하는 것처럼 N으로 나누고 싶다면
df1['height'].var(ddof=0)
이런식으로 파라미터에 ddof=0을 넣어주면 된다고 합니다!
실제로 해보니 87.5가 출력되었습니다.