MSE & RMSE
MSE(Mean Squared Error)는 오차를 제곱한 것들의 합의 평균이라고 할 수 있다.
오차를 제곱한 이유는 그래프의 오차(실제값-예측값)가 음수인 경우도 있어서 모두 더할 때, 양수오차와 음수오차가 서로 상쇄되어 버리기 때문이다.
RMSE(Root Mean Squared Error)는 오차를 제곱했기 때문에 MSE에 루트를 씌워준 것이다.
RMSE가 작다는 것은 오차가 작다는 것이고 실제값과 예측값의 차이가 적기에 좋은 모델로 볼 수 있다. 즉, 예측을 잘했다는 말이다.
R² (Coefficient of Determination)
TSS (Total Sum of Squares) = RSS + ESS
(실제값 - 평균)의 제곱의 합
RSS (Residual Sum of Squares)
(실제값 - 예측값)의 제곱의 합
# RSS가 작을수록 모델의 예측이 실제값에 가까워짐
ESS (Explained Sum of Squares)
예측값 - 실제값의 평균
R² (결정계수)
R² = TSS/ESS = 1 − TSS/RSS
# 모델의 설명력을 나타내는 지표로 0과 1 사이의 값을 가진다.
# 1에 가까울수록 모델이 데이터를 잘 설명하고 있음을 의미한다.
정리
RMSE
오차의 제곱을 평균한 값의 제곱근으로, 예측값과 실제값 간의 차이를 나타낸다.
작을수록 모델의 예측이 더 정확하다고 할 수 있다.
R²
회귀 분석에서 사용되는 중요한 평가 지표 중 하나입니다. 이는 회귀 모델이 데이터를 얼마나 잘 설명하는지를 나타낸다.
R² 값은 0에서 1 사이의 범위를 가지며, 높을수록 모델이 데이터를 더 잘 설명한다.
# R² = 1 일때, 모델이 완벽하게 데이터를 설명함.
# R² = 0 일때, 모델이 데이터를 전혀 설명할 수 없음.
# R² < 0 일때, 모델이 데이터를 설명하는 것보다 평균 값이 더 나은 경우. 이는 모델이 매우 부정확하다는 것을 나타낸다.
'데이터 공부' 카테고리의 다른 글
#6 나이브 베이즈(Naive Bayes)와 베이즈 정리(Bayes Theorem) (0) | 2024.06.10 |
---|---|
#5 (KNN) k-Nearest Neighbors (1) | 2024.06.10 |
#4 Deicison Tree Model (의사결정나무) (1) | 2024.06.10 |
#2 AUC, ROC에 대해 (0) | 2024.06.09 |
#1 Precision과 Recall, F1 Scored에 대해 (2) | 2024.06.09 |