본문 바로가기

데이터 분석2

#8 Odds and Log(Odds), 오즈와 로그오즈에 대해 오즈의 기본 개념오즈는 특정 사건이 발생할 확률(P)과 그 사건이 발생하지 않을 확률(1-P)의 비율로 정의됩니다.예를 들어, 팀이 경기에서 이길 오즈가 1/4라면, 팀이 한 번 이기는 동안 네 번 질 것이라는 의미입니다. 오즈와 확률의 차이오즈는 사건 발생의 비율을 나타내는 반면, 확률은 전체 가능한 사건 중에서 특정 사건이 발생할 비율을 나타냅니다.예를 들어, 오즈가 2:3인 경우와 확률이 2/5인 경우의 차이를 설명합니다. Odds가 > 1 인 경우, 승리가 더 많은 경우Odds = 1 인경우, 승리와 패배가 동일한 경우Odds가   로그 오즈의 개념로그 오즈는 오즈의 로그 값을 취한 것으로, 오즈의 비대칭성을 해결하고 값들을 좀 더 비교하기 쉽게 만들어줍니다.예를 들어, 2:3의 오즈는 로그를 취.. 2024. 6. 11.
#2 AUC, ROC에 대해 전 시간에 Precision과 Recall, F1 Score에 대해 알아보았다.이번시간엔 AUC와 ROC에 대해 알아보자.그전에 Threshold가 Precison과 Recall에 미치는 영향을 살펴보자.여기 Spam을 분류하는 모델이 있다.TP, TN, FP, FN은 아래와 같다. TP : 8TN : 17FP : 2FN : 3 Precision과 Recall은 아래와 같다.Precision = (TP) / (TP+TN) = 8 / (8+2) = 0.8Recall = (TP) / (TP+FN) = 8 / (8+3) = 0.73 여기서 Threshold (임계값)은 Precision과 Recall에 어떤 영향을 미칠까? Threshold를 증가 시켰을 때를 보자. TP : 8 -> 7TN : 17 -> 1.. 2024. 6. 9.