민감도 99% 검사에서 '양성'으로 판정되면 실제로 감염되었을까?
감염자 100명에 대해 99명을 올바로 양성으로 판정
인구 10만 명당 100명의 감염자가 존재하는 감염증이 있다. 어떤 감염 검사를 했을 때 감염되었을 경우에는 '양성', 감염되지 않았을 경우에는 '음성'이라고 판정된다.
단, 이 감염 검사에는 오류가 항상 따라 다닌다. 실제로는 감염되지 않은 100명의 비감염자가 이 검사를 받으면 97명은 올바로 음성으로 판정된다(진짜 음성). 그러나, 3명은 양성으로 잘못 판정된다(가짜 양성). 이것을 전문용어로 '특이도 97%'라고 한다.
한편, 실제로 감염된 100명의 감염자가 이 검사를 받으면 99명은 올바로 양성으로 판정된자(진짜 양성). 그러나 1명은 음성으로 잘못 판정된다(가짜 음성). 이것을 '민감도 99%'라고 표현한다.
특이도 감도 개념은 아래 링크 참조
https://aeir.tistory.com/entry/%ED%86%B5%EA%B3%84-%EC%98%A4%EC%B0%A8%ED%96%89%EB%A0%AC-confusion-matrix
'양성'으로 판정되었다면 실제로 감염되었을 확률은?
당신이 이 검사를 받았더니 '양성'이라고 판정되었다. 이때 당신이 실제로 감염되었을 확률은 어느 정도일까? '민감도99%
의 검사'에서 양성이라고 판정되었다면 거의 확실하게 감염되었다고 생각하기 쉽다. 그러나, 실제로 계산해 보면 그 생각은 잘못된 생각이다.
베이즈 정리를 사용하면, '실제 감염되었을 확률'을 구할 수 있다.
10만 명이 검사를 받으면 몇 사람이 양성으로 판정될까?
10만 명 가운데 실제로 감염자는 100명이다. 이 100명이 검사를 받으면 99명이 올바로 양성이라고 판정된다(진짜 양성).
한편, 10만 명 중 실제로 비감염자는 9,900명이다. 이 사람들이 모두 검사를 받으면 그 중 3%에 해당하는 2,997명이 양성이라고 잘못 판정된다(거짓 양성).
따라서, 양성이라고 판정된 사람의 합계는 99명(진짜양성) + 2,997명(거짓 양성) = 3,096명이다.
실제 감염되었을 확률은 약 3.2%
이 검사에서 양성으로 판정받은 3,096명 가운데 실제로 감염된 사람들은 진짜 양성인 99명이므로, 구하는 확률은 99/3,096 ~ 3.2%이다. 양성이라고 판정되었더라도 실제 감염되었을 확률은 불과 3% 정도이다.
양성 판정으로 감염률은 0.1%에서 3.2%로 상승
원래 이 감염증의 감염률(사전 확률)은 0.1%로서, 검사를 받기 전 당신은 0.1%의 확률로 감염되어 있음을 의미했다.
그러나, 이 검사를 받고 양성이라고 판정된 결과, 당신의 감염확률은 약 3.2%(사후 확률)로 상승한다.
이처럼 어떤 일이 일어남에 따라 사전 확률은 사후 확률로 바뀐다. 이것이 베이즈 통계의 큰 특징이다.
베이즈 정리를 사용해 계산해 보기
P(감염) = 1/1000 ; P(비감염) = 999/1000
이제 양성이라고 판정될 확률은
1) 감염되었을 때 P(양성 | 감염) = 99/100
2) 감염되지 않았을 때 P(양성 | 비감염) = 3/100
따라서, 양성이라고 판정되었을 때 감염되었을 사후 확률은 다음과 같다.
P(감염 | 양성) = 0.032
이러한 사후 확률을 구하는 방법은
P(감염 | 양성)
= P(감염) x P(양성 | 감염) / P(양성)
= P(감염) x P(양성 | 감염) / { P(감염) x P(양성| 감염) + P(비감염) x P(양성 | 비감염) }
= 1/1000 x 99/100 / { 1/1000 x 99 /100 + 999/1000 x 3/100 }
= 99/3096
= 0.032
재검사에서 '다시 양성'인 경우, 감염 확률은 어떻게 될까?
당신은 이 검사에서 양성이라고 판정되었지만, 실제로 감염되었을 확류은 3.2%였다. 그런데 재검사를 받고 다시 양성으로 판정되었다고 하자. 이제 당신이 실제로 감염되었을 확률은 얼마일까?
2회째도 양성이면 감염 가능성은 농후해 진다.
처음 검사에서 양성이라 판정되었던 3,096명 가운데 실제로 감염자는 99명이다. 이 99명의 감염자가 재검사를 받으면 약 98명은 양성이라고 올바로 판정된다(진짜 양성). 한편, 3,096명 가운데 실제 비감염자는 2997명이었다. 이 2997명의 비감염자가 재검사를 받으면 그 3%에 해당하는 약 90명은 양성으로 잘못 판정된다(가짜양성).
따라서, 2회째 검사에서 다시 양성이라고 판정되는 사람의 수는 약 98명(진짜 양성) + 약 90명(가짜양성) = 188명이다.
당신은 이 188명 중 1명이다.
2회째 양성 판정을 받은 사람이 실제로 감염되었을 확률은 98/188 ~ 52%가 된다. 59%를 넘어 실제로 감염되었을 가능성이 커진다.
베이즈 정리를 사용해 계산해 보기
앞의 계산 식에서 0.1%를 3.2%로 바꾸고 베이즈 정리를 사용해 계산하면 된다.
P(감염) = 99/3096 ; P(비감염) = 2997/3096
이제 양성이라고 판정될 확률은
1) 감염되었을 때 P(양성 | 감염) = 99/100
2) 감염되지 않았을 때 P(양성 | 비감염) = 3/100
따라서, 양성이라고 판정되었을 때 감염되었을 사후 확률은 다음과 같다.
P(감염 | 양성) = 0.52
이러한 사후 확률을 구하는 방법은
P(감염 | 양성)
= P(감염) x P(양성 | 감염) / P(양성)
= P(감염) x P(양성 | 감염) / { P(감염) x P(양성| 감염) + P(비감염) x P(양성 | 비감염) }
= 99/3096 x 99/100 / { 99/3096 x 99 /100 + 2997/3096 x 3/100 }
= 9801/18792
= 0.52