작성자 |
|
||
---|---|---|---|
작성일 | 2012-09-11 23:43:15 KST | 조회 | 434 |
제목 |
미러문님께 드리는 승률 데이터의 맹점.
|
스타리그를 예로 들어봅시다.
흔히 예상되는 시나리오 중 하나로,
임재덕 탈락, 16강에서 박수호가 이겨서 진출하고, 8강에서 테란을 3:2로 이기고 4강에서 테란에게 3:0으로 탈락해서 저그가 전멸한 상황이 온다고 가정합시다.
하지만 승률을 살펴보게 되면
박수호 대 허영무 박수호 승
박수호 대 정윤종 정윤종 승(P)
박수호 대 이정훈 박수호 승
임재덕 대 정명훈 정명훈 승(T)
임재덕 대 김성현 김성현 승(T)
임재덕 대 김학수 임재덕 승
박수호 대 테란 3:0
박수호 대 테란 2:3
데이터 없음
이 경우 스타리그의 최종 종족 승률은
Z : P 저그 75% 우위
Z : T 저그 55% 우위
이렇게 계산됩니다.
저그가 16강 최소 종족으로 4강에서 전멸했음에도 승률이 가장 높은 저그 씹사기가 완성되는 순간이죠.
이는 최초에 승률에 반영되어야 할 경기들이 누락되어 불균형인 비율 상태에서 출발했기 때문에 나오는 기형적 현상으로, 일명 '쿨라스 협곡 현상'이라고 합니다. 종족 비율이 처음부터 낮은 경우 해당 종족의 승률이 높게 보정되는 현상이죠.
그래서 궁극적으로 모든 대회들을 다 더하고 더하면 50%에 가깝게 나올수밖에 없게 됩니다. 통계학적으로 1000개 정도의 데이터가 쌓이면 모집단에 대한 대표성을 띠게 되는 현상이 존재하는데, 마찬가지로 1000전이 넘어가는 승률 데이터가 쌓이게 되면 밸런스에 상관없이 50%, 50%, 50%에 수렴하는 현상이 일어나게 됩니다.
http://www.sc2ratings.com/stats.php?racedays=
여기 들어가셔서 날짜를 높여보시기 바랍니다.
스타2 메이저 대회의 승률을 총 망라한 데이터인데, 날짜를 높일수록 50:50:50에 가까워지는 것을 경험하실 수 있을겁니다.
이것이 종족별 승률의 근본적인 맹점입니다.
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
© PlayXP Inc. All Rights Reserved.