본문 바로가기
인공지능 (AI)

47번째 이야기 - 인공지능과 월드컵 승부예측

by Ψβ⅓ 2024. 6. 2.

왜 인공지능은 월드컵 승부예측을 잘 못하는걸까?

인공지능이 잘하는 분야는 그냥 눈 감고도 이제는 '분류''예측'이라고 말할 수 있습니다.

이번 글에서는 요즘 한창인 월드컵과 관련해 말씀드리고자 합니다.

- 월드컵에서의 분류는 대표적으로 오프사이드냐 아니냐를 나누는데 활용될 수 있겠네요. 이번에 도입된 반자동 오프사이드 시스템이 대표적입니다.

- 월드컵에서의 예측은 바로 승부 예측 또는 16강 진출 예측, 예상 스코어 예측, 우승국 예측 이런 것들이 있을 수 있겠습니다.

이번 월드컵에서 기업들이 내놓은 인공지능 모델들이 내 놓은 승부예측 결과를 살펴본다면 인공지능의 갈 길은 아직 먼 것 같습니다. 왜 그럴까요? 축구공은 둥글기 때문입니다.

이번 월드컵은 이변이 속출하고 있습니다. 사우디의 아르헨전 승리, 일본의 독일전 승리, 한국과 우루과이의 무승부 뿐만 아니라 간밤 모로코와 프랑스의 대결에서 1-0으로 모로코가 승리한 것을 봐도 그렇습니다. 과연 어느 인공지능 모델이 모로코의 승리를 예측이나 했을까요?

엘지(LG)유플러스 스포키의 인공지능 승부예측 서비스(익시)의 적중률을 따져본 결과, 현재까지 총 28경기 중 15경기(53%)만이 승부예측 결과가 일치했습니다.

예상 스코어 적중률은 더 떨어집니다. 경기당 발표된 3개 예상 점수 가운데 총 28경기 중 하나라도 점수가 일치한 경기는 11경기(39%)뿐이었습니다.

수 많은 학습 데이터로 훈련한 모델들은 아마 서비스에 나서기 전 성능 검증을 모두 훌륭하게 마친 꽤나 괜찮은 인공지능 모델일 가능성이 높습니다. 그런데 왜 예측은 자꾸 빗나가는 것일까요?

일단 방금 제가 성능검증을 마친 훌륭한 인공지능 모델이라고 말씀드렸는데요, 사실 이 말을 좀 곱씹기 위해서는 머신러닝에서의 외삽과 내삽을 자세히 살펴볼 필요가 있습니다.

- 머신러닝에서의 내삽(Interpolation)은 어느 데이터를 사용해 훈련시킨 머신러닝 모델의 출력의 결과가 그 훈련 데이터의 수치 범위 안에 있는 것을 말합니다.

- 머신러닝에서의 외삽(Expolation)은 어느 데이터를 사용해 훈련시킨 머신러닝 모델의 출력의 결과가 그 범위 밖의 수치 범위 안에 있는 것을 말합니다.

 

머신러닝 모델

 

 

위 그림에서 머신러닝 모델은 초록색으로 일종의 선형회귀 직선을 만들어냈습니다. 이 직선형태의 모델은 훈련 데이터 범위 안과 밖의 데이터에 대해서도 예측가능할 수 있는 것으로 보입니다.

- 하지만 사실 훈련데이터 범위 밖에 있는 훈련한 적 없는 데이터에 관해서는 정확하게 예측하지 못합니다.

- 정확도를 톺이려면 다시 훈련한 적 없는 데이터도 포함해 재학습하고, 파란점과 오렌지 색의 점을 모두 내삽의 범위 안에 위치하도록 해야 합니다.

- 정리하자면 "학습된 데이터 범위내에 있다면 보다 정확히 예측할 수 있으나(=내삽), 배운적이 없는 것은 당연히 짐작으로 대답할 수 있으나 이 답은 그다지 신용할 수 없다(=외삽)"

, 성능검증을 마친 훌륭한 인공지능(승부 예측) 모델은 내삽에 대해서는 훌륭한 성능 검증을 마친 모델이라는 의미입니다. 우리가 원하는 승부 예측 결과는 외삽의 범위에서 이루어지는 것이고, 그러니 결과는 떨어질 수 밖에 없습니다.

(..) 이해가 갑니다. 그런데 말입니다. 사실 머신러닝은 보통 예측할 수 없는 미래의 상황에 대해 외삽하는 경우가 많습니다.

- 조금 오버해서 말씀드리면 사실 그것이 목적이기까지 합니다.

- 만약 외삽은 위험하다는 이유만으로 그 결과를 신뢰할 수 없다 말한다면 좀 궁색해집니다. 머신러닝을 해야 할 이유 중 큰 기둥이 사라져버리기 때문이죠.

외삽은 위험하다는 사실을 차치하고 나서라도, 왜 승부 예측 결과가 자꾸 틀리는지에 대한 또 다른 이유가 있을까요?

 

 

외삽은 위험하다는 사실을 차치하고 나서라도, 왜 승부 예측 결과가 자꾸 틀리는지에 대한 또 다른 이유가 있을까요?

- 인공지능은 데이터의 특성(=feature)을 뽑아내어 이를 근거로 아웃풋(=예측 결과)을 도출합니다.

- 중요한 특성을 무엇으로 할 것인가를 결정하는 것은 딥러닝에서는 머신이지만, 머신러닝에서는 사람이 합니다. 이를 특성 공학(피처 엔지니어링)이라고 부른다 했습니다.

- , 승부예측의 중요한 요소를 축구 전문가가 뽑아야 합니다. 여기에서 모델의 성능이 결정된다 볼 수 있습니다.

결론부터 말씀드리면 보통의 인공지능(승부 예측) 모델들은 월드컵 출전국과 선수들의 경기 데이터를 바탕으로 승리·패배·무승부 확률을 도출합니다. , 기존 데이터를 기반으로 새로운 데이터 값을 예측하도록 모델을 학습시키는 예측분석기법인 것이죠.

그런데 축구는 변수가 많습니다. 이를 모두 수치화하여 데이터의 변수로 삼는 것은 참 어렵습니다.

- 그 변수를 대표할 수 있는 데이터 필드를 찾는 것이 일단 어렵습니다. , 모든 변수 데이터를 수치화하기도 어려우며, 그렇게 했다 하더라도 차원의 저주에 걸려 계산 복잡도가 기하급수적으로 증가할 가능성이 높습니다.

- 데이터에 포함되지 않는 선수들의 사기와 당일 컨디션, 경기장 환경 등의 변수는 승부에 큰 영향을 미칠 수 있습니다.

- 실제로 스포키 승부 예측은 출전국들의 월드컵 경기와 국가대표 간 경기 기록들을 기초 데이터로 삼고, 지역별 축구리그와 선수들의 기록 등을 보정지표로 삼고 있다 합니다.

또한 데이터의 불균형도 예측 성능을 떨어뜨리는 데 한 몫 합니다.

- 아프리카나 아시아 국가들이 인공지능의 예측과는 달리 선전한 것도 유럽에 비해 상대적으로 축구에 관한 데이터가 부족한 것이 원인으로 지목되고 있습니다.

- , 잘 알려지지 않아 데이터를 충분히 구할 수 없는 나라들의 경우 보정할 수 있는 지표(특성)들이 불충분하기 떄문에 아무래도 오차가 많이 발생할 수 밖에 없을 겁니다.

- 데이터가 많이 축적되면 예측 정확률이 아무래도 높아질 것이라 기대는 하고 있습니다만(..)

인공지능이 월드컵에서의 승부예측이 시원치 않은 이유. 머신러닝에서 외삽의 한계와 위험성, 축구에서의 다양한 변수, 데이터의 불균형입니다.

사실 이 이유들은 월드컵 승부예측에만 한정하지 않더라도 현실 복잡계를 예측하는 머신러닝의 세계에서 주제를 불문하고, 얼마든지 일반화할 수 있는 통찰이기도 합니다.

댓글