코로나19 해외 유입 신규 확진자 수가 19일 연속 두 자릿수를 기록한 지난달 14일 오후 인천국제공항 입국장에 해외입국자들이 안내를 받고 있다. 인천공항/백소아 기자 thanks@hani.co.kr
코로나19 해외 유입 확진자 수를 미리 예측하는 기술이 개발됐다.
한국과학기술원(카이스트)은 19일 “외국에서 한국으로 입국하는 사람들 가운데 코로나19에 감염돼 확진 판정을 받는 숫자를 2주 전에 미리 예측해내는 프로그램(모델)을 개발했다”고 밝혔다.
이날 0시 현재 국내 코로나19 누적 확진자 수는 1만6058명으로 이 가운데 해외 유입 확진자 수는 전체의 약 17%인 2676명이다. 이재길 카이스트 산업및시스템공학과 교수 연구팀은 외국의 국가별 확진자 수와 사망자 수, 각국의 코로나19 관련 키워드 검색 빈도, 한국으로 향하는 일일 항공편 수, 외국에서 한국으로 들어오는 로밍 고객 입국자 수 등의 빅데이터를 기반으로 인공지능 기술을 적용해 향후 2주 뒤의 해외 유입 확진자 수를 예측하는 모델을 개발했다.
연구팀은 우선 해외 유입 확진자 수가 각국의 코로나19 위험도 및 한국 입국자 수와 비례하는 점에 주목했다. 위험도는 각국의 확진자 수와 사망자 수를 기본으로 하되, 수치가 진단검사 수에 좌우되는 점을 고려해 코로나19 관련 키워드 검색 빈도로 보완했다. 실시간 입국자 수는 기밀정보여서 외부 공개가 금지돼 있다. 연구팀은 매일 제공되는 한국 도착 항공편수와 로밍 고객 입국자 수를 통해 실시간 입국자 수를 유추하는 방법을 사용했다. 연구팀은 “로밍 고객 수는 한국 국적 입국자만 해당돼 항공편수를 함께 고려했다”고 설명했다. 로밍 고객 입국자 수는 케이티로부터 자료 협조를 받았다.
연구팀은 개발한 인공지능 모델에 ‘하이-코비드넷’(Hi-COVIDNet)이라는 이름을 붙이고 한달 반 동안 기계학습과 딥러닝 등 ‘훈련’을 시켰다. 그 결과 확진자 수 상승세와 하락세 등 경향성만 반영한 기존 모델과 비교했을 때 정확도가 35% 향상됐음을 확인했다. 기존 모델이 일차원 방정식으로 푸는 방식이라면 하이-코비드넷은 다차원 방정식을 푸는 모델이다.
연구팀이 실제로 5월6일부터 19일까지 14일 동안의 해외 유입 확진자 수와 하이-코비드넷으로 2주 앞서 예측한 수치를 비교해보니, 일 평균 확진자 수는 5.6명인 데 비해 예측치는 6.6명으로 오차가 1명밖에 나지 않았다. 날짜별로 비교해도 오차가 2명 이하인 경우가 6일(43%)이었으며, 가장 큰 오차도 4.4명에 그쳤다.
연구팀의 논문은 오는 23∼27일 온라인으로 열리는 데이터마이닝 국제 학술대회(ACM KDD 2020) ‘코로나19 시대의 인공지능’ 세션에서 발표된다.
이근영 기자
kylee@hani.co.kr