[이데일리 강민구 기자] 한국과학기술원(KAIST)의 이재길 산업·시스템공학과 교수팀은 자체 개발한 인공지능 모델에 KT의 로밍 고객 입국자수 데이터를 적용해 2주간 확진자 수를 예측했다.
현재 KT와 후속 연구로 국내 확진자 접촉자를 선별해 지역 감염 확산을 빠르게 예측할 수 있는 연구도 추진하고 있다. 국내 감염 확산 추세를 파악하기 위한 핵심 연구로 스마트폰 사용 데이터 정보를 기반으로 확진자 접촉 여부를 확인할 계획이다.
빅데이터에 인공지능 기술 결합
연구팀에 의하면 코로나19 종료시점은 다양한 변수, 데이터 프라이버시 문제 등으로 예측하기 어렵다는 특성이 있다. 해외 유입 확진자수는 국외 발생에 대한 변수를 없앴다는 점에서 보다 정확한 확진자 수 예측에 활용할 수 있다.
중앙재난안전대책본부에 따르면 국내 코로나 누적 확진자 수는 18일 오전 0시 기준 총 1만 5761명이다. 이 중 해외유입 감염자 수는 2662명으로 전체 확진자의 16.9%를 차지한다. 대륙별로 보면 아시아(중국 외), 미주, 유럽, 아프리카 순이다. 지난 14일 이후 국내 지역 발생 신규확진자 수가 급증하고 있지만 해외유입 확진자 수의 확산추세도 장담할 수 없는 상황이다.
이에 연구팀은 해외 각국의 확진자 수와 사망자 수, 해외 각국에서의 코로나19 관련 키워드 검색빈도와 한국으로의 일일 항공편 수, 해외 각국에서 한국으로의 로밍 고객 입국자 수 등 빅 데이터에 인공지능 기술을 적용한 예측 기술을 선보였다. 연구팀은 개발한 인공지능 모델을 ‘Hi-COVIDNet’라고 이름 붙이고, 지난 3월 22일부터 5월 5일까지 약 한 달 반에 걸친 단기간의 훈련 데이터를 적용해 5월 6일부터 5월 19일까지 2주 동안의 해외유입 확진자 발생을 예측했다.
실시간 입국자 수는 기밀정보로 외부에 공개되지 않기 때문에 매일 제공되는 한국에 도착하는 항공편수와 로밍 고객 입국자 수를 통해 이를 유추했다. 로밍 고객 입국자 수 데이터는 KT에서 제공받았지만 KT 고객 입국자만을 포함한다는 한계를 일일 항공편수를 함께 고려함으로써 이 문제를 해소했다.
이밖에 해외유입 확진자 수 예측을 위해서는 국가 간의 지리적 연관성도 매우 중요하게 고려해야 한다. 어느 특정 국가의 코로나19 발병이 이웃 국가로 더 쉽게 전파되며, 국가 간의 교류도 거리에 따라 영향을 받기 때문이다. 연구팀은 이런 문제 해결을 위해 지리적 연관성을 학습하도록 국가-대륙으로 구성되는 지리적 계층구조에 따라 우선 각 대륙으로부터의 해외유입 확진자 수를 정확히 예측함으로써 궁극적으로 전체 해외유입 확진자 수를 정확히 예측하도록 하는 인공지능(AI) 모델을 설계했다.
그 결과, 3명~11명 수준의 확진자가 증가할 수 있다는 분석이 나왔다. 실제 환자 발생값과 예측값을 비교한 결과, 기존 시계열 데이터기반의 예측 기계학습이나 딥러닝 기반의 모델과 비교했을 때 최대 35% 정확성이 더 높은 것이다.
이 교수팀이 개발한 모델은 방역 시설·격리 시설 확충, 고위험 국가 입국자 관리 정책 등에 응용할 수 있다.
이 교수는 “코로나19가 2차 유행될 조짐을 보이는 가운데 해외 유입자도 폭발적으로 증가할 가능성이 있다”며 “이번에 개발한 예측 기술에 데이터 획득이 추가로 이뤄지면 실시간 분석·예측 서비스를 수행할 수도 있고 정확한 질병 예측 연구에 도움이 될 것”이라고 말했다.
news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=105&oid=018&aid=0004717230
zdnet.co.kr/view/?no=20200819101825
dm.kaist.ac.kr/lab/papers/kdd20_covid.pdf
blog.naver.com/tiled12/222149849140
'기타' 카테고리의 다른 글
ERP (Enterprise Resource Planning, 전사적 자원관리) (1) | 2024.11.23 |
---|---|
오픈 API의 개념과 활용 (0) | 2021.02.14 |