물 자연 그리고 사람 - 물로 더 행복한 세상을 만들어가겠습니다.
HOME성과논문실적

논문실적

기계학습을 활용한 하천에서의 유해 조류 대발생 예측 및 합성 데이터를 통한 모델 정확도 개선 게시글의 제목, 학술지명, 저자, 발행일, 작성내용을 보여줌
기계학습을 활용한 하천에서의 유해 조류 대발생 예측 및 합성 데이터를 통한 모델 정확도 개선
학술지명 한국물환경학회 저자 김진휘,이한규,이정원,박용은,신재기
발표일 2020-11-06

국내에서 발생하는 조류 경보제는 전국 4대강 보 모니터링 자료를 기반으로 발령되며 상수원 구간과 친수활동 구간으로 구분하여 발령한다. 조류 경보제는 유해 남조류의 세포 수에 따라 상수원 구간에서는 관심, 경계, 조류 대발생의 3단계로 나뉘며 각각의 기준은 1,000세포/mL, 10,000세포/mL, 1,000,000세포/mL이다. 친수활동 구간에서는 유해 남조류의 세포 수가 20,000세포/mL, 100,000세포/mL 이상일 경우 관심, 경계 단계를 발령한다. 현재 운영되는 조류 경보제는 사전적 예측보단 조류 발생 시, 대응을 위한 수단으로 사용되고 있으며 이를 통해 모니터링 주기 확대, 오염원 관리 강화 및 조류 제거 등을 수행한다. 본 연구에서는 물환경정보시스템에서 제공하는 전국 보 모니터링 종합정보 자료를 활용하여 보에서의 남조류 경계단계(Cyanobacteria Level)에 대하여 사전적 예측을 수행하였고 자료의 불균형을 해결하기 위해 측정 자료를 기반으로 생성된 합성 자료를 활용하여 모델의 정확도를 개선하였다. 이를 위해 2013년부터 2019년까지 측정된 수질 항목, 수리수문 정보 및 기상 자료를 활용하였으며 기계학습 기법의 일종인 인공신경망을 사용하여 예측 모델을 구축하였다. 모델 구축에 사용된 남조류 경계 단계 자료의 수는 총 354개이며 남조류 세포 수에 따라 L0(0-1,000세포/mL), L1(1,000-10,000세포/mL), L2(>10,000세포/mL)로 구분하였으며 각각의 level에 해당하는 자료의 수는 L0가 205개(57.9%), L1이 62개(17.5%), L2가 87개(24.6%)로 자료가 불균형하게 분포하였다. 이는 예측 모델의 구축에 있어 모델의 불균형 학습을 발생시키며 이를 해결하기 위해서 본 연구에서는 Adaptive Synthetic(ADASYN) 기법을 활용하여 L1과 L2에 해당하는 합성 자료를 각각 90개, 28개를 생성하였다. 예측 모델 구축에 사용된 총 자료의 수는 472개이며, 기계학습 기법 중 ANN 모델을 사용하였다. 합성 자료가 포함되지 않은 354개의 자료로 구축한 모델의 정확도는 74%이며 이중 L0를 예측한 건수가 전체 자료 중 54%로 가장 많았으며 이는 모델의 정확도가 L0의 예측 여부에 편향됨을 의미한다. 472개의 자료를 활용하여 구축한 모델의 평균 정확도는 80%로 이전 모델보다 수치상으로 크게 증가하지 않았지만, L1의 예측 정확도는 42.6%에서 68.3%로 증가하였다. 본 연구의 결과는 하천에서의 유해 남조류 대발생의 사전 대응을 위한 예측 모델로 활용될 수 있으며, 축적된 모니터링 자료를 기반으로 하여 생성된 합성 자료를 통해 정확한 조류 발생 예측이 가능하다.

목록