Skip to main content

[Tech Team Insight #3] 코로나를 뚫고 달려보자 - 4기 최강현, 5기 이길원

 

코로나를 뚫고 달려보자

 

코로나 확찐자라는 말을 들어본 적이 있는가? 네이버 오픈 사전에 따르면 코로나19 감염 우려로 외출을 자제하면서 집안에서만 생활을 하다 보니 활동량이 급감해 살이 사람을 낮잡아 이르는 설명한다[1]. 신조어가 보여주는 것처럼 COVID-19바이러스의 세계적 유행 (이하 코로나’, ‘코로나 사태 칭함)으로 인하여 달라진 세태는 바이러스 감염을 통한 직접적인 신체적 위협뿐만 아니라 활동량 부족과 사회적 소외로부터 발생하는 간접적인 위협을 촉발했다. 이러한 간접적인 위협들은 동네 산책이나 짧은 달리기로 해결할 있지만, 코로나 사태는 이마저도 쉽지 않게 만든다.

따라서 이번 SDP Tech Insight에서는 인구 밀집 지역을 회피하는 개인화된 러닝 루트를 추천하여 데이터 사이언스적 방법론으로 문제를 해결하려는 노력에 대해서 다루고자 한다.

 


그림 1 인구밀집지역을 회피하는 러닝루트가 필요하다

 

인구 밀집도 예측


코로나 사태 이후의 대표적인 키워드인 재택근무, 외출 자제, 사회적 거리두기는 모두 바이러스 감염 확률을 줄이기 위해 인구 밀집도를 낮추려는 노력을 보여준다. 이처럼 코로나와 인구밀집도는 높은 관련성이 있기 때문에 러닝 루트를 추천하기에 앞서 인구 밀집 지역을 정확하게 예측하고 이를 고려하여 러닝 루트를 추천해야 한다.

인구 밀집지역을 예측하기 위하여 기존에 구축된 데이터를 통계적 관점과 도시공학적 관점으로 재해석하였다. 예측에 사용한 데이터는 서울시에서 제공하는 유동인구 측정 데이터[2]로서, 서울시 내의 10,000 지점에 대해서 요일별 / 시간대별 유동인구 측정치를 제공한다. 지역별 유동인구는 요일과 시간대뿐만 아니라 날씨나 휴일과 같은 수많은 변수들로 인해 변화하므로 정확한 예측이 어렵다. 따라서 요일과 시간대를 주요 변수로 보아 데이터 분석에 활용하고 다른 변수들은 추후 연구를 위하여 남겨둔다.

프로젝트에서 유동인구를 예측하는 방법은 전통적 교통 수요 예측을 활용한 지역 단위 유동인구 예측과 데이터 히트맵을 사용한 세부단위 예측이다.

먼저 전통적 교통 수요예측 방법론에 기반하여 데이터를 산출한다. 우선 도로망을 기준으로 서울시 지역을 구획으로 나눈다.

그림 2 도로망 기준 지역단위 예시

그림2 도로 구조를 바탕으로 지역 단위를 나누는 예시이다. 이렇게 구성한 그래프 구조를 바탕으로 (1) 구획 통행 발생 예측 보행교통 수요 변환, (2) 구획 간의 인구 유출입 통행 분포 예측, (3) 이동 수단 선택, (4) 노선 배정 예측을 통한 수요 분산 시뮬레이션 단계를 거쳐 구획에 대하여 유동인구를 예측할 있다.

그림 3 서울시 도로망 교통수요

이를 통하여 그림 3 같이 구획단위의 유동인구 산출이 가능하다.

그러나 방법은 실제 유동인구가 아니라 자동차 통행량을 기반으로 하고, 국지도로나 보행로와 같은 작은 단위에 대해서는 예측이 어렵다는 단점이 있다. 따라서 유동인구 데이터 포인트를 이용하여 히트맵을 생성하여 보완할 있다.


그림 4시간별 유동인구 히트맵

그림 4 유동인구 데이터를 활용하여 시각화한 유동인구 히트맵이다. 앞서 산출한 교통 수요예측 데이터와는 다르게 유동인구의 분포가 연속적이고 세부적인 것을 확인할 있다. 이러한 방식은 구나 단위의 유동인구 분포와 이동은 예측하기 어렵지만 작은 국지도로나 보행로에 대한 예측에서는 강점을 가진다. 따라서 앞서 분석한 전통적 교통 수요예측 방법론에 더하여 데이터 히트맵을 사용한다면 서울시 내의 전반적인 유동인구 발생을 반영하면서 작은 단위인 국지도로와 보행로의 유동인구를 비교적 정확하게 예측할 있다. 데이터를 활용하면 실시간 인구 밀집 지역을 피하여 러닝 루트를 추천할 있다.

 

러닝 루트 추천

 

실제 유동인구를 예측한 후, 예측한 데이터를 활용하여 러닝 루트를 찾는 것은 또 다른 문제가 된다. 러닝 루트를 찾는 것은, 유동인구 히트맵을 활용해 얻어낸 인구이동 데이터를 그래프로 모델링 하는 문제, 모델링 된 그래프에서 러닝 루트를 찾는 문제로 나눌 수 있다.

해당 프로젝트에서 그래프(Graph)를 모델링 한다는 것의 의미는, 실제 위치를 나타낼 수 있는 정점(vertex), 그 정점들을 잇고 있는 간선(edge)으로 구성한다는 의미와 같다. 이 때 정점은 실제 좌표와 일정한 면적을 갖는 속성이 되고, 간선은 그러한 정점들 간에 연결되는 도로가 있는 경우 생성되는 것으로 생각할 수 있다.

비슷한 기능을 구현한 프로젝트 중, 배달의 민족에서 제공하는 길 찾기 기능[3]을 참고할 수 있었다. 해당 프로젝트의 그래프는 특정 좌표를 기준 좌표로 하여, 육각형 꼴의 범위를 갖는 정점을 이어 붙이는 식으로 정의한다. 다음으로, 정점들 사이에 이동을 제한하는 구조물(, 건물 등)이 있는 경우가 아니라면, 인접한 정점으로 움직일 수 있게 간선을 구성하였다. 이를 참고하여 그래프를 모델링 할 수 있다.


그림 5. 모델링한 그래프 시각화

그림 5 위에서 설명한 그래프를 모델링하여 시각화한 내용이다. 이동이 제한되는 정점은 빨간색으로 표시된다. 이렇게 모델링 그래프에서 적절한 러닝 루트를 찾아야 한다.

길을 찾는 알고리즘에는 다양한 알고리즘이 있으나, 프로그램이 대상으로 하는 범위가 크지 않기 때문에 널리 알려진 다익스트라(Dijkstra) 알고리즘을 활용하여 러닝 루트를 추천한다. 실제로 요청이 매우 많은 프로그램에선 A*(A star)라는 알고리즘이 사용된다. 해당 알고리즘이 다익스트라 알고리즘에 비해 효율적으로 동작하지만, 임의로 휴리스틱(heuristics) 거리의 정의를 내려야 하기 때문에 직접 사용하는 어려움이 있다. 일반적인 다익스트라 알고리즘은 단순히 정점 최단 경로를 찾아주는 알고리즘이지만, 간선의 가중치에 적절하게 유동인구를 배치하여, 실제 이동 거리와 사이의 유동 인구 밀집까지 고려하는 러닝 루트를 제공해 있다.

 

그림 6. 추천 러닝루트 시각화.

 

그림 6 같이 러닝 루트로 추천할 없는 지역(건물, 도로가 없는 ) 제외한 구역에서 러닝 루트를 추천할 있다. 그림 6에서 시작점은 중앙의 회색 점이고, 도착 지점은 짙은 회색으로 표시되어 있다. 해당 기능을 구현해주는 함수를 활용해 사용자가 출발점, 도착점을 입력하면 러닝 루트를 추천해줄 있다.

아쉽게도 해당 프로젝트를 배포, 상용화하는 데에는 이르지는 못했으나, 여전히 발전 여지가 매우 많은 프로젝트라고 생각된다. 가능하다면 빠른 시일 내에 베타 버전을 만들어 학회에서 테스트 여러 피드백을 받아 상용화할 있었으면 하는 바람이다.



[1] https://ko.dict.naver.com/#/userEntry/koko/6a75ae81b4bf2e44b57c80150cbdc929

[2] http://data.seoul.go.kr/dataList/OA-13288/F/1/datasetView.do

[3] https://woowabros.github.io/experience/2019/02/07/real-distance-finder.html

Comments

Popular Posts

[Research Team Insight #1] The A to Z of SDP Research Team

[10월호, 2020년] 세계시민의식과 SDGs에 대해 묻다: 강동렬 UN SDSN Youth Korea 총괄 인터뷰 - 4기 유재희, 이소정

 "개인의 움직임은 과연 얼마나 중요할까?" 위의 질문에서부터 본 인터뷰는 시작된다. SDP는 현재 지속가능발전 글로벌 리더가 되고자 거시적인 시각에서 에너지와 인프라에 관심을 가지고 활동하고 있다. 우리는 다양한 외부 기관으로부터 지지를 받으며 유의미한 성과를 내고 있지만, 혹 멀리서 커다란 모습에만 집중한 나머지 개개인이 일상에서 지속가능함을 위해 노력하는 미시적인 움직임을 놓치고 있는 것은 아닐까. 세계시민의식을 가지고 살아간다는 것은 어떠한 의미인지, 우리가 생활에서 실천할 수 있는 방법은 무엇일지 고민하게 되었다. 강동렬님은 세계시민교육가이자 지속가능발전활동가로, UN SDSN Youth Initiative 한국 총괄로 계시며 SDP의 활동에도 언제나 많은 도움을 아끼지 않으신다. SDP는 지난 8월, 재생에너지와 시민의식을 주제로 동렬님을 모시고 공개 세미나를 추진하였으나 코로나19 상황 악화로 인해 잠정 연기한 일이 있다. 우리의 질문과 맞닿아 있는 세미나를 기다리며, 동렬님이 중요하게 생각하시는 가치와 활동은 무엇인지 SDP가 작은 인터뷰를 통해 들어보고자 하였다. 4기 유재희, 이소정

[3월호, 2021년] #32 딥 페이크(Deep Fake)와 디지털 포렌식(Digital Forensic) - 7기 진희주

  딥 페이크(Deep Fake)와 디지털 포렌식(Digital Forensic) 7기 진희주 아래 사진 중 무엇이 실제 오바마의 사진일까 ? 네 장 모두 딥 페이크 기술을 통해 인공지능이 만든 오바마의 사진이다 . 딥 페이크 (Deep Fake) 는 Deep Learning 과 Fake 의 합성어이다 . 딥 페이크는 AI 를 이용해 특정인의 얼굴이나 목소리를 합성한 사진 , 영상 , 음성 편집물 및 그 기술을 통칭하는 단어이다 . 딥 페이크 기술은 새로운 유형의 신경망 ( 머신러닝 알고리즘 ) 발전으로 가능해졌다 .   딥 페이크 기술을 활용하면 유명인의 얼굴을 대역에 합성해 손쉽게 영상을 만들거나 세상에서 사라진 멸종 위기 종이나 과거의 사람들을 생생하게 재현할 수도 있게 된다 . 여러 사람의 얼굴을 통해 가상의 얼굴을 제작하여 사용하거나 스타일 트랜스퍼 (Style transfer) [1] 를 활용해 겨울을 여름으로 , 또는 화창한 날을 비 오는 날로 묘사하는 등 이미지의 환경적 맥락을 바꿀 수 있는 등 딥페이크 기술의 영상 • 사진 산업 분야의 활용도와 가치는 무궁무진하다 .   하지만 딥 페이크는 엄청난 힘에 걸맞게 악용 가능성이 높아 그 위험성에 대한 논란이 최근 활발하게 이뤄지고 있다 . 대표적인 악용사례는 유명 연예인을 합성한 불법 포르노 , 전•현직 대통령의 얼굴을 합성한 가짜뉴스 영상 등으로 사회를 큰 혼란에 빠뜨릴 수 있음을 보여준다 . 딥 페이크 범죄의 대상은 유명인을 넘어 점차 일반인에게까지 확장되고 있다 . 헤어진 연인 , 또는 지인의 얼굴을 다른 나체 사진이나 성인물 동영상과 합성하여 만든 딥 페이크 제작물을 온라인 상에서 유통하거나 이를 통해 협박하는 등 딥 페이크 영상은 점차 심각한 사회적 문제로 대두되고 있다 . 2019 년 4 월 국내에서 큰 논란이 되었던 텔레그램 N 번방 사건에서도 딥페이크를 악용한 사진이 거래 , 유포된 정황이 확인되어 그 심각성이 전면으로 드러나게 되었다 .   딥 페이크 기

[11월호, 2020년] Countermeasures against urbanization: Air pollution in Seoul - 5기 함이수

Countermeasures against urbanization: Air pollution in Seoul 55% of the world population resides in urban areas as of 2018, according to a UN report. The overly populated urban population has given rise to problems that people were not aware of in the past. Especially, the impacts of urbanization on the environment are slow to be seen thus has been accumulating, invisible to the human eye. What has been done to address these problems? Furthermore, how should we approach these issues henceforward?

[Research Team Insight #2] Project MaPPPing and the role of Research Team - 5기 권경민, 6기 김예빈

1.       What is Project MaPPPing   SDP is constituted of students who have great interest in sustainable development, and we refer to the SDG goals articulated by the UN as the global standard for sustainable development. This year, we have specifically focused on goal number 9 and 11 that emphasizes the role of infrastructure in sustainable development [1] . We believe that sustainable and resilient infrastructure is at the heart of sustainable growth, so we have launched a project called Project MaPPPing in December 2019.