Phase4로의 도약을 위한 재정비
-
7기 강민정, 박주미
새학기가 시작되고도
벌써 한달이 흘러 거리에 꽃이 하나 둘 피어나는 봄이 찾아왔습니다! 봄은 언제나 새로운 시작으로 설레는
계절인 것 같습니다. SDP 또한 이번 3월부터 새로운 프로젝트에
착수했습니다. SDP의 Project MaPPPing은 지난 1년간 Phase 1, 2, 3을 차례로 밟으며 발전해왔습니다. Phase 1과 2에서는
World Bank 인프라 팀과 협력해 PPI Deal Tracking을 진행했으며 Phase 3에서는 앞서 구축한 데이터베이스를 시각화하여 SDP만의
독자적인 Failure Map을 제작했습니다. 작년 8월부터 시작된 Failure Map이 점점 모습을 갖추어 감에 따라 SDP 내부에서 Phase 4의 출범을 외치는 목소리가 커졌습니다. 막 팀이 꾸려져서 의견을 모아가는 단계에 있지만, Phase 4는 Failure Map을 통해 얻을 수 있는 인사이트를 모아서 전달하는 대시보드의 형태로 논의되고 있습니다.
항상 미래를
생각하는 SDP이지만 때로는 앞만 보고 달려가는 것보다 지금껏 걸어온 길을 돌아보는 것이 도움이 될
때가 있습니다. 지난 2월 말부터 3월 초까지 SDP 리서치팀이 보내온 시간이 딱 그렇다고 생각합니다. Phase 4로의 도약을 앞두고 SDP는 다양한 방법을 시도해보며
쌓아온 데이터베이스를 재정비하고자 노력했습니다. 그 노력을 함께 알아볼까요?
1.
데이터 보충을 위한 시도
1)
크롤링 키워드 바꾸기
SDP는 Phase 2에서 World Bank와의 협력 하에 코로나19의 영향으로 Delay 또는 Cancel된 인프라 프로젝트를 크롤링하여 데이터베이스를
구축했습니다. 따라서 데이터베이스 구성 시 World Bank의
PPI 기준을 그대로 따르고 있었고, 2020년 이후의 인프라
기사에 초점을 맞췄습니다. 그러나 Phase 3는 1, 2와 달리 SDP만의 독자적 사업이기 때문에 프로젝트 집계 기준을
확장하여 좀 더 넓은 범위에서 실패 사례를 수집하고자 하였습니다. 즉,
Failure Map을 찾은 방문자에게 더 많은, 그리고 더 다양한 정보를 제공하는 데에
초점을 두었습니다.
따라서 크롤링 방법에도 변화가 생겼습니다. 현재 SDP의 크롤러는 국가 + 인프라
종류(섹터) + Status(Delay/Cancel)의 크롤링
키워드 조합을 특정 기간과 함께 설정해 데이터를 모으고 있습니다. 더 많은 데이터를 모으고자, 이 중에서 국가, 기간 조건을 다양하게 설정하는 시도 중에 있습니다.
기존 World Bank와의
PPI크롤링은 개도국 데이터만을 중점적으로 모았다면, SDP의 Project MaPPPing은 전 세계의 모든 국가를 대상으로 합니다. 국가를 확대함으로써
더 많은 데이터를 모을 수 있을 뿐만 아니라, 개도국과 선진국의 데이터를 비교할 수 있어 인프라 프로젝트에
대한 보다 객관적인 분석이 가능하다는 장점이 있습니다. 또한, 코로나19 상황뿐만 아니라 그 이전의 자료도 보여주기 위해 2020년에 한정되어
있던 크롤링 기간을 그 이전으로 앞당겨 여러 번 크롤링을 진행했습니다. 크롤링을 해도 결과가 잘 나오지
않는 국가만 따로 모아 다시 크롤링을 해보자는 의견이 나오는 등, 리서치 팀원들의 아이디어를 총 동원해서
데이터 보충을 위해 노력하고 있습니다.
2)
휴롤링
최근 SDP에는 더 많은 데이터를 찾고자 하는 간절한 마음이 담긴 신조어가 등장했습니다. 바로 ‘휴롤링’ 인데요, 혹시 어떤 단어들을 합해 만들어진 말인지 감이 오시나요? 휴롤링이란
휴먼과 크롤링을 합친 합성어입니다. 더 많은 데이터를 보충해야 할 필요가 커지자 리서치팀은 특단의 조치를
취했습니다. 바로 리서치 팀원들이 ‘인간 크롤러’가 된 것처럼 열심히 검색하는 것입니다.
가장 최근의
휴롤링 대상은 EIB (European Investment Bank)가 1990년에서 2019년까지 자금을 조달한 PPP 자료집입니다. World Bank의 데이터베이스에는 프로젝트
사업자, 규모, 하위 섹터 등 세부적인 정보가 많이 나오는
데에 반해 해당 EIB 자료집은 Financial Closure
year와 섹터 정도의 정보만 제공되어 있었습니다. 자료집에 등장한 프로젝트를 일일이 Status 키워드와 함께 검색하였고, 전체 자료 대비 약 10% 정도의 프로젝트에서 Delay/Cancel history를 찾아내는
성과를 이루었습니다.
2.
데이터 정리를 위한 시도
데이터를 많이 모으는 것만큼 중요한 일이 바로 모아진 데이터를 통일된
기준으로 정리하는 일입니다. SDP 리서치팀을 이를 위해 새로운 섹터 기준을 만들고, 세부 기준을 나누는 등의 정리를 하였습니다.
1) 새로운 기준 정하기
Failure Map 데이터는 SDP만의 새로운
기준으로도 추가할 수 있다 보니, 기존 World Bank의
PPI 기준보다 포괄적으로 인프라 종류를 포함할 지에 대하여 논의했습니다. 그 결과, ▲광산(Mine & Coal)과 ▲오일, 가스 파이프라인(Oil/Gas Pipeline)의 두가지 인프라 섹터를 Others 항목에 Subsector로
추가하기로 했습니다. 새롭게 만들어진 섹터 기준표는 다음과 같습니다.
다음으로는 SDP Failure Map에서
코로나19로 인해 Delay되거나 Cancel된 인프라 프로젝트를 좀 더 세분화된 이유로 나누기로 했습니다. 코로나19의 영향을 받은 인프라 프로젝트가 SDP 데이터의 약 20% 정도를 차지하고 있고, 보통 비슷한 이유로 취소되는 경우가 많아
이를 분석해보고자 함이었습니다. 기존에 취소된 이유를 적던 Category
of reason에 COVID-19항목을 추가하고,
COVID-19인 경우 ▲labor shortage, ▲supply chain,
▲preemptive action, ▲others 4개의 세부항목을 기입하기로 했습니다.
앞으로 Phase 4를 통해
세부항목 각각의 비율 등을 분석한다면 코로나19가 인프라 건설의 Delay와
Cancel에 주로 어떤 영향을 미쳤는지 파악할 수 있을 것으로 생각합니다. 또한 이러한 통계를 잘 활용한다면, 다음 팬데믹이 닥쳤을 때, 보완하고 신경 써야 할 것이 어떤 부분인지도 알 수 있을 것입니다.
2) 기준 통일하기
유의미한 통계치를 내기 위해선 잘 정리된 데이터가 필요합니다. 이전에도 몇 차례 데이터 정리 과정을 거쳤지만, 주로 날짜 형식, 대소문자, 중복된 데이터 확인 등 형식적인 부분이었습니다.
내용적인 측면으로는 Affected
Stage 기준을 아래 그림과 같이 바꾸었습니다. Affected Stage는 Delay되거나 Cancel된 프로젝트가 어떤 단계에서 영향을 받았는지
나타내는 항목으로, 통일하기 전에는 기사 속 상황을 그대로 기록해왔었습니다. 예를 들어, 입찰 전 지연된 프로젝트이면 Delay before Tender라고 쓸 수 있지만, 단계
사이에 프로젝트가 영향을 받은 경우 명확한 기준이 없어 정리에 어려움이 있었습니다. 입찰은 마쳤지만
건설은 시작되지 않은 경우에 지연되었다면, Delay in Tender, Delay before
Construction 또는 Delay in Construction이라고 기록하는 등
같은 상황도 다르게 표현하는 경우가 있었습니다.
바뀐 기준에서는 ‘건설 시작’과 ‘운영 시작’을 기점으로 Affected Stage를 크게 3가지로 나누었습니다. 먼저 Delay/Cancel before Construction은 Financial Closure가 이루어지고 건설 전에 Delay/Cancel된 모든 상황을 의미합니다. Delay/Cancel in Construction은 건설 중 Delay/Cancel된프로젝트만을 나타냅니다. 마지막으로 Delay/Cancel in Operation은 건설이 완료된 이후 일어난 Delay/Cancel 프로젝트를 말합니다. 시운전 단계나 운영 과정에서 문제가 생긴 경우 등이 이에 해당됩니다.
지금까지 SDP가 Phase 4로 넘어가기 전, 부족한 데이터를 보충하고, 모아둔 데이터는 다시 정리하는 과정이 어떻게 진행되었는지 간략하게 설명해드렸습니다. 물론 논의된 내용 중 이번 글에 적지 못한 내용도 많습니다. 대표적으로 Delay 기간에 따라 프로젝트의 Delay 심각도를 분석해보자는
의견 등이 있습니다. 기간이 언급되지 않은 경우 기록하기 어렵고 같은 Delay도 입장에 따라 심각도를 다르게 볼 수 있다는 문제가 제기되어 실제 실현까지는 이어지지 못했습니다.
추가된 데이터와 정리된 데이터를 바탕으로 SDP는 이제 새로운 인사이트를 도출해보려 합니다. 또 어떤 새로운
논의들이 기다리고 있을지 설렙니다. 과정은 쉽지 않지만, 그렇기
때문에 항상 더 뿌듯한 SDP의 결과물을 위하여 오늘도 리서치 팀원들은 공부하고 또 고민하고 있습니다. 이번 리서치 팀 인사이트 작성자이자 리서치 팀원인 저희의 소감으로 글을 마무리하도록 하겠습니다. 감사합니다!
3. 소감
민정: 처음 SDP에 들어와서 큰 그림은 그리지 못한 채 세션마다 나오는
과제를 수행하던 때가 얼마 전 같은데, 벌써 그동안의 활동을 개괄하는 리서치팀 인사이트를 쓰고 있다니
감회가 새롭습니다. 매 세션 무수히 많은 논의들이 펼쳐지는 것을 보며 Phase 3를 마무리 짓고 Phase 4를 준비하는 과도기에 있다는
것을 실감합니다. 지금도 SDP는 계속해서 고민하고 수정하고
발전하고 있습니다. 앞으로 Phase 4를 통해 도출될 통계도
너무 기대됩니다! 항상 힘쓰는 리서치 팀원 모두 정말 고맙고, 우리의
상상을 구현해주는 테크팀도 사랑합니다!
주미: 7기가 합류한지 벌써 두 달이 되었습니다.
길다면 길고 짧다면 짧은 시간이지만 정말 많은 것을 배울 수 있었습니다. 특히 현재에 안주하지
않고 항상 더 큰 목표를 위해 꾸준히 노력하는 많은 리서치 팀원 분들을 곁에서 보다 보니 저도 그런 의지를 기를 수 있었던 것 같습니다. 아이디어를 내기 위해 열심히 논의하고 또 새로운 방법들을 적극적으로 시도하고 있으니 SDP의 도약을 함께 지켜봐 주시면 좋을 것 같습니다!
Comments
Post a Comment