Research Insight #4 리서치팀의 새로운 도전
윤형찬, 이상연,
함이수
1.취지
SDP는 지금까지 다양한
프로젝트의 효율을 위해 테크팀과 리서치팀으로 나누어져 작업을 진행해왔습니다. 2020년부터 진행 중인 Project MaPPPing 프로젝트에서도 인프라 정보 검색의 자동화 및 고도화를 담당하는 테크팀과 데이터
검색 및 기획서 작성을 담당하는 리서치팀으로 나누어 활동을 하고 있습니다.
SDP는 지속적으로 양 팀의
원활한 커뮤니케이션을 위해 고민해왔습니다. 리서치팀은 테크팀의 업무를 더 잘 이해하고, 그들과의 업무적 커뮤니케이션을 더 정확하고 신속하게 진행하기 위해서 이번 학기부터 데이터 분석 및 코딩 능력을
배양하기 위한 스터디를 구성하여 함께 공부하기로 했습니다. 이를 통해 저희 리서치팀 팀원들은 DT 역량의 향상 또한 기대하고 있습니다.
2. 다루는 내용
리서치팀은
데이터를 보기 쉽게 정리하고 분석하는 능력을 키우기 위해 ‘엑셀’ 과 ‘Python’ 두 가지 툴로
그룹 스터디를 진행하고 있습니다. 컴퓨터 다루는 경험이 비교적 부족한 리서치 팀원들에게 ‘엑셀’은 가장
접근성이 높고 학습하기 편하기 때문에 엑셀을 바탕으로 데이터 분석의 기초를 다지려고 합니다. Python은
현재 개발자들 사이에서 널리 통용되고 있는 프로그램 언어입니다. 현재
SDP의 테크팀도 주로 Python을 활용하고 있기 때문에, 리서치팀은 향후 테크팀의 업무를 이해하고 프로젝트에 관해 원활하게 소통하기 위해 Python을 또 다른 스터디 과목으로 선정하였습니다. 그렇다면 SDP 리서치팀은 엑셀과 Python에서 구체적으로 어떤 내용을 배우고
있을까요?
[엑셀을 활용한 데이터 분석]
리서치팀이
엑셀을 배우고자 하는 궁극적인 목적은 Failure Map 구축을 위해서 앞으로 모으게 될 프로젝트
데이터들을 데이터베이스화하고 여기서 유의미한 인사이트를 추출해 내는 것입니다. 따라서, 통계학 기본 지식부터 시작하여 현재는 엑셀 함수의 사용법과 기능들을 배워 나가고 있는데요, 먼저 (두 개 이상 집단들의 평균을 비교하는) 분산 분석과 (독립변수와 종속변수 간의 인과관계를 확인하는) 회귀 분석 등 기본적인 분석 방법들을 엑셀상에서 연습해 나갈 예정입니다. 리서치팀이
무수히 많은 데이터 분석법을 전부 다 익힐 수는 없겠지만, 엑셀을 활용하여 우리에게 필요한 데이터 분석을
진행할 수 있는 수준까지 엑셀 스터디를 꾸준히 진행해 나갈 예정입니다.
[프로그래밍 기초 in Python]
리서치팀은 Python스터디를 통해 해당 언어를 이해하고 테크팀과 토의할 수 있는 정도로 성장하기를 기대하고 있습니다. 현재는 자료형, 추상화, 제어문과
같이 프로그래밍의 기본 개념들을 익히고 관련 코드를 작성해 보는 기초적인 단계의 강의를 수강하고 있습니다. 이후에는
프로그래밍 문법들을 익히는 과정을 넘어서서 Python을 더 확장하여 학습할 예정입니다. 대표적으로, 새로운 모듈을 불러옴으로써 Python을 다양한 상황에서 응용해보고, Python을 이용해서
간단한 데이터 분석도 시도할 예정입니다. 리서치팀은 현재까지는 앞에 언급한 정도의 학습을 목표로 하고
있지만, 프로그래밍에 관심 있는 리서치팀 팀원들은 SDP의
지원 아래 개발 업무에서 널리 쓰이는 객체 지향 프로그래밍이나 웹 개발까지 스스로의 학업 수준을 늘려 나갈 수 있을 것입니다.
3. 스터디 방식:
리서치팀이
엑셀 데이터 분석과 파이썬 공부를 하는 방법은 다음과 같습니다. 먼저 리서치 팀 내에서 시간이 맞는
팀원들끼리 소그룹을 형성하여 실시간으로 같이 강의를 들으며, 다 같이 집중을 할 수 있는 환경을 조성합니다. 이렇게 다 같이 강의를 듣는 실시간 스터디 시간 이후, 혼자서 복습을
하는 시간을 갖습니다. 이때, 개인적으로 헷갈렸던 내용을
복습하면서 질문을 기록하여 다음 스터디 진행 전에 카카오톡 단체방을 이용하여 서로 헷갈렸던 부분을 공유하고 질문을 합니다. 이 단체방에서는 다른 팀원이 답변을 해주거나, 테크팀이 직접 답변을
해주기도 합니다. 배운 내용을
본인의 말로 다시 표현하고 되새김으로써 학습의 선순환 구조가 형성될 것으로 기대됩니다.
4. 리서치 팀원들의 스터디
소감 한마디
상연: 학회에 들어오기 전에 테크팀과 협업하며 데이터 분석 및 코딩에 대해 조금이나마 배워갈 수 있을 것을 기대했기
때문에, 이러한 스터디는 제 기대를 충족시킬 수 있는 좋은 활동이라고 생각합니다. 아직은 입문 단계라 얼마나 많은 것을 할 수 있을지 가늠이 안되지만, 향후가
더 기대되는 활동입니다.
형찬: SDP에서 데이터 스터디를 시작하기 전까지는 데이터 분석, Python, 프로그래밍
등은 제가 전혀 접하지 못할 분야라고 생각했어요. 처음에는 관련 단어들도 너무 생소했죠. 그런데 막상 시작하고 보니 어릴 때 새로운 언어를 접했을 때처럼 배우는 맛이 있더라고요. 문제를 해결했을 때 느껴지는 짜릿함도 있고요. 하루빨리 Python과 엑셀을 능숙하게 다루고 싶어요. 우리가 지금껏 모은
데이터들을 직접 분석하여 인사이트를 도출해 낼 수 있는 날이 멀지 않은 것 같아 정말 설레네요.
이수: Project MaPPPing을 진행해 나가면서 데이터 분석의 필요성을 절실히 느끼게 되었습니다. 크롤링을 통해 raw 데이터들을 모으고 나니 이를 가공해야하지만
더욱 심층적인 인사이트를 얻을 수 있음을 깨달았습니다. 데이터 분석 툴을 익혀서 원하는 정보를 다양하게
도출해내고 싶습니다. 아울러 코딩 스터디에서 배운 내용은 테크팀과의 소통에 있어 아주 유용하게 적용될
것 같습니다.
5.향후 활용방안
리서치팀은
현재 진행 중인 Project MaPPPing을 위해 SDP만의
데이터 베이스를 구축해 나가고 있습니다. 스터디를 통해 배운 데이터 분석 능력을 바탕으로 효과적으로
데이터를 정리하고 필요한 정보만 효율적으로 추출하고자 합니다. 고도화된 데이터 분석 능력에 따라 데이터를
다양한 주제에 맞게 분류 및 분석하고 보다 심층적인 인사이트를 도출할 수 있으리라 생각됩니다. 아래 SDP 리서치 팀원들이 도출하면 유의미할 것이라 생각되는 잠재 인사이트 7개를
생각해 보았습니다.
Insight #1. PPP(Public Private Participation) 프로젝트의 실패 요인 분석
SDP는 데이터베이스 상에서
cancel/delay된 프로젝트의 이름뿐만 아니라
cancel/delay의 구체적인 원인을 정리하고 있습니다. 앞으로 데이터 분석 skillset을 갖춰 나갈수록 데이터 베이스에 있는 자료를 가독성 높게 정리하여 PM(Project Manager)에게 제공하며 실패 시나리오 및 향후 인프라 프로젝트 전략에 대한 방향성을 제공할
수 있습니다. 어떤 요인 때문에 프로젝트가 가장 많이 중단되는지, 특정
지역과 실패 요인 실패의 상관관계가 무엇인지에 대한 인사이트를 얻어 갈 예정입니다.
Insight #2. 프로젝트
성공 확률이 높은 지역 분석
저희는 데이터
베이스를 구축하면서 프로젝트 진행이 순조롭고, 성공 확률이 특히 높은 지역이 있다는 것을 발견했습니다. 반대로 실패 확률이 높은 지역도 있다는 것을 알았죠. 이를 데이터
분석 측면에서 입증하기 위해 데이터 분석 능력을 키워 이를 수치적으로 증명할 수 있을 것을 기대합니다. 이러한
데이터 분석 결과는 투자자들이 인프라 프로젝트에 투자할 때 유용한 참고 자료가 될 것이며, 컨설팅 회사에서
프로젝트 진행 전에 실시되는 feasibility check에 도움이 될 것입니다.
Insight #3. 부문별
프로젝트 실패의 주요 원인
SDP Project MaPPPing은 인프라 프로젝트를 크게 5개의 부문으로 분류하고 있는데요,
‘에너지’, ‘ICT’, ‘교통수단’, ‘수자원 처리’, ‘폐기물
처리’가 이에 해당합니다. 앞서서 Insight 2의 매년
발생하는 프로젝트 실패의 개수가 단순히 종합적인 수치로만 도출되는 인사이트라고 한다면 Insight 3에서는
리서치팀의 데이터 분석 스터디가 절실히 필요합니다. 각 부문별로 데이터를 분류한 이후에 부문별로 가장
많이 발견되는 실패 요인을 찾아내는 데이터 분석을 활용해야 하기 때문이죠. 이를 통해 부문별로 프로젝트의
실패를 발생시키는 특정 요인이 있다면 프로젝트 개발자, 투자자들이 리스크 정도를 산정하는 데에 있어서
유의미한 인사이트를 제공할 수 있을 것이라 기대합니다.
Insight #4. 개발도상국과
선진국(OECD 국가)에서 프로젝트 실패의 정도
현재 SDP Project MaPPPing은 개발도상국에서 COVID-19으로
인해 실패한 200여 개의 데이터만 수집한 상태입니다. 추후에
개발도상국 이외에도 OECD 국가들과 기타 중소득국으로 조사 범위를 넓혀간다면 개도국과 선진국 간의
프로젝트 실패 개수도 비교할 수 있을 것으로 전망합니다. 두 집단 간의 비교가 유의미할 정도로 데이터가
확보된다면 SDP는 국가의 경제발전 정도가 프로젝트의 성패에 영향을 미치는지 확인해 보고자 합니다. 리서치팀이 데이터 스터디에서 진행하고 있는 통계학 공부와 데이터 분석 방법은 추후에 두 집단을 비교하는 데에도
유용하게 쓰일 것으로 예상하고 있습니다.
Insight #5. 위기
상황들이 프로젝트 실패율에 미치는 영향
2020년, 전 세계를 강타한 코로나가 인프라 프로젝트 성패를 좌우하는 비율을 측정하여 이러한 세계적인 위기 상황들이 프로젝트
실패율에 미치는 영향을 살펴볼 수 있습니다. 투자 분석가 및 컨설턴트들은 이 데이터를 사용하여 현재나
미래의 위기가 프로젝트에 어떤 영향을 미칠 수 있는지 예측을 할 수 있습니다. 또한 과거의 위기 상황에서
프로젝트들의 주된 실패 요인을 파악하여 리스크 감소 전략을 세우는 데에도 도움을 얻을 수 있습니다. 코로나와
같은 단발적 위기 상황 이외에도 주기적으로 발생하는 경제 위기의 인프라 프로젝트 실패 확률을 비교하면서 새로운 인사이트를 얻을 것이라 기대합니다.
Insight #6. 시간
경과에 따른 프로젝트 실패 정도 확인
비슷한 맥락에서
시간 경과에 따른 프로젝트 실패도 측정할 수 있습니다. 타임 프레임을 설정하여 어떤 타임 프레임에서
프로젝트들이 많이 영향을 받았는지 조사하여 시대적 상황과 연결 지을 수 있습니다. 예를 들어, 세계 경제 위기가 발발한 2008년에 구체적으로 얼마나 많은 프로젝트가
실패했는지 정확한 수치를 파악할 수도 있습니다.
평균적으로 어떠한 타임 프레임에서 프로젝트들이 가장 영향을 많이 받는지,
Financial closure부터 Operation 시작까지 평균적으로 시간이 얼마큼
소요되었는 지도 알아볼 수 있을 것입니다.
Insight #7. 국가별/지역별 집중 섹터 분석
국가별, 지역별 집중 섹터를 도출할 수 있습니다. 각 나라의 정부, 투자자 및 기타 이해관계자들은 어떤 국가나 지역을 설정하여 어떤 인프라가 이에 취약한 지를 알아볼 수도 있고, 반대로 인프라가 가장 발전이 된 구역을 선정하여 인프라를 더 개발시킬 수도 있을 것입니다. 예를 들면 한 국가가 풍력 발전소에 특화되어 있는 것을 발견한 후 더 깊게 조사하면 이는 지형적인 특성과 연관이
있을 수도 있을 것입니다. 이렇듯 정보의 수집이 데이터 가공을 통해 가시화되면 심층적인 분석이 용이할
것으로 생각됩니다.
마지막으로
SDP의 Project MaPPPing은 단순히 실패한 프로젝트를 모아 놓은 웹사이트 그 이상의 가치를 지니고 있습니다. 위기는 위험과 기회라는 말이 있듯이 Project MaPPPing의
이용자들은 리서치팀이 분석한 인사이트를 통해 주요 거시경제 변수와 국제관계에서 변화의 흐름을 찾아나갈 수 있을 것으로 기대합니다. SDP 리서치팀은 앞으로도 지속가능한 발전에 기여하는 유의미한 인사이트 도출을 위해 데이터 검색과 더불어 데이터
분석 역량을 키워나갈 것입니다. 향후 리서치팀의 데이터 분석 역량이 테크팀과의 협업에 있어 튼튼한 징검다리의
역할을 수행하고 SDP의 다른 프로젝트에서 견고한 발판이 되기를 기원합니다.
Comments
Post a Comment