Skip to main content

[Research Team Insight #4] 리서치팀의 새로운 도전 - 5기 이상연, 함이수, 6기 윤형찬

 

Research Insight #4 리서치팀의 새로운 도전

윤형찬, 이상연, 함이수

 

1.취지

SDP는 지금까지 다양한 프로젝트의 효율을 위해 테크팀과 리서치팀으로 나누어져 작업을 진행해왔습니다. 2020년부터 진행 중인 Project MaPPPing 프로젝트에서도 인프라 정보 검색의 자동화 및 고도화를 담당하는 테크팀과 데이터 검색 및 기획서 작성을 담당하는 리서치팀으로 나누어 활동을 하고 있습니다.

SDP는 지속적으로 양 팀의 원활한 커뮤니케이션을 위해 고민해왔습니다. 리서치팀은 테크팀의 업무를 더 잘 이해하고, 그들과의 업무적 커뮤니케이션을 더 정확하고 신속하게 진행하기 위해서 이번 학기부터 데이터 분석 및 코딩 능력을 배양하기 위한 스터디를 구성하여 함께 공부하기로 했습니다. 이를 통해 저희 리서치팀 팀원들은 DT 역량의 향상 또한 기대하고 있습니다.

 

2. 다루는 내용

리서치팀은 데이터를 보기 쉽게 정리하고 분석하는 능력을 키우기 위해 ‘엑셀’ 과 ‘Python’ 두 가지 툴로 그룹 스터디를 진행하고 있습니다. 컴퓨터 다루는 경험이 비교적 부족한 리서치 팀원들에게 ‘엑셀’은 가장 접근성이 높고 학습하기 편하기 때문에 엑셀을 바탕으로 데이터 분석의 기초를 다지려고 합니다. Python은 현재 개발자들 사이에서 널리 통용되고 있는 프로그램 언어입니다. 현재 SDP의 테크팀도 주로 Python을 활용하고 있기 때문에, 리서치팀은 향후 테크팀의 업무를 이해하고 프로젝트에 관해 원활하게 소통하기 위해 Python을 또 다른 스터디 과목으로 선정하였습니다. 그렇다면 SDP 리서치팀은 엑셀과 Python에서 구체적으로 어떤 내용을 배우고 있을까요?

 

[엑셀을 활용한 데이터 분석]

리서치팀이 엑셀을 배우고자 하는 궁극적인 목적은 Failure Map 구축을 위해서 앞으로 모으게 될 프로젝트 데이터들을 데이터베이스화하고 여기서 유의미한 인사이트를 추출해 내는 것입니다. 따라서, 통계학 기본 지식부터 시작하여 현재는 엑셀 함수의 사용법과 기능들을 배워 나가고 있는데요, 먼저 (두 개 이상 집단들의 평균을 비교하는) 분산 분석과 (독립변수와 종속변수 간의 인과관계를 확인하는) 회귀 분석 등 기본적인 분석 방법들을 엑셀상에서 연습해 나갈 예정입니다. 리서치팀이 무수히 많은 데이터 분석법을 전부 다 익힐 수는 없겠지만, 엑셀을 활용하여 우리에게 필요한 데이터 분석을 진행할 수 있는 수준까지 엑셀 스터디를 꾸준히 진행해 나갈 예정입니다.

 

[프로그래밍 기초 in Python]

리서치팀은 Python스터디를 통해 해당 언어를 이해하고 테크팀과 토의할 수 있는 정도로 성장하기를 기대하고 있습니다. 현재는 자료형, 추상화, 제어문과 같이 프로그래밍의 기본 개념들을 익히고 관련 코드를 작성해 보는 기초적인 단계의 강의를 수강하고 있습니다. 이후에는 프로그래밍 문법들을 익히는 과정을 넘어서서 Python을 더 확장하여 학습할 예정입니다. 대표적으로, 새로운 모듈을 불러옴으로써 Python을 다양한 상황에서 응용해보고, Python을 이용해서 간단한 데이터 분석도 시도할 예정입니다. 리서치팀은 현재까지는 앞에 언급한 정도의 학습을 목표로 하고 있지만, 프로그래밍에 관심 있는 리서치팀 팀원들은 SDP의 지원 아래 개발 업무에서 널리 쓰이는 객체 지향 프로그래밍이나 웹 개발까지 스스로의 학업 수준을 늘려 나갈 수 있을 것입니다.

 

3. 스터디 방식:

리서치팀이 엑셀 데이터 분석과 파이썬 공부를 하는 방법은 다음과 같습니다. 먼저 리서치 팀 내에서 시간이 맞는 팀원들끼리 소그룹을 형성하여 실시간으로 같이 강의를 들으며, 다 같이 집중을 할 수 있는 환경을 조성합니다. 이렇게 다 같이 강의를 듣는 실시간 스터디 시간 이후, 혼자서 복습을 하는 시간을 갖습니다. 이때, 개인적으로 헷갈렸던 내용을 복습하면서 질문을 기록하여 다음 스터디 진행 전에 카카오톡 단체방을 이용하여 서로 헷갈렸던 부분을 공유하고 질문을 합니다. 이 단체방에서는 다른 팀원이 답변을 해주거나, 테크팀이 직접 답변을 해주기도 합니다.  배운 내용을 본인의 말로 다시 표현하고 되새김으로써 학습의 선순환 구조가 형성될 것으로 기대됩니다.

 

4. 리서치 팀원들의 스터디 소감 한마디

상연: 학회에 들어오기 전에 테크팀과 협업하며 데이터 분석 및 코딩에 대해 조금이나마 배워갈 수 있을 것을 기대했기 때문에, 이러한 스터디는 제 기대를 충족시킬 수 있는 좋은 활동이라고 생각합니다. 아직은 입문 단계라 얼마나 많은 것을 할 수 있을지 가늠이 안되지만, 향후가 더 기대되는 활동입니다.

 

형찬: SDP에서 데이터 스터디를 시작하기 전까지는 데이터 분석, Python, 프로그래밍 등은 제가 전혀 접하지 못할 분야라고 생각했어요. 처음에는 관련 단어들도 너무 생소했죠. 그런데 막상 시작하고 보니 어릴 때 새로운 언어를 접했을 때처럼 배우는 맛이 있더라고요. 문제를 해결했을 때 느껴지는 짜릿함도 있고요. 하루빨리 Python과 엑셀을 능숙하게 다루고 싶어요. 우리가 지금껏 모은 데이터들을 직접 분석하여 인사이트를 도출해 낼 수 있는 날이 멀지 않은 것 같아 정말 설레네요.

 

이수: Project MaPPPing을 진행해 나가면서 데이터 분석의 필요성을 절실히 느끼게 되었습니다. 크롤링을 통해 raw 데이터들을 모으고 나니 이를 가공해야하지만 더욱 심층적인 인사이트를 얻을 수 있음을 깨달았습니다. 데이터 분석 툴을 익혀서 원하는 정보를 다양하게 도출해내고 싶습니다. 아울러 코딩 스터디에서 배운 내용은 테크팀과의 소통에 있어 아주 유용하게 적용될 것 같습니다.

 

5.향후 활용방안

리서치팀은 현재 진행 중인 Project MaPPPing을 위해 SDP만의 데이터 베이스를 구축해 나가고 있습니다. 스터디를 통해 배운 데이터 분석 능력을 바탕으로 효과적으로 데이터를 정리하고 필요한 정보만 효율적으로 추출하고자 합니다. 고도화된 데이터 분석 능력에 따라 데이터를 다양한 주제에 맞게 분류 및 분석하고 보다 심층적인 인사이트를 도출할 수 있으리라 생각됩니다. 아래 SDP 리서치 팀원들이 도출하면 유의미할 것이라 생각되는 잠재 인사이트 7개를 생각해 보았습니다.

 

Insight #1. PPP(Public Private Participation) 프로젝트의 실패 요인 분석

SDP는 데이터베이스 상에서 cancel/delay된 프로젝트의 이름뿐만 아니라 cancel/delay의 구체적인 원인을 정리하고 있습니다. 앞으로 데이터 분석 skillset을 갖춰 나갈수록 데이터 베이스에 있는 자료를 가독성 높게 정리하여 PM(Project Manager)에게 제공하며 실패 시나리오 및 향후 인프라 프로젝트 전략에 대한 방향성을 제공할 수 있습니다. 어떤 요인 때문에 프로젝트가 가장 많이 중단되는지, 특정 지역과 실패 요인 실패의 상관관계가 무엇인지에 대한 인사이트를 얻어 갈 예정입니다.

 

Insight #2. 프로젝트 성공 확률이 높은 지역 분석

저희는 데이터 베이스를 구축하면서 프로젝트 진행이 순조롭고, 성공 확률이 특히 높은 지역이 있다는 것을 발견했습니다. 반대로 실패 확률이 높은 지역도 있다는 것을 알았죠. 이를 데이터 분석 측면에서 입증하기 위해 데이터 분석 능력을 키워 이를 수치적으로 증명할 수 있을 것을 기대합니다. 이러한 데이터 분석 결과는 투자자들이 인프라 프로젝트에 투자할 때 유용한 참고 자료가 될 것이며, 컨설팅 회사에서 프로젝트 진행 전에 실시되는 feasibility check에 도움이 될 것입니다.

 

Insight #3. 부문별 프로젝트 실패의 주요 원인

SDP Project MaPPPing은 인프라 프로젝트를 크게 5개의 부문으로 분류하고 있는데요, ‘에너지’, ICT, ‘교통수단’, ‘수자원 처리’, ‘폐기물 처리’가 이에 해당합니다. 앞서서 Insight 2의 매년 발생하는 프로젝트 실패의 개수가 단순히 종합적인 수치로만 도출되는 인사이트라고 한다면 Insight 3에서는 리서치팀의 데이터 분석 스터디가 절실히 필요합니다. 각 부문별로 데이터를 분류한 이후에 부문별로 가장 많이 발견되는 실패 요인을 찾아내는 데이터 분석을 활용해야 하기 때문이죠. 이를 통해 부문별로 프로젝트의 실패를 발생시키는 특정 요인이 있다면 프로젝트 개발자, 투자자들이 리스크 정도를 산정하는 데에 있어서 유의미한 인사이트를 제공할 수 있을 것이라 기대합니다.

 

Insight #4. 개발도상국과 선진국(OECD 국가)에서 프로젝트 실패의 정도

현재 SDP Project MaPPPing은 개발도상국에서 COVID-19으로 인해 실패한 200여 개의 데이터만 수집한 상태입니다. 추후에 개발도상국 이외에도 OECD 국가들과 기타 중소득국으로 조사 범위를 넓혀간다면 개도국과 선진국 간의 프로젝트 실패 개수도 비교할 수 있을 것으로 전망합니다. 두 집단 간의 비교가 유의미할 정도로 데이터가 확보된다면 SDP는 국가의 경제발전 정도가 프로젝트의 성패에 영향을 미치는지 확인해 보고자 합니다. 리서치팀이 데이터 스터디에서 진행하고 있는 통계학 공부와 데이터 분석 방법은 추후에 두 집단을 비교하는 데에도 유용하게 쓰일 것으로 예상하고 있습니다.

 

Insight #5. 위기 상황들이 프로젝트 실패율에 미치는 영향

2020, 전 세계를 강타한 코로나가 인프라 프로젝트 성패를 좌우하는 비율을 측정하여 이러한 세계적인 위기 상황들이 프로젝트 실패율에 미치는 영향을 살펴볼 수 있습니다. 투자 분석가 및 컨설턴트들은 이 데이터를 사용하여 현재나 미래의 위기가 프로젝트에 어떤 영향을 미칠 수 있는지 예측을 할 수 있습니다. 또한 과거의 위기 상황에서 프로젝트들의 주된 실패 요인을 파악하여 리스크 감소 전략을 세우는 데에도 도움을 얻을 수 있습니다. 코로나와 같은 단발적 위기 상황 이외에도 주기적으로 발생하는 경제 위기의 인프라 프로젝트 실패 확률을 비교하면서 새로운 인사이트를 얻을 것이라 기대합니다.

 

Insight #6. 시간 경과에 따른 프로젝트 실패 정도 확인

비슷한 맥락에서 시간 경과에 따른 프로젝트 실패도 측정할 수 있습니다. 타임 프레임을 설정하여 어떤 타임 프레임에서 프로젝트들이 많이 영향을 받았는지 조사하여 시대적 상황과 연결 지을 수 있습니다. 예를 들어, 세계 경제 위기가 발발한 2008년에 구체적으로 얼마나 많은 프로젝트가 실패했는지 정확한 수치를 파악할 수도 있습니다.  평균적으로 어떠한 타임 프레임에서 프로젝트들이 가장 영향을 많이 받는지, Financial closure부터 Operation 시작까지 평균적으로 시간이 얼마큼 소요되었는 지도 알아볼 수 있을 것입니다.

 

Insight #7. 국가별/지역별 집중 섹터 분석

국가별, 지역별 집중 섹터를 도출할 수 있습니다. 각 나라의 정부, 투자자 및 기타 이해관계자들은 어떤 국가나 지역을 설정하여 어떤 인프라가 이에 취약한 지를 알아볼 수도 있고, 반대로 인프라가 가장 발전이 된 구역을 선정하여 인프라를 더 개발시킬 수도 있을 것입니다. 예를 들면 한 국가가 풍력 발전소에 특화되어 있는 것을 발견한 후 더 깊게 조사하면 이는 지형적인 특성과 연관이 있을 수도 있을 것입니다. 이렇듯 정보의 수집이 데이터 가공을 통해 가시화되면 심층적인 분석이 용이할 것으로 생각됩니다.

 

마지막으로

SDP Project MaPPPing은 단순히 실패한 프로젝트를 모아 놓은 웹사이트 그 이상의 가치를 지니고 있습니다. 위기는 위험과 기회라는 말이 있듯이 Project MaPPPing의 이용자들은 리서치팀이 분석한 인사이트를 통해 주요 거시경제 변수와 국제관계에서 변화의 흐름을 찾아나갈 수 있을 것으로 기대합니다. SDP 리서치팀은 앞으로도 지속가능한 발전에 기여하는 유의미한 인사이트 도출을 위해 데이터 검색과 더불어 데이터 분석 역량을 키워나갈 것입니다. 향후 리서치팀의 데이터 분석 역량이 테크팀과의 협업에 있어 튼튼한 징검다리의 역할을 수행하고 SDP의 다른 프로젝트에서 견고한 발판이 되기를 기원합니다.

Comments

Popular Posts

[Research Team Insight #1] The A to Z of SDP Research Team

[10월호, 2020년] 세계시민의식과 SDGs에 대해 묻다: 강동렬 UN SDSN Youth Korea 총괄 인터뷰 - 4기 유재희, 이소정

 "개인의 움직임은 과연 얼마나 중요할까?" 위의 질문에서부터 본 인터뷰는 시작된다. SDP는 현재 지속가능발전 글로벌 리더가 되고자 거시적인 시각에서 에너지와 인프라에 관심을 가지고 활동하고 있다. 우리는 다양한 외부 기관으로부터 지지를 받으며 유의미한 성과를 내고 있지만, 혹 멀리서 커다란 모습에만 집중한 나머지 개개인이 일상에서 지속가능함을 위해 노력하는 미시적인 움직임을 놓치고 있는 것은 아닐까. 세계시민의식을 가지고 살아간다는 것은 어떠한 의미인지, 우리가 생활에서 실천할 수 있는 방법은 무엇일지 고민하게 되었다. 강동렬님은 세계시민교육가이자 지속가능발전활동가로, UN SDSN Youth Initiative 한국 총괄로 계시며 SDP의 활동에도 언제나 많은 도움을 아끼지 않으신다. SDP는 지난 8월, 재생에너지와 시민의식을 주제로 동렬님을 모시고 공개 세미나를 추진하였으나 코로나19 상황 악화로 인해 잠정 연기한 일이 있다. 우리의 질문과 맞닿아 있는 세미나를 기다리며, 동렬님이 중요하게 생각하시는 가치와 활동은 무엇인지 SDP가 작은 인터뷰를 통해 들어보고자 하였다. 4기 유재희, 이소정

[3월호, 2021년] #32 딥 페이크(Deep Fake)와 디지털 포렌식(Digital Forensic) - 7기 진희주

  딥 페이크(Deep Fake)와 디지털 포렌식(Digital Forensic) 7기 진희주 아래 사진 중 무엇이 실제 오바마의 사진일까 ? 네 장 모두 딥 페이크 기술을 통해 인공지능이 만든 오바마의 사진이다 . 딥 페이크 (Deep Fake) 는 Deep Learning 과 Fake 의 합성어이다 . 딥 페이크는 AI 를 이용해 특정인의 얼굴이나 목소리를 합성한 사진 , 영상 , 음성 편집물 및 그 기술을 통칭하는 단어이다 . 딥 페이크 기술은 새로운 유형의 신경망 ( 머신러닝 알고리즘 ) 발전으로 가능해졌다 .   딥 페이크 기술을 활용하면 유명인의 얼굴을 대역에 합성해 손쉽게 영상을 만들거나 세상에서 사라진 멸종 위기 종이나 과거의 사람들을 생생하게 재현할 수도 있게 된다 . 여러 사람의 얼굴을 통해 가상의 얼굴을 제작하여 사용하거나 스타일 트랜스퍼 (Style transfer) [1] 를 활용해 겨울을 여름으로 , 또는 화창한 날을 비 오는 날로 묘사하는 등 이미지의 환경적 맥락을 바꿀 수 있는 등 딥페이크 기술의 영상 • 사진 산업 분야의 활용도와 가치는 무궁무진하다 .   하지만 딥 페이크는 엄청난 힘에 걸맞게 악용 가능성이 높아 그 위험성에 대한 논란이 최근 활발하게 이뤄지고 있다 . 대표적인 악용사례는 유명 연예인을 합성한 불법 포르노 , 전•현직 대통령의 얼굴을 합성한 가짜뉴스 영상 등으로 사회를 큰 혼란에 빠뜨릴 수 있음을 보여준다 . 딥 페이크 범죄의 대상은 유명인을 넘어 점차 일반인에게까지 확장되고 있다 . 헤어진 연인 , 또는 지인의 얼굴을 다른 나체 사진이나 성인물 동영상과 합성하여 만든 딥 페이크 제작물을 온라인 상에서 유통하거나 이를 통해 협박하는 등 딥 페이크 영상은 점차 심각한 사회적 문제로 대두되고 있다 . 2019 년 4 월 국내에서 큰 논란이 되었던 텔레그램 N 번방 사건에서도 딥페이크를 악용한 사진이 거래 , 유포된 정황이 확인되어 그 심각성이 전면으로 드러나게 되었다 .   딥 페이크 기

[11월호, 2020년] Countermeasures against urbanization: Air pollution in Seoul - 5기 함이수

Countermeasures against urbanization: Air pollution in Seoul 55% of the world population resides in urban areas as of 2018, according to a UN report. The overly populated urban population has given rise to problems that people were not aware of in the past. Especially, the impacts of urbanization on the environment are slow to be seen thus has been accumulating, invisible to the human eye. What has been done to address these problems? Furthermore, how should we approach these issues henceforward?

[Research Team Insight #2] Project MaPPPing and the role of Research Team - 5기 권경민, 6기 김예빈

1.       What is Project MaPPPing   SDP is constituted of students who have great interest in sustainable development, and we refer to the SDG goals articulated by the UN as the global standard for sustainable development. This year, we have specifically focused on goal number 9 and 11 that emphasizes the role of infrastructure in sustainable development [1] . We believe that sustainable and resilient infrastructure is at the heart of sustainable growth, so we have launched a project called Project MaPPPing in December 2019.