Why?
현재 데이터 직무를 희망해서 관련 프로젝트와 공부를 진행하고있다. 공부를 하면서 "내가 왜 데이터 직무를 하고싶어하지?"라는 생각이 문득 들었는데 이번 기회에 의지도 다질겸!(1월은 또 의지를 다지는 달이니..) 희망하는 이유를 정리해보고자 한다.
주전공에서 얻은 뜻깊은 경험
나의 주전공은 조경학과이다. 평상시에 사람들과의 대화에서 "전공이 어떻게 되세요?"라는 질문에 "조경학과 입니다"라고 말하면 일부 어른분들을 제외하고는 대다수의 사람들은 나에게 다시 질문을 한다.
"조경학과가 뭐하는 곳이에요?"
구글링을 해보면 조경학과는 설계(아파트 단지 및 정원), 계획(도시, 공원)을 다루는 학문이다.
나는 계획에 사용되는 툴을 배우는 과목인 "GIS 및 도시공간 분석" 수업을 듣고 난 후 "데이터의 중요성"을 알게 되었다.
이게 데이터 직무를 희망하게 된 첫 번째 이유이다.
GIS의 대한 설명을 간단하게 하자면, 공간 정보 시스템(GIS)은 지리정보 데이터 시각화를 제공하고, 이를 토대로 다양한 분야에 의사결정을 도와주는 툴이다.
해당 수업을 들으면서 처음으로 공공 데이터를 활용하였는데 여기서 흥미를 느꼈다.(그리 좋은 성적을 얻지는 못했지만 대학교 수업 중 가장 유익했다고 생각하는 수업이다😂)
공공데이터 포털, 국토정보플랫폼 같이 데이터셋 소유 플랫폼에 정말 다양한 데이터들이 존재하며, 이를 가지고 무궁무진한 인사이트를 얻을 수 있음을 알게 되었다. 아래는 GIS 수업에서 진행한 프로젝트로 나의 첫 번째 데이터 관련 프로젝트라 할 수 있다!

해당 프로젝트를 진행한 지 2년 정도 지나서 다시 보니 색상 같은 것을 바꾸면 어땠을 지와 결과 도출에서 점수 산정 이유 등 더 자세하게 나타냈으면 어땠을까라는 생각이 든다. 그래도 나의 첫 데이터 관련 프로젝트이다보니 참 애정이 간다😄
데이터에 빠져들다
위에서 언급했듯이 GIS 수업을 통해 데이터의 중요성과 활용도를 알게 되었고, 이와 관련된 프로젝트를 진행해보고 싶은 마음이 들어 한국형 Kaggle "Dacon"을 진행해보자는 생각을 하였다.
Dacon은 데이터 경진대회이다보니 데이터를 다룰 때 사용하는 프로그래밍 언어인 Python을 알고 있어야 해서 자연스럽게 학습을 하였고(처음에는 어려웠다..), 발전하여서 데이터 전처리 라이브러리 Pandas, Numpy 및 머신러닝에 관한 지식을 배웠다.
방학 때 위 내용들을 공부하였는데, "어라? 생각보다 더 재밌네?"라는 생각을 하였다. 다시 생각해보면 내가 생각한 대로 데이터를 다루고 이를 활용하는 과정 자체를 순수하게 즐겼던 것 같다. 이는, 현재까지도 동일한데 데이터를 가지고 활용하는 그 자체가 재밌다!
학습한 내용을 토대로 운이 좋게 교내 개발 동아리 "Econovation" AI 분야에 합격하여 팀원과 함께 데이터 경진대회인 Dacon에 참여하였다.
아래의 이미지는 참여했던 경진대회이다. "항공편 지연 예측 AI 경진대회"로 대회명에서도 나왔듯이 항공편의 지연을 여러 속성들을 이용해서 지연 여부를 파악하는 것이다. 결국 최종 예측은 지연 / 지연x (이분법적으로 생각하면 Yes or No)이다.
해당 대회에서는 제공하는 훈련 데이터셋에 결측치가 존재해서 이를 해결하고 속성에서 필요한 것만 사용하는 등 데이터 전처리 과정에 많은 시간을 투자하였다. 이처럼 데이터 전처리에 힘을 쏟고, 단순한 모델인 DNN을 사용하였더니 아래와 같이 좋은 성적을 얻게 되었다.
이때도 역시 데이터 전처리 하는 과정은 즐거웠다!.

그래서 나는 데이터 직무 중 어느 것을 하고싶은가?
Dacon 경진대회를 끝낸 뒤 개인적으로 회고를 하였다.
"데이터 업무에 흥미를 느끼는데, 그래서 데이터 직무 중 어떤 것을 하고 싶은거지?"
위 2개의 질문의 공통점은 "그래서 뭐하고 싶은거야? 어떤 직업을 하고 싶어?"라고 할 수 있다.
회고를 진행하던 시점에도 이에 대한 답을 내지 못했는데.. 지금까지도 정확히 답을 못 내린 상태이다. 데이터 직무라고하면 대표적으로 3가지로 구분할 수 있다.
1. 데이터 분석가
2. 데이터 사이언티스트
3. 데이터 엔지니어
데이터 분석가, 데이터 사이언티스트, 데이터 엔지니어 모두 데이터와 관련된 업무를 수행하지만 성격이 다르다. 고민이 되었지만 단순한 결론을 내렸다.
"나는 아직 학생인데 그냥 다 경험해보고 결정해보면 되지 않을까? 생각만 하지말고 직접 해보자!"
맞다. 나는 아직 학생이다. 관련 전공자도 아니고, 남들보다 늦게 시작했으니 이를 인정하고 차근차근 경험하면서 방향을 잡아보자라고 생각했다.
결국, 고민의 시작인 2024년은 나에게 매우 중요한 해가 될 것이라고 생각한다.
새로운 출발점에 선 나에게
내가 왜 데이터 직무를 하고싶어하는 지를 차근차근 알아보았다.
글을 작성하다보니 방대한 목표를 위해서가 아닌 단순하게 흥미가 생겼고, 자연스럽게 데며들었다(데이터에 스며들었다..😹)라는 표현이 맞을 것 같다. 아직 많은 것을 배워야하고, 부족한 점이 많지만 이제 시작일 뿐이다.
많은 경험을 해보고, 생각만 하지말고 직접하자!
향후 몇년 뒤 이 글을 다시 읽었을 때 부끄럼이 없도록 후회없는 시간을 보내자!
Do not wait to strike till the iron is hot; but make it hot by striking.
- William Butler Yeats -
<쇠가 뜨거워질 때까지 기다리지 말고, 쳐서 뜨겁게 만들어라>
'Daily' 카테고리의 다른 글
포트폴리오? 이력서? 어떻게 구성해야하지? (1) | 2024.11.17 |
---|---|
2024년 상반기 회고 (2) | 2024.07.10 |
시작이 반이다 (0) | 2024.01.16 |
Why?
현재 데이터 직무를 희망해서 관련 프로젝트와 공부를 진행하고있다. 공부를 하면서 "내가 왜 데이터 직무를 하고싶어하지?"라는 생각이 문득 들었는데 이번 기회에 의지도 다질겸!(1월은 또 의지를 다지는 달이니..) 희망하는 이유를 정리해보고자 한다.
주전공에서 얻은 뜻깊은 경험
나의 주전공은 조경학과이다. 평상시에 사람들과의 대화에서 "전공이 어떻게 되세요?"라는 질문에 "조경학과 입니다"라고 말하면 일부 어른분들을 제외하고는 대다수의 사람들은 나에게 다시 질문을 한다.
"조경학과가 뭐하는 곳이에요?"
구글링을 해보면 조경학과는 설계(아파트 단지 및 정원), 계획(도시, 공원)을 다루는 학문이다.
나는 계획에 사용되는 툴을 배우는 과목인 "GIS 및 도시공간 분석" 수업을 듣고 난 후 "데이터의 중요성"을 알게 되었다.
이게 데이터 직무를 희망하게 된 첫 번째 이유이다.
GIS의 대한 설명을 간단하게 하자면, 공간 정보 시스템(GIS)은 지리정보 데이터 시각화를 제공하고, 이를 토대로 다양한 분야에 의사결정을 도와주는 툴이다.
해당 수업을 들으면서 처음으로 공공 데이터를 활용하였는데 여기서 흥미를 느꼈다.(그리 좋은 성적을 얻지는 못했지만 대학교 수업 중 가장 유익했다고 생각하는 수업이다😂)
공공데이터 포털, 국토정보플랫폼 같이 데이터셋 소유 플랫폼에 정말 다양한 데이터들이 존재하며, 이를 가지고 무궁무진한 인사이트를 얻을 수 있음을 알게 되었다. 아래는 GIS 수업에서 진행한 프로젝트로 나의 첫 번째 데이터 관련 프로젝트라 할 수 있다!

해당 프로젝트를 진행한 지 2년 정도 지나서 다시 보니 색상 같은 것을 바꾸면 어땠을 지와 결과 도출에서 점수 산정 이유 등 더 자세하게 나타냈으면 어땠을까라는 생각이 든다. 그래도 나의 첫 데이터 관련 프로젝트이다보니 참 애정이 간다😄
데이터에 빠져들다
위에서 언급했듯이 GIS 수업을 통해 데이터의 중요성과 활용도를 알게 되었고, 이와 관련된 프로젝트를 진행해보고 싶은 마음이 들어 한국형 Kaggle "Dacon"을 진행해보자는 생각을 하였다.
Dacon은 데이터 경진대회이다보니 데이터를 다룰 때 사용하는 프로그래밍 언어인 Python을 알고 있어야 해서 자연스럽게 학습을 하였고(처음에는 어려웠다..), 발전하여서 데이터 전처리 라이브러리 Pandas, Numpy 및 머신러닝에 관한 지식을 배웠다.
방학 때 위 내용들을 공부하였는데, "어라? 생각보다 더 재밌네?"라는 생각을 하였다. 다시 생각해보면 내가 생각한 대로 데이터를 다루고 이를 활용하는 과정 자체를 순수하게 즐겼던 것 같다. 이는, 현재까지도 동일한데 데이터를 가지고 활용하는 그 자체가 재밌다!
학습한 내용을 토대로 운이 좋게 교내 개발 동아리 "Econovation" AI 분야에 합격하여 팀원과 함께 데이터 경진대회인 Dacon에 참여하였다.
아래의 이미지는 참여했던 경진대회이다. "항공편 지연 예측 AI 경진대회"로 대회명에서도 나왔듯이 항공편의 지연을 여러 속성들을 이용해서 지연 여부를 파악하는 것이다. 결국 최종 예측은 지연 / 지연x (이분법적으로 생각하면 Yes or No)이다.
해당 대회에서는 제공하는 훈련 데이터셋에 결측치가 존재해서 이를 해결하고 속성에서 필요한 것만 사용하는 등 데이터 전처리 과정에 많은 시간을 투자하였다. 이처럼 데이터 전처리에 힘을 쏟고, 단순한 모델인 DNN을 사용하였더니 아래와 같이 좋은 성적을 얻게 되었다.
이때도 역시 데이터 전처리 하는 과정은 즐거웠다!.

그래서 나는 데이터 직무 중 어느 것을 하고싶은가?
Dacon 경진대회를 끝낸 뒤 개인적으로 회고를 하였다.
"데이터 업무에 흥미를 느끼는데, 그래서 데이터 직무 중 어떤 것을 하고 싶은거지?"
위 2개의 질문의 공통점은 "그래서 뭐하고 싶은거야? 어떤 직업을 하고 싶어?"라고 할 수 있다.
회고를 진행하던 시점에도 이에 대한 답을 내지 못했는데.. 지금까지도 정확히 답을 못 내린 상태이다. 데이터 직무라고하면 대표적으로 3가지로 구분할 수 있다.
1. 데이터 분석가
2. 데이터 사이언티스트
3. 데이터 엔지니어
데이터 분석가, 데이터 사이언티스트, 데이터 엔지니어 모두 데이터와 관련된 업무를 수행하지만 성격이 다르다. 고민이 되었지만 단순한 결론을 내렸다.
"나는 아직 학생인데 그냥 다 경험해보고 결정해보면 되지 않을까? 생각만 하지말고 직접 해보자!"
맞다. 나는 아직 학생이다. 관련 전공자도 아니고, 남들보다 늦게 시작했으니 이를 인정하고 차근차근 경험하면서 방향을 잡아보자라고 생각했다.
결국, 고민의 시작인 2024년은 나에게 매우 중요한 해가 될 것이라고 생각한다.
새로운 출발점에 선 나에게
내가 왜 데이터 직무를 하고싶어하는 지를 차근차근 알아보았다.
글을 작성하다보니 방대한 목표를 위해서가 아닌 단순하게 흥미가 생겼고, 자연스럽게 데며들었다(데이터에 스며들었다..😹)라는 표현이 맞을 것 같다. 아직 많은 것을 배워야하고, 부족한 점이 많지만 이제 시작일 뿐이다.
많은 경험을 해보고, 생각만 하지말고 직접하자!
향후 몇년 뒤 이 글을 다시 읽었을 때 부끄럼이 없도록 후회없는 시간을 보내자!
Do not wait to strike till the iron is hot; but make it hot by striking.
- William Butler Yeats -
<쇠가 뜨거워질 때까지 기다리지 말고, 쳐서 뜨겁게 만들어라>
'Daily' 카테고리의 다른 글
포트폴리오? 이력서? 어떻게 구성해야하지? (1) | 2024.11.17 |
---|---|
2024년 상반기 회고 (2) | 2024.07.10 |
시작이 반이다 (0) | 2024.01.16 |