R을 사랑한 느림보 데이터 분석가

직장 일기 #4. 나 아직 한 달도 안 된 동료였다. 본문

커리어 일기

직장 일기 #4. 나 아직 한 달도 안 된 동료였다.

알럽뷰 2023. 9. 19. 15:14

23년 9월 11일 월요일
 
오전에 간단하게 회의 겸 근황수다를 회의실에서 나눴다.
이후로 취미생활 즐기듯 독서도 하고, 공부도 하고, 딴짓도 좀 했다.
저번에 말했던 랜덤 포레스트를 엑셀에 정리하라고 한다ㅎㅎ
 
23년 9월 12일 화요일
 
집에서 2권의 책을 챙겨 왔다. 혼공머신(한빛미디어), 나의 첫 머신러닝/딥러닝(위키북스).
꽤 쉽게 쓰여진 책으로 입문자, 초보자가 보기 좋다.
랜덤 포레스트 개념을 책을 통해 이해하고 깊이 있는 내용은 구글링을 하면서 스터디 및 정리를 했다.
 
그리고 2~3시간을 밖에서 커피를 마시면서 친목을 다졌다.

하움 앱

 

아무리 가까운 길이라도 가지 않으면 닿지 못하고, 아무리 쉬운 일이라도 하지 않으면 이루지 못한다. -채근담

나에게 너무 와닿았던 명언이라서 사진첩에 저장까지하고 주변인들에게 알렸던 명언.


23년 9월 13일 수요일
 
오전부터 부지런히 랜덤 포레스트를 파헤치게 되었다. 랜덤 포레스트를 이해하기 위해서 선행적으로 알아야 할 개념이 의사결정나무와 앙상블이었다. 그렇게 하나씩 하나씩 파헤치고 궁금한 것을 검색하다 보니 끝도 없이 삽질을 하는 것 같아 어느 정도 궁금증이 해소되면 멈추고 진도를 나가기도 했다.
 
파라미터와 하이퍼 파라미터에 관한 내가 알고있는 지식을 공유했지만 아니라고 한다. 먼가 내가 하는 말을 잘 귀 기울이는 건지 억울함이 들긴 했지만 빈 수레가 요란하면 안 되니 자제해야겠다고 생각했다.
 
랜덤포레스트 알고리즘이 있는 사이킷런의 도큐먼트를 보면서 안에 들어있는 파라미터를 하나씩 파고들었다. 파고들고 보니 의사결정나무에서 팠어야 하는 내용이 나와 다시 원점으로 돌아가는 느낌으로 의사결정나무를 찾아봤다. 의사결정나무의 가지가 생성되는 그런 뻔한 이미지는 여러 차례 봐왔지만 자세히 뜯어보지 않았는지라 이상한 질문을 던졌다.
"샘플이 100개 들어가서 LEAF이 1일 때까지 간다면 샘플이 1까지 가는데 그럼 분류를 100개하는 거 아닌가요? 그럼 과적합 아닌가요?"
 
돌아온 답변은 단호하면서 명쾌했다.
"CLASS 적혀있잖아요."
 
난 그 가지가 생성되는 이미지를 수차례 봐왔다해도 그 그림에 잔상만 있을 뿐 이해하려고 하지 않았던 것이다. 그냥 겉핥기 정도.
공부한 티가 난다. 괜히 책임이 아니구나. 반성하게 된다. 그리고 퇴근하는 지하철에서 피곤해서 졸았다.
 
그리고 이진분류. 단순암기 형식으로 공부한다면 이진분류 따로 생각하고 연결성이 없이 머릿속에서 둥둥 떠다니는 느낌인데, 탑다운/바텀업 방식으로 공부하는 것도 꽤 괜찮은 방법인 거 같다.
 
지도학습/비지도학습 개념 -> 지도학습 알고리즘 종류 -> 랜덤포레스트 알고리즘
랜덤포레스트 알고리즘 -> 앙상블 알고리즘 -> 의사결정나무 -> 지도학습
 
마지막으로, 내가 알고있다고 생각했던 것이 진짜 다 알고 있는 것이 아니기에 겸손하자.
진짜 알면 알수록 배워야할께 많고 머리 터진다!
 
23년 9월 14일 목요일
 
모닝 커피 세 잔을 들고 출근. 사제커피를 마시고 싶은데 나누면 좋을 것 같아서 같이 사왔다.
그리고 랜덤포레스트 스터디를 지속했다.
 
3시 미팅 시작.
책임님 먼저 발표하고 다른 선임님 발표하고 마지막으로 나.
간단하게 알고리즘 종류를 맵의 느낌으로 나열하고, 의사결정나무, 앙상블, 최종인 랜덤 포레스트에 대해 작성했고, 그걸 보면서 하나씩 설명하기 시작했다.
내가 쓴 거니까 읽으면서 설명하면 되겠지 싶어 가볍게 읽어가면서 설명하고 있는데, 거의 발표 수준을 요구하는 것이 날 더 힘들게 했다.
 
"기존에 머신러닝에 대해서 어느 정도 공부했냐? 알고 있었냐?"라는 질문에 기분이 상했지만, 그래도 겸손한 태도로 살아야지 싶어 "0은 아니에요"라고 답했다.
책 한권 3 회독 정도 하면 웬만한 내용 다 알 거라는 식으로 설명해 주셨고 알겠다고 하고 내가 스터디한 내용을 설명했다. 그리고 내가 하는 발표에 태클을 걸기 시작했다. 물론 의사결정나무, 앙상블, 랜덤 포레스트는 여기저기 정보가 많고 많이 접하기 때문에 알고 있는 내용이니 태클 걸고 꼬리질문하면 끝없이 할 수 있다.
 
엑셀 파일에 정리된 200행 정도의 내용까지 가지 못하고 30행에서 발표는 스탑되었다. 그 뒤로는 책임님의 말을 들어야 하는 시간이었다.
 
재현데이터에 대해 설명할 때도 끝까지 다 하지 못하고 끝난 것에 아쉬움이 있었는데, 결국 이번에도 금방 끝이 나버렸다. 공식적인 자리, 단체로 모여있는 자리, 발표하는 자리를 어려워하는 나에겐 좋은 기회가 날아가버렸다. 나는 그런 자리에서 얼어버리고 긴장한 나를 느끼고, 목소리가 떨리고, 침을 꼴깍 삼키는 나를 또 느끼면서 발표하곤 한다.
 
면접을 준비하기 위해서도 그랬다. 말하는 것이 두려워서 어떤 질문에 어떤 대답을 해야 할지 기계적으로 나오게 하기 위해서 스크립트를 작성하고 외우고 카메라를 켜고 연습까지 했다. 그래도 못했다. 각 잡고 판깔고 말해라 하면 이상하게 못한다.
 
이 정도면 내가 여기저기 말하는 거 싫어한다. 말 못 한다고 떠벌리고 다니는 거 보면 방어기제인 것인지, 내가 나를 가두는 행위인 건지, 이면의 나의 감정상태를 알고 싶다. 그나마 몇몇 떠오르는 사건들은 내가 학생에게 과외를 해준 경험이 있는데, 그 학생이 점수가 안 나와서 과외에서 잘린 경험. 대학생 때 발표하라고 앞에 나오라고 했는데 내가 너무 민망해서 내내 웃으면서, 실실 쪼개면서 발표해서 학점 개판난 경험. 회사에서 내가 작성한 제안서에 관해 설명해 보라고 했을 때 설명하는데 말끝을 자꾸 흐리니까 화를 내던 상사에게 쫄려서 입을 꾹 닫게 된 경험. 그리고 나에게 친인척과의 교류를 경험하지 않아 어른이라곤 엄마, 아빠, 선생님이 다인, 어른에게 말조심해야 할 것 같지만 그게 뭔지 몰라 말실수하는 경험. 어른들에게 미움받는 경험. 선배들이 말 함부로 한다고 면박 주던 경험 등
 
내가 말을 더럽게 못 하는 탓도 분명 있지만, 나를 신뢰하지 못하거나 나를 가르치고 싶어 하는 것 같단 생각도 강하다.
 
'남에게 설명할 수 없으면 모르는 것이다'라는 그 높은 기준에는 내가 부합하기란 쉽지 않다.
다른 이가 내 말에 귀 기울이지 않는다는 것을 느낄 때는 말을 할 의욕이 생기지 않는다. 권위자 또는 어른이 내 말을 막고 본인 말만 하고 있으면 난 자연스레 입을 닫는다.
 
글은 막 끄적여도 다시 수정할 수 있지만 말은 한번 내뱉으면 주워 담을 수 없다. 내가 말을 더듬고 횡설수설하고 이것 설명했다가 저것 설명하고 버벅거리면 그냥 모르는 애다.
 
면접 준비할 때도 스피치 학원을 검색해 보곤 했는데, 기회가 되면 퍼블릭 스피치를 배워봐야겠다 생각했었다. 그 기회를 앞당겨야 할지도 모르겠다. 선임이지만 준 PM 수준의 언변을 요구한다.
 
"내가 모르는 것은 너희도 모른다고 생각하기 때문에 이런 건 빼라."라고 말했다. 앙상블 중 스태킹에 관한 얘기였다. 난 그 말도 충격적이었지만, 내가 배운 것, 알게 된 것들을 공유하고 싶은 마음. 계속 여기에 발 담그고 있다면 분명히 알아야 할 개념이라고 생각했고, 잘 정돈된다면 블로그에도 작성할 생각으로 내 글을 보는 이가 분석가라는 마음으로 스터디하고 엑셀에 정리한 것이다.
하지만 원하는 것은 비전문가인 고객에게 필요한 말만 가지치기해서 상세하게 작성하고 내가 설명할 때 막힘없게끔 만들어서 공유하란 것을 느꼈다.
지금 생각해 보면 회사에서 주어진 업무시간에 너무 내 중심적으로만 공부한 건가 싶으면서도 섭섭했다. 서로 바라보는 관점이 너무 달랐다.
 
같이 듣고 있던 선임님이 그 멈췄던 설명자료에 엔트로피를 물어봤다. 아까 오전에도 자리에서 얘기하면서 남자, 여자 판별하기 위해서 군대여부와 긴 머리여부를 물어볼 때 어느 것이 더 영향력이 큰지에 대해 간략하게 설명했지만 다시 또 질문하길래 "설명해 드릴까요?" 하며 펜과 종이를 들었다. 그와 동시에 "모르면 모른다고 말해요."라는 말을 하는 책임님 말에 또한 상처받았다. 말을 개떡 같이해도 아니까 설명할 기회를 주세요ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ
 
책임님 눈에는 모르는 애가 발버둥 치고 아는척하면서 고집 피우는 것으로 밖에 안 보이나 보다. 뭔가 내가 모른다고 인정하길 바라는 느낌을 받는다. 모른다고 말하면 입문자 취급하면서 A to Z 다 설명하려들고, 안다고 하면 꼬리 질문하면서 깊이 있게 더 공부해야 한다고 질책하고 난 어떤 포지션을 취해야 하는 건지 어렵다.
 
난 설명할 수 있다고 얘기하고 종이에 끄적이며 설명했다. 내 기준에서는 쉽게 친절하게 설명한다고 그림을 그려가면서 말이다. 뿌리 노드에 와야 할 특성을 어떻게 선정할 것인지 불순도를 더 명확하게 집어낼 수 있는 질문이 먼저와 야한 것. 질문하기 전에 불명확함과 질문 후에 알게 된 인지 정보의 간극만큼이 정보이득이고 그 이득을 크게 주는 특성이 우선적으로 뿌리 노드에 가게 된 다는 것을 설명했다. 그 뒤로는 책임님이 보충설명을 시작했다.
 
내가 말하는 방식이 너무 유아틱 하거나 수준이 낮아서 비전문가스러운 것인지, 질문의 핵심을 이해하지 못하고 이상한 소리만 해댄 것인지는 기회가 된다면 물어봐야겠다.
 
내가 말하는 방식이, 내가 설명해 주는 방식이 그들이 원하는 방식이 아니고, 나만 알아듣는 방식이고 한다면 그건 분명 고쳐야 할 방식일 수도 있으니까.
 
아. 그리고 타인에게 내가 공부한 자료를 말할 수 있는 기회는 흔치 않기 때문에 주눅은 들었지만 발표를 마저 할지 넌지시 물어봤지만 됐다고 한다.
 
앞으로 매일 미팅을 하자면서 내일 오후 3시에 또 모이자고 한다.
중간중간 내 생각이 확장되거나 딴 길로 가는 것을 가지치기하는 것은 좋지만 마이크로 매니징 느낌이 물씬 난다.
 
23년 9월 15일 금요일
 
어제의 나는 감정이 다쳐서 제대로 과해석에 빠졌다. 예민하게 반응하기도 했다. 나의 태도는 몹시 불량하기도 하고 관리자 입장에선 골칫덩어리가 입사한 것이다. 감정을 좀 추스르고 출근해서 어색하게 인사를 나누고 자연스럽게 대화를 주고받았다. 어제의 내 태도가 불량했다고 해서 나를 밀치는 사람은 아니었다. 내 인사에도 받아주고 하는 것을 보면 가면을 썼다고 하더라도 나랑 사이가 나빠지려고 애쓰는 사람은 아니고 잘 지내려고 하는 사람이라는 것이다. 나보다 더 오래 일하고 있던 원년멤버임에도 나를 배척하진 않았다. 그래서 조금씩 마음이 풀리면서 다시 나를 객관적으로 바라보면서 어제 들었던 말들을 다시 생각해 보면서 반성해 봤다.
 
글만 줄줄이 작성해 놔도 내가 잘 설명할 수 있다는 착각 -> 메타인지 부족
말이 어려우면 글 외에도 이미지의 도움을 받아야 했다.
결국 말이든, 글이든 목적은 커뮤니케이션. 상대방과의 원활한 의사소통이기 때문이다.
 
전에 작성했던 재현데이터 생성에 관한 자료는 꽤나 작성을 잘했다. 그걸 목요일 언급하면서 넌지시 칭찬했던 것이 기억나서 비교해 보니 재현데이터 생성 자료는 노션을 한번 거쳤던 글이었다. 정돈된 글이었기에 보기에도 꽤 좋았다.
 
알잘딱깔센으로 요구하는 것을 보니 앞으로도 할 일은 많겠다.
초안이라고 보여주겠지만 초안이 아닌 최종본의 마음으로 만들어야 할 듯하다.
 
또한, 난 대량의 정보를 와르르 쏟아내려고 하는 것은 나만의 욕심이었다. 나 역시도 다른 이들의 자료를 유심히 보지도 듣지도 않아 놓고선 말 잘하는 것도 아니면서 내 자료는 봐주길 바랐던 것이다.
타인은 그저 남의 말에 귀 기울이기 쉽지 않기에 핵심만 간단히 작성해야 한다.
 
나만의 설명론 같은 것도 필요 없다. 내가 재해석해서 쉽게 풀어 설명할 필요도 없다. 그들에겐 익숙했던 정의, 특징을 다시 듣고 싶었던 것이었고, 새로운 정보를 머릿속에 넣을 준비를 하고 있지 않았다. 무엇보다 재해석해서 쉽게 풀어 말한다는 것도 꽤 건방졌다. 석박사가 넘치는 세상에서.
 
장문의 글이 아닌 요약의 요약.
굳이 어려운 건 적지 말고 핵심적인 내용만 심플하게.
이 정도로 심플해도 되나 싶지만 한 번 혼나니까 또 혼나는 건 두렵지가 않다 ㅎㅎ
 
약간의 감정이 있음에도 최대한 가면을 쓰고 얘기하게 되었다. 그리고 적당한 거리유지는 필요하단 생각을 하게 되었다. 비슷한 또래가 많이 있다는 것에 들뜸이 있었다. 이제 막 들어와 한 달도 안된 누군지 잘 모르는 애가 깝죽거리고 다녔으니 꽤 이상하기도 할 것이다. 초등학교 전학 당시에도 한달도 안되서 깝치고 다니다가 왕따 당한 기억이 생각나네...ㅋ
 
최대한 빠르게 문서를 재작성했다.
나 스스로 타이머를 맞추고 3시 미팅 전에 내가 쓸 수 있는 시간을 쪼갰다. 의사결정트리 1시간, 앙상블 1시간, 랜덤 포레스트 2시간 안으로 소요해서 작성하겠다고 목표를 다졌다.
 
2시 PL 이상 회의가 끝나고 3시에 커피타임을 미팅으로 대체했다.
2시에 있던 회의에 대한 상황 공유와 간단한 담소를 나눴다.
 
이제 말만 잘하면 된다.
 
또, 괜찮은 아이디어가 생각났다. 내가 한창 주식에 관심갖거나, 부동산에 관심갖거나 하면 글로도 많이 보고, 영상으로도 많이 듣고, 주변 지인이랑도 대화를 하면서 그 도메인에서만 사용할 법한 용어에 대해 거리낌없이 주절주절하는 것을 떠올렸다. 그래서 데이터 관련 직무의 사람들끼리 모여서 이런 주제에 관해 자유롭게 얘기하고, 용어를 자연스럽게 익히는 모임을 만들면 좋겠다는 생각을 했다. 그러면 설령 내용이 틀려도 자신감있게 말하지 않을까? 내 자신을 학습기로 쓰는 것이다. 같은 내용을 계속 말하다 보면 성능 좋은 언변을 할 수 있지 않을까? 분석가의 말하는 모임.
 
물론 인풋을 대량으로 넣는 노력도 필요하다.
 
목요일에 있었던 내 감정은 가감 없이 작성하고 내 열폭을 기록해 놓은 것을 지우지 않은 건 나중에 내 모습을 다시 돌아볼 수 있으니까 남겨놓는다.
 


넷째 주 주말
 
결제한 강의 들어야는데...
푹 쉬었다.