플레이데이터 애널리시스 부트캠프 [ 7월 4주차 ] 회고록

2023. 8. 1. 01:25Weekly diary

 

 

 

 

 

 

 

 

이번 한 주를 보내며

 

 

 

 

 

이번 주는 OpenCV (오픈소스 기반의 Computer Vision 및 이미지처리 라이브러리) 에 대해 배우기 전,

간단하게 지금까지 배운 머신러닝 모델들에 대해 복습한 한 주였습니다.

 

선형 문제를 풀기에 적합한 모델이었던 SVM(Support Vector Machine)을 사용해

선형으로는 풀 수 없는 복잡한 문제를 해결하는 방법,

반대로 PCA(주성분분석)을 사용한 차원축소 기법을 이미지 데이터에 적용해보고,

다시 축소된 데이터를 복구하는 방법을 배웠는데

이전에 배운 내용이었음에도, 새롭게 와닿는 내용들이 많았고,

그때는 쉽게 이해하지 못했던 어려운 내용들, 와닿지 않았던 것들을 이해할 수 있게 된 뜻깊은 한 주였습니다.

 

 

 

 

 


 

 

 

 

저번 주보다 발전한 나
 

 

 

 

1. 저번 주 개설한 블로그, 꾸준히 채우려 노력한 나

 

저번 주엔 Class Review를 한 개밖에 올리지 못했지만,

이번 주 Class Review에는 수업에 대한 전반적인 내용을 꽉 담아 정리했다는 게 뿌듯해요.

(그것도 두개나 올렸답니다!)

[.7 .24] SVM : Support Vector Machin (tistory.com)

 

[.7 .24] SVM : Support Vector Machin

SVM(Support Vector Machine) 주어진 데이터를 가장 잘 분류하는 초평면(hyperplane)을 찾는 알고리즘으로, 기본적으로 선형 문제를 해결하는데 최적화되어 있습니다. 하지만 비선형 문제를 풀기 위해 차원

co-co-a-jo-a.tistory.com

[.7 .25 - .7 .26 / .7 .30] PCA(Principal Component Analysis) 주성분분석 (tistory.com)

 

[.7 .25 - .7 .26 / .7 .30] PCA(Principal Component Analysis) 주성분분석

PCA(Principal Component Analysis) 데이터의 차원을 축소하는 기법으로, 데이터에 내재된 주요 정보를 유지하면서 새로운 변수(주성분)을 생성하는 방법입니다. 주성분은 데이터의 분산을 가장 많이 설

co-co-a-jo-a.tistory.com

 

 

 

 

 

 

2. 더 적극적으로 질문하기

 

모르는 걸 그냥 넘어가지 않고, 그때그때 질문하는 자세가 중요한 것 같아요.

질문할 것들을 메모해놓고 쉬는시간에 물어보는 것도 좋지만,

'방금 들은 내용이 ( ) 이런 뜻인가? 맞나?' 여기에 초점이 맞춰져서

다음 내용에 집중이 되지 않을 것 같다 싶을땐 이해한 척 고개를 끄덕이며 넘어가는 게 아니라

그 즉시 손을 들고 질문하는 게,

저에게는 정말 많은 도움이 됬어요.

 

- 수업시간에 질문을 할 경우엔, 짧고 굵게!

강사님께서 수업중에 '이해 되셨죠?' 라는 말씀을 많이 하시는데,

의문이 생기거나, 이해가 되지 않았을때 운좋게 강사님께서 저렇게 말씀해주시면

그때 손을 번쩍 들고 구체적으로 질문하는 편이에요.

(수업 맥락 끊고싶지 않아요...^^^..ㅜㅜ)

 

SVM을 예로 들면,

'SVM이 뭐에요?', '왜요?' 라고 물어보는 게 아니라

'가우시안 커널은 결국 내적이랑 비슷한데 같은 의미인가요?'

현재 수업 내용과 관련 있는 질문을, 구체화해서 물어봅니다.

 

 

 

 

 

 

 


 

 

 

 

 

 

이번 한 주 가장 아쉬운 건?

 

 

 

 

 

1. 아직 구체화되지 않은 Final Project

 

프로젝트 팀 구성, 주제 선정(현재 2개로 추려진 상황) 까지는 마쳤으나,

아직 큰 진전이 없어 팀원 모두 불안해하는 상황이에요.

논의중인 2개 주제가 전부 이미지 데이터, 영상 데이터를 핸들링 해야하는 주제라

데이터도, 학습에 사용할 모델도 꽤 무겁지 않을까 걱정하고 있어요.

 

 

 

 

2. 코딩테스트 대회 신청하지 않은 것

 

신청할까 말까 고민하다가 끝내 신청하지 못한 코테 대회...

신청해도 후회, 하지 않아도 후회(또륵ㄱ..)

어차피 어느 쪽을 선택해도 후회할 줄 알았다면

'그냥 신청하고 후회할걸' 이라는 생각이 들어 아쉬워요.

점수가 좋으면 좋은대로 좋고,

점수가 나쁘면 '더 열심히 해야겠구나' 동기부여가 되어 좋았을텐데 말이에요.

 

 

 

 

3. ADsP 공부를 시작하겠다는 저번 주 다짐을 실천하지 못한것

 

ㅎㅎ... 너무나 행복한 휴가를 보냈기에

핑계 댈 게 없네요.

다음주엔 더 열심히 살겠습니다..

 

 

 

 

 

 

 


 

 

 

 

 

어떻게 해결할 수 있을까?

 

 

 

 

 

1. 첫번째 문제 해결책

 

'고민하고 있는 2개의 주제가 과연 실현(개발) 가능한가?' 에 대한 검증이 필요했는데

그러기 위해선 일단 데이터를 열어보고, 어떤 모델을 사용할지 정하고,

그에 적합한 환경을 셋팅해야 한다는 생각이 들었어요.

팀원 모두가 프로젝트에 넣고 싶은 Tech에 공통적으로 적은 게 있었는데, 그게 OpenCV였기 때문에

저희는 일단 무거운 데이터를 다룰 테고, 최대한 가벼운 모델을 쓴다고 하더라도

학습량이 결코 적지 않을테니 환경을 먼저 만들어야 한다는 결론에 도달했습니다.

 

제 컴퓨터 사양이 꽤 괜찮았고,

팀원 분 중에 32기가 램 4개를 가지고 있는 분이 계셨는데

제 컴퓨터 메인보드에 해당 램이 호환되는지 확인했어요.

아주 운 좋게도 호환 가능한 모델이었고, 이번 주에 컴퓨터를 셋팅하기로 했습니다.

 

열어볼 데이터 용량(압축 풀기 전 1TB)은 제 메모리카드로 소화하기 어려운 용량이었기에

8TB 외장하드를 이용하기로 했습니다.

 

 

 

 

 

2. 두번째 문제 해결책

 

지금 와서 생각해보면 '꼭 1등 해야지' , '좋은 점수를 얻어야지' 하고 나갈 필요는 없었는데,

경험삼아 참가했어도 좋았을 것 같은데,

그 동안 꾸준히 코딩테스트를 하지 않았던 제 자신이 부끄러워 신청하지 못했던 것 같아요.

(다시 알고리즘 문제를 풀기 시작한게 2주 전이거든요..^^^)

 

결론 : 코딩 테스트를 열심히 하자...ㅎㅎ

 

 

 

 

 

 


 

 

 

 

 

다음 주는 어떻게?

 

 

 

이번 한 주 잘해온 Class Review 작성하는 습관은 꼭 유지하되 (복습에 엄청 도움되요),

ADsP 시험까지 3주 가량 남았기 때문에 일단은 여기에 집중하는 게 우선인 것 같아요.

혼자 하는 것도 좋지만, 사실 집에 들어오는 순간 씻고싶다, 눕고싶다, 자고싶다 하면서 긴장이 풀리는 건 사실이에요.

자격증 시험 전까지만이라도 '6시면 끝난다.' 가 아니라,  '6시부터는 ADsP공부 시간이다.' 생각하며 

미리 정해놓은 그 날의 학습량을, 학원에서 전부 소화하고 돌아오는 게 더 좋을 것 같아요.