<2023 군 장병 AI SW 역량강화> 에서 특전으로 받은 책. 이번에는 카카오엔터프라이즈의 강의를 들었는데, 딥러닝의 전반적인 내용과 실습을 들을 수 있는 시간이 되었다. 다만, 강의 하나당 50분이 넘어갔는데, 아무래도 연등과 개인정비 시간을 이용해서 듣기에 조금 길어서 부담되긴 했다. 아무래도 나는 프로그래밍 공부할 때 영상보다는 책과 documentation 찾아가면서 직접 부딪혀주는 편이 잘 맞는 사람인 것 같다. 왠지 모르게 영상으로 배우면 지루하고, 깊이가 부족한 느낌이라 추가적인 자료를 더 찾아보게 되더라…
책 혼자 공부하는 머신러닝+딥러닝
은 머신러닝 분야에 처음 입문하는 사람들을 위해 작성된 책이다. 나는 기존에 Kaggle로 문제도 풀어보고, 작년에 2022 군 장병 AI SW 역량강화 때에 엘리스코딩 주관으로 수업을 듣기도 했고, 학교에 데과기, 데학지 강의도 들어서 내용은 익숙했다. 다만, 이번에 체계적으로 전반적인 틀을 잡고 싶다는 생각이 들었고, 이 책으로 머신러닝과 딥러닝 생태계에 대한 큰그림을 잡을 수 있을 것이라고 기대했다.
1~4장은 ML에 대한 전반적인 내용, 5~6장은 ML 프레임워크에 대한 자세한 내용들, 7~9장은 딥러닝에 대한 내용들을 담고 있었다. 나의 경우 딥러닝에 대해서 알고 싶어서 1~4장을 읽은 뒤에 바로 7~9장으로 넘어갔는데, 4장을 잘 이해했다면 읽는데 큰 무리가 없었다. 트리 알고리즘이나 비지도 학습 부분은 Kaggle Competition에서 상위권을 차지하는 XGBoost, LightGBM 모델들의 기반이 되고 있는데, 딥러닝 파트를 다 읽었으니 그부분도 읽어서 완독할 예정이다.
지금은 딥러닝에 대해서 깊게 배우고 싶은 마음이 있다. Computational Chemistry 분야에서도 Pytorch 딥러닝 프레임워크를 도입하는데 e.g) OpenChem Pytorch에 대해 알아보고 직접 모델을 수정해보는 것이 현재 큰 목표다. 지난번에 읽었던 밑바닥부터 시작하는 딥러닝 3
에서 Define-by-Run 방식으로 직접 딥러닝 프레임워크를 구축해봤는데, Keras보다는 Pytorch에 가까운 구조였다. 최근에 학계나 실제 산업에서도 Tensorflow보다는 Pytorch에 대한 선호도가 높아지고 있어서 그와 관련된 책들을 구입해서 공부해보려 한다.
7월 10일에 Tree 알고리즘과 Ensemble 기법, PCA 분석까지 머신러닝 파트의 내용들을 다 다루었다. 5-6장에 해당하는 내용들인데, 아무래도 큰 틀을 잡는 것이 목적인 책이다보니 자세한 내용은 다루지 못하는 부분들이 아쉽긴 했다. Kaggle Competition에서 많이 쓰이는 XGBoost
와 lightGBM
과 같은 Histogram Tree 기법들, 그리고 Ensemble과 PCA에 대해서는 관련 책들을 더 찾아볼 필요가 있어보인다.
전반적인 머신러닝과 딥러닝의 흐름과 큰 틀을 알 수 있는 소중한 책이었다. ML 분야에 입문하려는 사람들에게는 좋은 이정표가 될 것이고, 어느 정도 알고 있었던 중급자들에게는 그동안 여기저기서 배워온 여러 기술들이 어떤 관계를 맺고 있고 차이점은 무엇인지에 대해서 배울 수 있는 책이었다. 재밌는 비유와 실제 업무를 수행하는 김대리가 된 느낌으로 책을 읽어나가다보니 일주일만에 전체 내용을 독파할 수 있었다. 앞으로 Pytorch 딥러닝 프레임워크에 대해서 더 알아보고 직접 Kaggle 데이터셋 분석과 모델 개발에 도전해볼 계획이다.
제목 | 분야 | 읽은기간 | 작가 | 추천강도 | 출판사 |
---|---|---|---|---|---|
혼자 공부하는 머신러닝+딥러닝 | 5 기술과학 | 23.07.03-23.07.10 | 박해선 | ★★★★★ | 한빛미디어 |