[일반공지] [지환부 10-10 프로젝트] '2023 인공지능 데이터과학 겨울캠프' 안내(12/17~22)
자세한 내용은 아래 10-10프로젝트 사업책임자이신 이상묵 교수님의 말씀과 포스터를 참고해주시기 바라며, 학부 구성원 여러분의 많은 관심과 참여 부탁드립니다.
- 신청링크: https://forms.gle/aywQB2VLi9VN8Nj16
- QR코드:
서울대 지구환경과학부 10-10 사업 인공지능 데이터 과학 겨울 코드 캠프에 관해서
인공지능이라는 이름하에 새로운 기법들이 도입되면서 실험과 관측을 주로 하는 우리 지구과학도 새로운 국면에 접어들고 있습니다. 이제 단순히 지구과학적 도메인 지식 말고도 컴퓨터 능력이 중요해지는 세상이 도래하고 있습니다. 학생들은 대부분 python을 접했고 또 일부는 C++에 대해서도 공부한 적이 있을 겁니다.
참고로, 계산과학 연합전공에서는 매년 1학기 계산과학 이론 및 실습 1이라는 수업을 통해 python에 대한 기초를 가르치고 또 2학기 계산과학 이론 및 실습 2를 통해 C++의 기초를 가르치고 있습니다. 혹자는 C++은 언어가 복잡해서 과연 배울 가치가 있을까 하는데 어떤 분야에서는 계산의 속도가 매우 중요하기 때문에 C와 C++ 그리고 Fortran 같은 컴파일러 언어가 중요합니다. 또 Python의 계산 가운데 속도가 중요한 것들은 C와 C++을 기반으로 하고있습니다. 그래서 당분간 C++은 없어지지 않을 것 같습니다.
수업에서는 간단히 노트북으로 해볼 수 있는 단순한 문제들 밖에 경험해 볼 수 없습니다. 실제 큰 데이터를 활용하려면 GPU 같은 가속기가 있어야 됩니다. 머신러닝의 경우 Tensorflow와 Pytorch 같은 것을 사용하는데 그 이유는 GPU, TPU 같은 가속기를 사용할 수 있기 때문입니다. 본 캠프에서는 이처럼 수업에서는 할 수 없는 현실적인 데이터 처리를 직접 handson 경험을 통해 제공하고자 합니다. 이를 위해서는 구글 Colab 같은 서버 상의 프로그램을 활용해야 하고 또 CUDA를 비롯한 그래픽 카드를 계산에 활용할 수 있어야 합니다. 그래픽 카드를 활용하고 안 하고는 계산에 수십 배 수백 배 차이가 날 수 있습니다.
본 캠프에서는 Python과 C++에 대한 간단한 복습을 하고 머신러닝으로 이어집니다. 계산과학 연합전공 데이터 과학에서 하는 Scikit-learn의 경우 가속기를 활용하지 않기 때문에 간단한 toy problem만 다루는데 비해 본 캠프에서는 Tensorflow와 Pytorch를 통해 제대로 된 문제를 서버가 제공하는 그래픽 카드를 활용하여 공부하고자 합니다.
CUDA는 NVIDIA 회사의 proprietary 제품입니다. 최근 AMD와 Intel도 GPU를 만들고 또 연산기가 FPGA, DSP 등등 다양해지고 있습니다. 미래에는 이러한 다양한 연산기를 복합적으로 사용하게 될지도 모릅니다. 그래서 소위 heterogeneous computing 시대가 될 것 같은데 Intel의 OneAPI SYCL에 대해서도 간단한 소개와 사용 경험을 제공하려고 합니다.
강의는 외부 전문강사들을 여러분 모시고 진행하려고 합니다. 그리고 마지막에는 학생들이 팀을 짜서 간단한 경진대회도 진행하고자 합니다. 이번 겨울 코드 캠프가 성공적일 경우 앞으로도 주제를 조금씩 바꿔서 진행하고자 합니다.
서울대 지구환경과학부 10-10사업 책임자 이상묵 교수