전공과 직업분야를 망라하여 데이터 처리와 분석, 머신러닝과 인공지능이 큰 이슈가 되고 있다.
최근 정부가 한국판 뉴딜로 '디지털 뉴딜'을 발표하면서 디지털 인프라 구축, 비대면화 산업 육성, 사회간접자본(SOC)의 디지털화의 3대 영역 프로젝트를 발표하면서, 2020 R&D 분야 예산안에서 Data, 5G, AI에 대한 적극적인 투자 확대 의지를 밝히기도 했다.
Data Science, Machine Learning, Deep Learning은 공부를 할수록 그리고 실제 데이터를 다룰수록 데이터의 양이 급격히 늘어나며, 데이터의 질(오탈자, 불필요한 데이터 등)이 좋지 않은 경우가 흔하다. 이러한 데이터를 효율적으로 처리하고 분석하기 위한 라이브러리와 메소드가 제공되며, 연산속도가 빠르고 진입장벽이 낮다는 Python은 각종 데이터를 다루는 모든 이들의 이목을 끌고 있다.
Python은 그 인기만큼 다양한 플랫폼을 통해 학습할 수 있다. 아래에서는 대표적인 초보자용 온라인 플랫폼들을 소개하고 Python을 배우고자 하는 분들의 플랫폼 결정에 도움이 되는 내용을 담고자 한다. 초보자용 온라인 플랫폼이라함은, 인터넷으로 연결된 외부 클라우드를 무료 또는 유료로 이용하여 저사양의 PC나 노트북에서도 데이터 처리와 기계학습을 진행할 수 있는 플랫폼을 일컫는다.
구글의 주피터 노트북으로, 인터넷이 연결되어 있다면 언제든지 접속하여 Python 코드를 실행할 수 있고, 자신의 Google ID와 연동하여 15GB의 데이터를 저장 및 불러오기 가능하다. 무료로 이용하더라도 12GB의 메모리와 GPU를 사용할 수 있다. 노트북의 런타임은 12시간(활동이 없을 시 1시간)으로 제한되는 단점이 있다. Colab의 개발 환경은 아래 그림을 참조하기 바라며, 여기서 브라우저는 Google Chrome을 이용해야할 것만 같은 느낌이다.
실제로 Internet Explorer, Microsoft Edge를 이용할 경우 호환에 대한 경고 메시지가 뜨며, Google Research에서는 Chrome, Firefox, Safari의 최신 버전에서 Colab에 접속할 것을 추천하고 있다.
리플릿은 노트북 형태의 개발환경은 아니지만 꼭 필요한 창만 띄워 심플하게 환경을 구성해두었고, 로그인 없이 단 몇 초만에 가상환경을 생성할 수 있다. 무료 이용자의 경우 100MB의 저장공간과 500MB의 메모리 내로 제한되며, 그 이상이 필요할 경우 유료 구독자가 되거나 다른 플랫폼을 사용할 수 있다.
다양한 언어(Python, Nodejs, C/C++, Java, Ruby, HTML, CSS, JS, Scheme, Go, Rust 등)를 지원하며, 손쉽게 코드를 컴파일을 할 수 있기 때문에 Youtube 등 각종 온라인 Learning Course 또는 코딩테스트 진행 시 유용하게 사용하고 있다. 리플릿의 개발 환경은 아래 그림을 참조하기 바라며 마찬가지로 Chrome 브라우저로 접속하였다.