고성능 수치계산을 위한 라이브러리예요. 벡터 및 행렬 연산을 비롯해 평균, 표준편차, 상관관계 같은 통계적 수치 계산 등 다양한 수학적 기능을 제공하죠. NumPy의 기본 자료형인 NumPy Array는 다른 라이브러리들과 결합해서 사용할 수 있고, Pandas처럼 아예 NumPy를 기반으로 만들어진 라이브러리도 있기 때문에 NumPy를 배운다면 새로운 라이브러리도 금방 익힐 수 있답니다.
Pandas는 데이터 분석을 위한 필수 라이브러리로 여겨지고 있어요. 대용량 데이터도 쉽게 처리할 수 있도록 '데이터프레임(DataFrame)'이라는 데이터 구조를 주로 사용하는데요. 데이터를 불러오는 것부터 데이터프레임 생성, 수정, 분석, 그리고 필터링, 그룹화, 조인 같은 복잡한 기능까지 전부 수행할 수 있어요.
데이터 시각화를 위한 라이브러리로, 선형 그래프, 막대그래프, 산점도, 히스토그램 등 다양한 형태로 데이터를 표현할 수 있어요. 데이터를 효과적으로 시각화하는 것은 인사이트를 발견하고 분석 결과를 전달하는 데 있어서 매우 중요하기 때문에, 해당 라이브러리 활용법을 잘 익혀두면 좋아요.
Matplotlib을 기반으로 한 데이터 시각화 라이브러리예요. Matplotlib보다 시각적으로 더 예쁘고 고급스러운 결과물을 만들 수 있는데요. 게다가 더 간편하게 그래프를 생성할 수 있고, 그래프의 스타일을 설정할 수 있다는 장점이 있어요.
머신러닝에 유용하게 사용할 수 있는 라이브러리예요. 분류, 회귀, 클러스터링 등 광범위한 알고리즘과 프레임워크, API를 제공하기 때문에 필요한 기능을 호출하여 사용할 수 있어요. 특히 회귀 모델과 관련된 기능이 매우 편리해서, 머신러닝뿐만 아니라 통계 분야에서도 자주 사용된다고 해요.
대규모 머신러닝과 딥러닝을 위한 라이브러리예요. TensorFlow를 사용하면 머신러닝 또는 딥러닝 모델을 간편하게 구축하고 학습, 배포할 수 있어요. 주로 이미지 인식이나 자연어 처리, 필기 숫자 판별 등을 위한 신경망 학습에 사용돼요. 구글에서 개발한 라이브러리인 만큼, 지속해서 성능 개선이 이뤄져 다른 라이브러리보다 빠르고 안정적이라는 장점이 있어요.