※Numpy
- 배열 처리에 특화된 라이브러리이다
- 다차원 배열을 나타내기 용이하다
- 파이썬이 제공하는 리스트/튜플의 느린 처리 속도를 극복하기 위한 라이브러리이다
- 배열 연산이 매우 빠르다
- ndarray(다차원 배열 객체)를 이용해 배열 연산을 수행한다
※주요기능
- 유니버셜함수
- 다양한 함수 기능 제공
- 다른 언어에 대한 인터페이스 제공
1. 유니버셜함수
- ndarray의 각 요소에 연산을 거친 후 결과를 반환한다
-> 선형대수 계산을 간결하고 가독성 높게 작성할 수 있다
2. 다양한 함수 기능 제공
배열/행렬 생성 및 조작 | 수학/선형대수 | Random Sampling |
통계함수 | index조작 | 정렬/탐색/계수 |
다항식 계산 | 데이터 입출력 | Fourier 연산 |
- 이외에도 논리 연산이나 문자열, 바이너리 등 매우 많은 함수 기능을 제공
3. 다른 언어에 대한 인터페이스 제공
- C/C++, Fortran 등에 대한 인터페이스를 제공
※Numpy가 빠른 이유&장점
1) 빠른 이유
- 효율적으로 메모리를 사용할 수 있도록 구현되어 있다
- C로 작성된 코드로 동작한다
2) 장점
- 배열연산을 C처럼 속도가 빠른 저수준 언어로 구현 가능하다
- 데이터를 CPU레지스터에 모아 효율적으로 읽어 올 수 있다 -> 속도가 빨라진다
'DataScience' 카테고리의 다른 글
이항분포의 정의와 평균, 분산 (0) | 2020.08.02 |
---|---|
베르누이분포의 정의와 평균, 분산 (0) | 2020.08.02 |
산포도 (사분위수, 범위, 분산, 표준편차) (0) | 2020.07.22 |
중심 경향성 (평균, 중앙값, 최빈값) (0) | 2020.07.22 |
기하분포의 정의와 평균 (0) | 2020.04.24 |