-
Python NumPy 모듈 (1. Numpy와 List의 차이 )Python/Python 2020. 1. 20. 18:04반응형
파이선에서 인메모리 데이터를 효과적으로 적재하고 저장하고 가공하는 기법 (Numpy) 라이브러리
데이터세트는 광범위한 원천으로부터 문서나 이미지 , 사운드클립 , 수치 측정 값 등 거의 모든 것을 아우르는 매우 다양한 형식으로 들어올 수 있다. 이렇게 명백한 다양성에도 불구하고 모든 데이터를 근본적으로 숫자 배열로 간주하는것이 도움이 될 것이다.
데이터를 분석할 수 있게 만드는 첫 번째 단계는 데이터를 숫자 배열로 반환하는것이다.
숫자 배열을 다루기 위해 제공하는 전문 도구인 NumPy 패키지 이다.
파이썬 데이터 타입 이해하기
파이썬에 있는 list 는 동적인 타입으로 편리하게 작동한다 그러나 편리하게 작동하는 만큼 쉽게 단점을 보여준다.
장점은 list 는 동적으로 간단하게 배열안에 자료형 들을 여러가지 사용 할 수 있다.
그러나 이 유용성에는 단점이 있는데 유연성에 대한 비용이 든다 .
리스트의 각항목에는 타입정보와 참조횟수 ,기타 정보가 들어가야 한다.
즉 각 항목이 완전한 파이썬 객체인 셈이다. 모든 변수가 같은 타입인 경우에는 이 정보가 대부분 불필요하게 중복되므로 고정 타입 배열에 데이터를 저장하는것이 더 효율 적일 수가 있다.
이 때 고정 타입 배열로 사용하는것이 Numpy 배열이다.
그림에서도 보다 시피 Numpy와 List 는 참조 방식에 차이를 보여준다
Numpy는 유연성은 뷰족하지만 데이터를 저장하고 가공하기에는 훨씬 효율적이다.
그렇다면 Numpy 고정배열을 직접적으로 다루는것은 다음 게시물 부터 하겟다.
반응형'Python > Python' 카테고리의 다른 글
Python NumPy(6. NumPy ufuncs연산) (0) 2020.01.21 Python Numpy ( 5. 배열 연결 및 분할) (0) 2020.01.20 Python Numpy (4. Numpy 배열 인덱싱) (0) 2020.01.20 Python Numpy (3.표준 데이터 타입) (0) 2020.01.20 Python Numpy 모듈 (2. Numpy배열 생성하기) (0) 2020.01.20