잔망스럽게
2020. 3. 15. 07:50
설치방법 | pip install pandas |
설명 | 판다스(pandas)는 파이썬 언어로 작성된 데이터를 분석 및 조작하기 위한 소프트웨어 라이브러리이다. 판다스는 수치형 테이블과 시계열 데이터를 조작하고 운영하기 위한 데이터를 제공하는데, 3조항 BSD 라이선스 조건 하에서 무료로 사용 가능하다. 판다스의 이름은 계량 경제학에서 사용되는 용어인 'PANel DAta'의 앞 글자를 따서 지어졌다. 당연히 실제 동물인 판다와는 아무런 관련이 없지만, 이름이 이름이니만큼 각종 개발 관련 사이트에서 판다 이미지를 활용하여 판다스를 소개하곤 한다. 판다스는 R에서 사용되던 data.frame 구조를 본뜬 DataFrame이라는 구조를 사용하기 때문에, R의 data.frame에서 사용하던 기능 상당수를 무리없이 사용할 수 있도록 만들었다. 더욱이 파이썬이라는 접근성이 좋은 언어 기반으로 동작하기 때문에 데이터 분석을 파이썬으로 입문하는 사람들이 필수적으로 사용하는 라이브러리가 되었다. |
주요특징 | 통합 인덱싱을 활용한 데이터 조작을 가능하게 하는 데이터프레임(DataFrame) 오브젝트 - 인메모리(in-memory) 데이터 구조와 다양한 파일 포맷들 간의 데이터 읽기/쓰기 환경 지원 - 데이터 결측치의 정렬 및 처리 - 데이터셋의 재구조화 및 피보팅 - 레이블 기반의 슬라이싱, 잘 지원된 인덱싱, 대용량 데이터셋에 대한 서브셋 지원 - 데이터 구조의 칼럼 추가 및 삭제 - 데이터셋의 분할-적용-병합을 통한 GroupBy 엔진 지원 - 데이터셋 병합(merging) 및 조인(joining) 지원 - 저차원 데이터에서의 고차원 데이터 처리를 위한 계층적 축 인덱싱 지원 - date range, 빈도 변환, 이동 창 통계, 이동 창 선형회귀, 날짜 이동 등의 시계열 작업 지원 - 데이터 필터 지원 판다스 라이브러리의 주요 코드는 Cython이나 C로 작성되었으며, 퍼포먼스에 최적화되어있다. |
pandas - 나무위키
- 통합 인덱싱을 활용한 데이터 조작을 가능하게 하는 데이터프레임(DataFrame) 오브젝트 - 인메모리(in-memory) 데이터 구조와 다양한 파일 포맷들 간의 데이터 읽기/쓰기 환경 지원 - 데이터 결측치의 정렬 및 처리 - 데이터셋의 재구조화 및 피보팅 - 레이블 기반의 슬라이싱, 잘 지원된 인덱싱, 대용량 데이터셋에 대한 서브셋 지원 - 데이터 구조의 칼럼 추가 및 삭제 - 데이터셋의 분할-적용-병합을 통한 GroupBy 엔진 지원 - 데이터셋
namu.wiki
pandasAPI : https://pandas.pydata.org/docs/reference/index.html
라이브러리 사전
라이브러리(library) 라이브러리(library)는 모듈(module)이라고도 불리며, 자주쓰는 함수, 변수, 클래스들을 모아 놓은 파이썬 파일이다. 파이썬을 설치했을 때 기본적으로 같이 설치되거나 내장되 있는 것도 있..
h0n9670.tistory.com