본문 바로가기

카테고리 없음

판다스

1. 판다스(Pandas)

  • 데이터 분석을 위한 파이썬 라이브러리 중 하나로, 표 형태의 데이터나 다양한 형태의 데이터를 쉽게 처리하고 분석
  • 데이터프레임(DataFrame)이라는 자료구조를 제공
!pip install pandas

import pandas as pd

2. Series와 DataFrame

2-1. Series

  • Series는 1차원 배열과 같은 자료구조로 하나의 열을 나타냄
  • Series의 각 요소는 인덱스(index)와 값(value)으로 구성되어 있음
  • 값은 넘파이의 ndarray 기반으로 저장됨
  • Series는 다양한 데이터 타입을 가질 수 있으며 정수, 실수, 문자열 등 다양한 형태의 데이터를 담을 수 있음

2-2.  DataFrame

  • 데이터프레임은 판다스 라이브러리에서 제공하는 중요하고 강력한 데이터 구조로 2차원의 테이블 형태 데이터를 다룸
  • 데이터프레임의 각 요소는 인덱스(index), 열(column), 값(value)으로 구성되어 있음
  • 데이터프레임은 행과 열로 이루어져 있으며, 각 열은 다양한 데이터 타입을 가질 수 있음
  • 값은 넘파이의 ndarray 기반으로 저장

2-3. 딕셔너리를 사용하여 데이터프레임을 생성하기

2-4. ndarray 인덱싱과 슬라이싱

2-5. Fancy Indexing

  • 정수 배열이나 불리언 배열을 사용하여 배열의 일부를 선택하는 방법
  • 여러 개의 요소를 한 번에 선택하거나 조건에 맞게 선택할 수 있음