Pandas Part 1. Series

Date:     Updated:

카테고리:

태그:

Pandas


  • 구조화된 데이터를 효과적으로 처리하고 저장
  • Array 계산에 특화된 Numpy를 기반으로 설계

Series


  • numpy array가 보강된 형태
  • Data와 Index를 가지고 있음
import pandas as pd

data = pd.Series([1,2,3,4])
data  

# 1,2,3,4
'''
0 1
1 2 
2 3
3 4
dtype: int64
'''


인덱스를 가지고 있고 인덱스로 접근 가능

data = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
data['b']

# 2
'''
a 1
b 2
c 3
d 4
dtype: int64
'''


name 인자로 이름을 지정할 수 있음

data = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'], name='Title')

'''
a 1
b 2
c 5
d 4
Name: Title, dtype: int64
'''

Dictionary로 변환

population_dict = {
    'korea': 5180,
    'japan': 12718,
    'china': 141500,
    'usa': 32676
}
population = pd.Series(population_dict)

'''
china 141500
japna 12718
korea 5180
usa 32676
dtype: int64
'''
# key값 정렬도 되는 모양이다..

Basic 카테고리 내 다른 글 보러가기

댓글 남기기