Koo's.Co

[Pandas] Series 본문

DataScience

[Pandas] Series

kth321 2021. 12. 30. 23:12

1. Series?

- 데이터가 순차적으로 나열된 1차원 배열의 형태

- index와 value가 일대일 대응되어 저장

- value의 값은 다양한 자료형이 될 수 있음(정수, 부동소수, 문자열, Bool형 ...)

 

2. Series의 생성

1) Dictionary를 인자로 받는 경우

- key는 Series의  index, value는 Series의 value로 저장

import pandas as pd

dict_data = {'a': 1, 'b': 2, 'c': 3}

sr = pd.Series(dict_data)
sr

 

2) List를 인자로 받는 경우

- 각각의 list인자가 Series의 value로 저장

- index는 0부터 차례대로 저장

list_data = [1, True, 'Koo', 1.23]
sr2 = pd.Series(list_data)
sr2

 

3) index와 value

- index: 0~n 범위의 정수를 갖는 RangeIndex 객체로 표시

- values: 리스트 형태로 표시

print(sr2.index)
print(sr2.values)

sr2.index = list('abcd')
sr2

- Series.index = List 를 통해 Series의 index를 설정가능

4) Series value에 접근

- 리스트처럼 대괄호([ ])를 통해 Series의 value에 접근 가능

- 여러개의 원소를 선택할 때는 리스트 내에 리스트를 전달해 접근 가능

- 슬라이싱을 이용해 범위로 접근 가능

    => index가 문자열인 경우 마지막 원소를 포함

    => index가 정수인 경우 마지막 원소를 포함하지 않음

print("sr2['a']: ", sr['a'])

print(sr[['a', 'b']])

여러개 원소에 접근

 

* 슬라이싱을 이용해 원소에 접근할 때는 문자열 index와 정수 index를 반드시 구분해서 접근해야 한다

sr2 = pd.Series([1, 2, 3, 4], index=list('abcd'))
sr3 = pd.Series([1, 2, 3, 4])

print('sr2, 문자열 인덱스')
print(sr2['a': 'c'])
print('\nsr3, 정수 인덱스')
print(sr3[0: 3])

Comments