1. Series?
- 데이터가 순차적으로 나열된 1차원 배열의 형태
- index와 value가 일대일 대응되어 저장
- value의 값은 다양한 자료형이 될 수 있음(정수, 부동소수, 문자열, Bool형 ...)
2. Series의 생성
1) Dictionary를 인자로 받는 경우
- key는 Series의 index, value는 Series의 value로 저장
import pandas as pd
dict_data = {'a': 1, 'b': 2, 'c': 3}
sr = pd.Series(dict_data)
sr
2) List를 인자로 받는 경우
- 각각의 list인자가 Series의 value로 저장
- index는 0부터 차례대로 저장
list_data = [1, True, 'Koo', 1.23]
sr2 = pd.Series(list_data)
sr2
3) index와 value
- index: 0~n 범위의 정수를 갖는 RangeIndex 객체로 표시
- values: 리스트 형태로 표시
print(sr2.index)
print(sr2.values)
sr2.index = list('abcd')
sr2
- Series.index = List 를 통해 Series의 index를 설정가능
4) Series value에 접근
- 리스트처럼 대괄호([ ])를 통해 Series의 value에 접근 가능
- 여러개의 원소를 선택할 때는 리스트 내에 리스트를 전달해 접근 가능
- 슬라이싱을 이용해 범위로 접근 가능
=> index가 문자열인 경우 마지막 원소를 포함
=> index가 정수인 경우 마지막 원소를 포함하지 않음
print("sr2['a']: ", sr['a'])
print(sr[['a', 'b']])
* 슬라이싱을 이용해 원소에 접근할 때는 문자열 index와 정수 index를 반드시 구분해서 접근해야 한다
sr2 = pd.Series([1, 2, 3, 4], index=list('abcd'))
sr3 = pd.Series([1, 2, 3, 4])
print('sr2, 문자열 인덱스')
print(sr2['a': 'c'])
print('\nsr3, 정수 인덱스')
print(sr3[0: 3])
'DataScience' 카테고리의 다른 글
통계적 추론, 추정의 의미? (0) | 2022.06.07 |
---|---|
기하평균의 의미 (0) | 2022.03.26 |
단순선형회귀 (Linear Regression) (0) | 2020.10.04 |
체르노프 부등식(Chernoff Inequality) (0) | 2020.10.03 |
마르코프 부등식, 체비셰프 부등식 (Markov Inequality, Chebyshev Inequality) (0) | 2020.09.30 |