zenn.skin 무료버전 배포중!
자세히보기

dataframe 3

Python/Syntax
[Pandas] 행에서 문자열, 값의 검색

DataFrame에서는 반복문 사용을 지양하고 대부분 내장함수를 사용하여 데이터를 처리합니다. 문자열을 검색할 때 "in"이나 re 모듈을 사용해서 검색을 많이 하는데 오늘은 contains에 대해 공부해보려 합니다. import pandas as pd data = [['Scarlett johansson', 160], ['Christopher Robert Evans', 183], ['Robert John Downey Jr.', 174], ['Mark Ruffalo', 173]] df = pd.DataFrame(data, columns=['name', 'height']) print(df['name'].str.contains('Jr')) 1. contains contains 메소드는 조건에 해당하는 bool..

Python/Syntax
[Pandas] 데이터 프레임 인덱스 초기화

DataFrame의 인덱스를 초기화할 때는 DataFrame.reset_index() 메소드를 사용합니다. 대부분의 메소드가 inplace를 지원하듯(DataFrame을 반환하지 않고 DataFrame의 값을 변경함) reset_index도 inplace를 지원합니다. import pandas as pd sales = pd.read_excel('매출내역.xlsx') cancel = sales.loc[sales['매출금액'] < 0] cancel.reset_index(inplace=True) cancel 별도의 설정없이 reset_index를 사용하는 경우 index가 따로 빠져나옵니다. drop=True로 설정하면 index를 별도의 열로 갖지 않고 삭제가 됩니다. import pandas as pd s..

Python/Syntax
[Pandas] 다른 데이터프레임 속성값을 이용해 값 선택, 데이터프레임 순회

두 개의 데이터프레임이 있을 때, 한 쪽 데이터프레임의 속성값을 사용해 다른 데이터 프레임에서 행을 선택하는 방법에 대해 적어보려 합니다. 다음과 같이 전체 매출 DataFrame과 반품-취소 DataFrame이 있습니다. 반품-취소 DataFrame을 사용해 전체 매출 데이터에서 해당하는 행을 얻으려 합니다. import pandas as pd selected_rows = [] for idx, item in cancel_list.iterrows(): selected_rows.append(sales.loc[(sales['판매일자'] == item['판매일자']) & (sales['매출금액'] == item['판매일자'])]) selected_rows DataFrame의 iterrows 메소드는 DataF..