목록Project (3)
Koo's.Co
이전 글에서 하위 카테고리 목록과 해당하는 url을 얻는 과정까지 했다. 오늘은 해당 하위 카테고리 페이지를 크롤링하고 물품에 대한 정보를 얻으려 한다. https://store.musinsa.com/app/items/lists/001001 https://store.musinsa.com/app/items/lists/001003 https://store.musinsa.com/app/items/lists/001010 저번에 얻은 하위 카테고리 리스트는 첫 번째 항목으로 하위 url을, 두 번째 항목으로 카테고리의 이름을 저장하고 있다. 'https://store.musinsa.com' + '/app/items/lists/001001' 과 같은 형식으로 하위 카테고리의 전체 url을 얻을 수 있다. sub_c..
이전 글에서 무신사 스토어 상품의 상위 카테고리를 갖고 왔다. 이번에는 상위 카테고리 밑에 있는 하위 카테고리 정보를 가져오려 한다. 하위 카테고리는 상위 카테고리 밑에 있는 카테고리를 말한다. 하위 카테고리들은 공통적으로 형식의 a태그로 구성되어 있다. 하지만 상위 카테고리를 입력받았을 때 해당하는 하위 카테고리만 출력하려고 한다. 페이지 소스를 보면 다음과 같은 규칙을 갖고 있다. 인기 "반팔 티셔츠" "셔츠/블라우스" 상위 카테고리를 감싸는 strong tag의 부모는 1) a태그이고 a태그의 부모는 2) div class="nav_menu_title~~이다. 하위 카테고리를 감싸는 div 태그는 2) div 태그와 형제이면서 3) div class="nav_category 의 자식이다. 그러므로 ..
무신사에서 상위 카테고리와 하위 카테고리를 입력하면 해당 카테고리에 있는 인기 상품 정보를 받아올 수 있는 프로그램을 만들어 보려 한다. from bs4 import BeautifulSoup from urllib.request import urlopen main_url = urlopen('https://store.musinsa.com/app/') _main_page = BeautifulSoup(main_url, 'html.parser') BeautifulSoup와 urllib 라이브러리를 이용해 웹페이지의 정보를 갖고 온다. 웹페이지는 무신사 스토어의 메인 화면을 갖고 온다. 갖고 오려는 상위 카테고리는 위와 같은 항목들이다. 페이지 소스를 확인하면 해당 카테고리들은 공통적으로 다음 태그로 구성되어 있다..