파이썬 웹크롤링(1) - Bloter 기사 제목 크롤링하기

해당 포스팅은 개인적으로 파이썬을 공부한 부분을 기록해 두기 위한 포스팅입니다. 개발자는 아니지만 기획자로서 데이터분석을 위해 파이썬을 공부하고 있습니다. 오늘은 첫번째 포스팅으로 Bloter (http://www.bloter.net/) 사이트의 특정 URL 의 기사를 크롤링해 보도록 하겠습니다.

# http 요청을 보내는 request 모듈 임포트하기

import requests

from bs 4 import BeautifulSoup

# 크롤링할 URL 주소를 res 변수에 저장하기

res = request.get('http://www.bloter.net/archives/370231')

# BeautifulSoup 를 이용하여 html 파싱하기

soup = BeautifulSoup(res.content, 'html,parser')

data = soup.find('h2', 'title')

print(data.get_text())

# find_all 은 해당 태그에 속한 모든 값을 가져온다

# find_all 을 사용하기 위해서는 리스트에 담아야 하기 때문에 for 문을 사용하여 값을 하나씩 저장하여 출력해야 한다

예제 )

data = soup.find_all('p')

for item in data:

print(item.get_text())

print(item[1].get_text())

# 결과값

안드로이드10 먹은 'V50 씽큐' 참신한 기능

저작자표시 비영리 변경금지 (새창열림)

'Coding Study > Python' 카테고리의 다른 글

파이썬으로 특정 사이트 로그인해서 정보 크롤링하기 (2)	2020.02.25
파이썬 - 공공 데이터 포털 Open API XML 데이터 가져오기 (0)	2020.02.20
파이썬 - 네이버 Open API 를 이용한 쇼핑 검색결과 엑셀 파일에 저장하기 (1)	2020.02.17
파이썬 웹크롤링 - 네이버 쇼핑 BEST 100 상품명 크롤링하기 (0)	2020.02.12
파이썬 - 게시판 제목 크롤링하여 엑셀파일에 저장하기 (0)	2020.02.11

Lightsky's Traces of Life

파이썬 웹크롤링(1) - Bloter 기사 제목 크롤링하기

'Coding Study > Python' 카테고리의 다른 글

티스토리툴바

파이썬 웹크롤링(1) - Bloter 기사 제목 크롤링하기

'Coding Study > Python' 카테고리의 다른 글

'Coding Study/Python' Related Articles

티스토리툴바