[Python] 네이버 뉴스 기사 태그 출력하기

2022. 9. 29. 15:32·python/자동화
728x90
반응형

https://sillon-coding.tistory.com/302

 

[Python] 네이버 뉴스 기사 웹 크롤링 - 매크로

해당 사이트를 참고하여 게시글을 작성하였습니다. 1단계. 원하는 웹 페이지의 html문서를 싹 긁어온다. 2단계. 긁어온 html 문서를 파싱(Parsing)한다. 3단계. 파싱한 html 문서에서 원하는 것을 골

sillon-coding.tistory.com

 

이전 포스트에서 해결 안되었던 부분을 해결해보겠습니다..^^

스포를 조금 하자면... 해결하지 못했습니다! 그 이유는 HTML 태그 일부 출력이 되지 않기 때문입니다.

그 과정을 포스팅 해보겠습니다..^^

 

from bs4 import BeautifulSoup
import urllib.request as req # 특정 웹사이트로 접속하기 위해

url = "https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=100"
res = req.urlopen(url).read()
soup = BeautifulSoup(res, 'html.parser') #분석 용이하게 파싱

print(soup)

네이버 뉴스 정치 부분에서 html 코드를 추출해봅시다

 

출력 결과는 HTML 태그 전체가 추출됩니다.

 

저는 밑에 있는 기사만 추출할거기때문에 일단 거기에 대한 내용이 있는 태그를 추출해봅시다

 

 

 

저는 여기서 위의 헤드라인 기사가 아닌 아래부분의 기사를 추출할 것입니다..

 

태그를 살펴보면 아래와 같습니다.

 

from bs4 import BeautifulSoup
import urllib.request as req # 특정 웹사이트로 접속하기 위해

url = "https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=100"
res = req.urlopen(url).read()
soup = BeautifulSoup(res, 'html.parser') #분석 용이하게 파싱
find_tag = soup.findAll("div",{"class":"section_body"})
print(find_tag)

아래 기사부터는 왜인지 태그가 출력이 안되는 모습을 볼 수 있었습니다.

그 이유는 저도 모름... 그래서 다른 방법을 찾아봐야할 것 같습니다.

원래 개발자모드로 태그를 뜯어보면 이 사이에 리스트 아이템 등 여러가지 태그가 있습니다. 하지만 출력해본 결과로는 모두 출력되지 않았습니다 ㅠㅠ

오늘도 해결 실패!

728x90
반응형

'python > 자동화' 카테고리의 다른 글

[Python] 웹크롤링 - 태그를 이용해서 크롤링하기 - (3) 사전을 Json파일로 저장  (0) 2023.03.07
[Python] 웹크롤링 - 태그를 이용해서 크롤링하기 - (2) 사전구축  (0) 2023.03.07
[Python] 웹 자동화 기초 - 경고창 이동, 쿠키, 자바스크립트 코드 실행  (1) 2022.09.29
[Python] 웹 자동화 기초 - 엘레먼트(클릭, 텍스트, 프레임 이동)  (0) 2022.09.29
[Python] 웹 자동화 기초 - 브라우저 열기, 닫기, 탭 이동  (0) 2022.09.29
'python/자동화' 카테고리의 다른 글
  • [Python] 웹크롤링 - 태그를 이용해서 크롤링하기 - (3) 사전을 Json파일로 저장
  • [Python] 웹크롤링 - 태그를 이용해서 크롤링하기 - (2) 사전구축
  • [Python] 웹 자동화 기초 - 경고창 이동, 쿠키, 자바스크립트 코드 실행
  • [Python] 웹 자동화 기초 - 엘레먼트(클릭, 텍스트, 프레임 이동)
sillon
sillon
꾸준해지려고 합니다..
    반응형
  • sillon
    sillon coding
    sillon
  • 전체
    오늘
    어제
    • menu (614)
      • notice (2)
      • python (68)
        • 자료구조 & 알고리즘 (23)
        • 라이브러리 (19)
        • 기초 (8)
        • 자동화 (14)
        • 보안 (1)
      • coding test - python (301)
        • Programmers (166)
        • 백준 (76)
        • Code Tree (22)
        • 기본기 문제 (37)
      • coding test - C++ (5)
        • Programmers (4)
        • 백준 (1)
        • 기본기문제 (0)
      • 공부정리 (5)
        • 신호처리 시스템 (0)
        • Deep learnig & Machine lear.. (41)
        • Data Science (18)
        • Computer Vision (17)
        • NLP (40)
        • Dacon (2)
        • 모두를 위한 딥러닝 (강의 정리) (4)
        • 모두의 딥러닝 (교재 정리) (9)
        • 통계 (2)
      • HCI (23)
        • Haptics (7)
        • Graphics (11)
        • Arduino (4)
      • Project (21)
        • Web Project (1)
        • App Project (1)
        • Paper Project (1)
        • 캡스톤디자인2 (17)
        • etc (1)
      • OS (10)
        • Ubuntu (9)
        • Rasberry pi (1)
      • App & Web (9)
        • Android (7)
        • javascript (2)
      • C++ (5)
        • 기초 (5)
      • Cloud & SERVER (8)
        • Git (2)
        • Docker (1)
        • DB (4)
      • Paper (7)
        • NLP Paper review (6)
      • 데이터 분석 (0)
        • GIS (0)
      • daily (2)
        • 대학원 준비 (0)
      • 영어공부 (6)
        • job interview (2)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    programmers
    백준
    소수
    Python
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
sillon
[Python] 네이버 뉴스 기사 태그 출력하기
상단으로

티스토리툴바