이 영역을 누르면 첫 페이지로 이동
일반인의 웹 개발일기 블로그의 첫 페이지로 이동

일반인의 웹 개발일기

페이지 맨 위로 올라가기

일반인의 웹 개발일기

웹 개발과 관련된 모든 이야기

Selenium

  • 일반인의 웹 개발일기
[Spring Boot] Java로 웹 크롤링 하기 - Jsoup

[Spring Boot] Java로 웹 크롤링 하기 - Jsoup

2023.01.02
이번 프로젝트는 유독 다른 웹 페이지의 정보들이 많이 필요했는데 그래서 웹 페이지 크롤링해야 되는 작업이 많았다. 웹 페이지 크롤링이란? 웹 페이지 HTML을 그대로 가져와서 필요한 모든 정보들을 추출해 내는 행위 프로젝트에서 웹 크롤링을 어떤 언어로 할지 고민을 좀 하긴 했다. 내가 사이드 프로젝트에 합류하기 전에 팀원이 작성해둔 크롤링 파이썬(Python) 코드가 있었지만 앞으로 내가 개발하고 운영해야 하기 때문에 자바로 해야 더 효율적이라는 판단을 내렸다. 그래서 내 맘대로 Jsoup을 사용하기로 했다. 자바(Java)를 사용해서 개발중이라 웹 크롤링 관련 라이브러리를 찾아보니 Jsoup 라이브러리를 찾을 수 있었다. Jsoup 공식 페이지를 들어가서 보니까 사용법도 어렵지 않아 보이고 빠르게 적용..
[Spring Boot] Java로 웹 크롤링 하기 - Selenium

[Spring Boot] Java로 웹 크롤링 하기 - Selenium

2022.12.26
지난번 포스팅에서는 Spring Boot 환경에서 웹 크롤링을 하기 위해 Java 라이브러리인 Jsoup을 어떻게 적용하고, 사용하는지에 대해 확인하면서 정적인 페이지만 크롤링 가능하다는 점을 알게 되었다. (Jsoup은 동적 페이지는 크롤링을 하지 못한다.) 이를 해결하기 위해 또 다른 크롤링 라이브러리인 셀레니움(Selenium)에 대해 알아보려고 한다. 공식 홈페이지에 따르면 웹 브라우저의 자동화를 가능하게 하고 다양한 도구와 라이브러리를 지원하는 프로젝트라고 되어 있다. Selenium Selenium automates browsers. That's it! www.selenium.dev 바로 시작해보자😉 Selenium 라이브러리 적용 및 사용하기 1. 예제 살펴보기 Selenium 공식 홈페이지..
  • 최신
    • 1
  • 다음

정보

일반인의 웹 개발일기 블로그의 첫 페이지로 이동

일반인의 웹 개발일기

  • 일반인의 웹 개발일기의 첫 페이지로 이동
반응형

검색

메뉴

  • 홈
  • 태그
  • 방명록

카테고리

  • 분류 전체보기 (47)
    • 사이드 프로젝트 (3)
      • 크롤링 (2)
    • 개발 이야기 (18)
      • MSA (7)
      • Spring Boot (3)
      • JPA (0)
      • Docker (1)
      • Javascript (2)
      • AWS (Amazon Web Services) (5)
      • Jenkins (0)
    • Database (4)
      • PostgreSQL (2)
      • MySQL (1)
      • Oracle (1)
    • 에러 정리 (4)
      • Docker (1)
      • JPA (1)
      • Python (1)
      • PostgreSQL (1)
    • 운영체제 (3)
      • Linux (3)
    • 게임 (8)
      • 마인크래프트(Minecraft) (2)
      • 팰월드(PalWorld) (6)
    • 워킹홀리데이 (6)
      • 일본 워킹 홀리데이 (6)

공지사항

인기 글

최근 글

정보

흔하디흔한개발자의 일반인의 웹 개발일기

일반인의 웹 개발일기

흔하디흔한개발자

블로그 구독하기

  • 구독하기
  • RSS 피드

방문자

  • 전체 방문자
  • 오늘
  • 어제

티스토리

  • 티스토리 홈
  • 이 블로그 관리하기
  • 글쓰기
Powered by Tistory / Kakao. © 흔하디흔한개발자. Designed by Fraccino.

티스토리툴바