컴붕이
  • 홈
  • 태그
  • 방명록
  • 메뉴 닫기
  • 글작성
  • 방명록
  • 환경설정
    • 분류 전체보기
      • 개인공부
        • [JAVA]
        • [Python]
        • [Web]
        • [CS]
        • [DB]
        • [Oracle]
        • [Spring]
      • 알고리즘 문제풀이
        • [Python] 백준
        • [C++] 프로그래머스
      • 프로젝트
        • 레시피추천 프로그램
      • 툴 관련 및 기타
  • 홈
  • 태그
  • 방명록
프로젝트/레시피추천 프로그램

[크롤링]- 메뉴와 재료 크롤링하기

크롤링 robots.txt에 대해서 알아보고 본격적으로 크롤링을 한 내용을 포스팅하려 합니다. 이용하는 사이트는 '만개의 레시피'로 user들이 각자의 음식 레시피와 재료들을 등록하고 사람들과 소통하는 커뮤니티 사이트입니다. www.10000recipe.com/ 요리를 즐겁게~ 만개의레시피 www.10000recipe.com BeatuifulSoup에는 정말 다양한 함수가 존재했지만 필요한 목적에 맞는 크롤링, 파싱 함수들만 집중적으로 공부하고 적용하였습니다. 이 과정에서 필요한 정보인 레시피 제목, 재료, url을 위해 10000개의 레시피 사이트의 html inspection을 확인하였습니다. inspection에서 메뉴, 재료 들의 태그를 확인하였고 크롤링한 페이지에서 이들을 파싱 해내어 db에 저..

2021. 1. 3. 17:34
  • «
  • 1
  • »

공지사항

전체 카테고리

  • 분류 전체보기
    • 개인공부
      • [JAVA]
      • [Python]
      • [Web]
      • [CS]
      • [DB]
      • [Oracle]
      • [Spring]
    • 알고리즘 문제풀이
      • [Python] 백준
      • [C++] 프로그래머스
    • 프로젝트
      • 레시피추천 프로그램
    • 툴 관련 및 기타
애드센스 광고 영역
  • 최근 글
  • 최근 댓글

최근 글

최근댓글

태그

  • #Java입출력
  • #백준2798Python
  • #Scanner클래스
  • #Python입력받기
  • #Spring
  • #zip함수
  • #백준브루트포스
  • #백준2798풀이
  • #백준
  • #Java
  • #Java 상위클래스
  • #Java생성자
  • #파이썬 zip함수
  • #Java 접근제어자
  • #Python
  • #백준2798파이썬
  • #크롤링
  • #map객체
  • #자바하위클래스
  • #자바업캐스팅
  • #파이썬map함수
  • #Java문법
  • #Java업캐스팅
  • #하위클래스 생성자
  • #알고리즘
  • #Python map함수
  • #백준Bruteforce
  • #Beautifulsoup
  • #데이터분석
  • #Java상속
MORE

전체 방문자

오늘
어제
전체

블로그 인기글

Powered by Privatenote Copyright © 컴붕이 All rights reserved. TistoryWhaleSkin3.4

티스토리툴바