본문 바로가기

웹크롤링

웹 크롤링의 첫걸음: Chrome 개발자 도구와 XPath 완벽 가이드 온라인 쇼핑몰의 상품 가격을 일일이 확인하느라 시간을 허비한 경험이 있나요? 이런 반복 작업을 자동화할 수 있다면 얼마나 좋을까요? 이 글을 통해 여러분이 마법 같은 도구인 '웹 크롤링'을 활용해 이러한 반복 작업을 효율적으로 처리하는 방법을 배워보세요. 특히 Chrome 개발자 도구를 활용해 원하는 데이터를 정확하게 찾아내는 방법을 상세히 알아볼 텐데요, 이 가이드를 통해 여러분도 웹 크롤링의 달인이 되실 수 있을 거예요!웹 크롤링은 데이터 과학자, 대학생, 스타트업 대표 등 누구에게나 유용한 기술입니다. 자동화된 데이터 수집을 통해 여러분의 시간을 절약하고, 보다 의미 있는 일에 집중할 수 있도록 도와줍니다. 이제부터 함께 크롤링의 세계로 들어가 보겠습니다!크롤링이란 무엇인가? 🤔크롤링이란 웹사이트.. 더보기
파이썬으로 크롤링하기: selenium과 scrapy가 필요한 진짜 이유 크롤링으로 데이터를 수집하려다가 벽에 부딪히신 적 있으신가요? 단순한 requests만으로는 원하는 데이터를 가져올 수 없었던 경험, 다들 한 번쯤 있으시죠?🌟 크롤링의 세계로 오신 것을 환영합니다지난 주말, 한 스타트업 대표님께서 제게 연락을 주셨습니다. "전국의 카페 리뷰 데이터가 필요한데, 어떻게 하면 좋을까요?"같은 날 오후, 한 대학원생도 비슷한 고민을 털어놓았습니다. "논문 작성을 위한 SNS 데이터를 수집하고 싶은데, 자동화할 수 있는 방법이 없을까요?"이런 요청들을 들으며 문득 깨달았습니다. 많은 분들이 데이터 수집의 진짜 어려움을 겪고 계시다는 것을요.🤔 왜 단순한 크롤링으로는 부족할까요?실제 웹사이트를 한번 상상해 보세요.스크롤을 내리면 새로운 콘텐츠가 로딩되는 무한 스크롤클릭해야만.. 더보기
크몽 수업 의뢰 사전 미팅 기록 - 크롤링, DB 기록, 권한 관리 수업 일시: 2024년 10월 14일 (월) 오전 9:00 ~ 9:30주제: 웹 크롤링 구현, 데이터베이스 기록, 권한 관리 기능 구현에 대한 요구사항 및 구체적인 수업 방향과 목표 소개요구사항1. 특정 버튼 클릭 시 웹 페이지 크롤링 구현요청자님은 특정 버튼 클릭 시 목표하는 페이지를 크롤링하는 기능을 원합니다. 이 과정에서 발생할 수 있는 예외 상황을 처리하고, 안정적인 크롤링 방법에 대해 다룰 예정입니다. 사용자가 버튼을 클릭하면 특정 웹 페이지의 데이터를 자동으로 수집하여 실시간으로 데이터를 제공받는 것이 목표입니다.2. 크롤링 결과를 DB에 기록크롤링 성공 시 그 결과를 나만의 데이터베이스(DB)에 기록하는 기능을 추가합니다. 수집된 데이터를 체계적으로 정리하고 필요한 정보를 효과적으로 저장하여 추후.. 더보기
물개발자 경험을 나누다 13년 개발 경험으로 진행 중인 내용입니다. 여러분의 성장을 응원합니다. githubhttps://github.com/harry81kmonghttps://kmong.com/@%ED%98%84%EB%AF%BClinkedinhttps://linkedin.com/in/chharry 초급ChatGPT 이해와 활용목표: ChatGPT의 기본 개념을 이해하고 실생활 및 업무에 활용하는 방법을 배운다.내용:ChatGPT의 작동 원리ChatGPT의 다양한 활용 사례효과적인 질문 및 답변 실습사용 시 주의사항 AI에게 그림 그리기, Stable Diffusion 설치와 활용, Upscaler목표: AI를 이용한 이미지 생성 및 향상 방법을 익힌다.내용:AI 그림 그리기: AI의 기본 개념과 그림 생성 알고리즘 이해Sta.. 더보기
Selenium과 Scrapy를 이용해 네이버 쇼핑 크롤링하기 안녕하세요, 여러분! 오늘은 프로그래밍과 데이터 수집에 관심 있는 분들을 위해 흥미롭고 유익한 주제를 가져왔습니다. 바로 Selenium과 Scrapy를 이용해 네이버 쇼핑에서 제품명을 크롤링하는 방법을 소개해드리려고 합니다. 이 글을 통해 웹 크롤링의 기초부터 고급 기술까지 배우실 수 있을 거예요.왜 Selenium과 Scrapy를 함께 사용할까요?웹 크롤링을 할 때, 종종 동적으로 로드되는 콘텐츠를 마주하게 됩니다. 이러한 동적 콘텐츠는 일반적인 HTML 파싱으로는 접근하기 어려운데, 이때 Selenium이 큰 도움이 됩니다. Selenium은 실제 브라우저를 제어하여 JavaScript로 렌더링된 콘텐츠를 포함한 모든 페이지 요소에 접근할 수 있게 해줍니다. 반면 Scrapy는 빠르고 효율적인 크롤.. 더보기

반응형