완친파 웹크롤러 대마왕편 (완전 친절한 파이썬,데이터 수집으로 상처입은 초보를 위한 책)

정가

28,000 원

판매가

25,200 원 10 %↓

적립금

1,400 P

배송비

무료배송

배송일정

48시간 배송 예정 배송일정안내

ISBN

9791196220921

쪽수 : 440쪽

가치랩스 기술연구소 | 가치랩스 | 2019년 08월 21일

소득공제 가능도서 (자세히보기)

주문수량

책 소개

요즘 많이 화두가 되고 있는 주요 용어들이 4차 산업혁명이나 빅데이터 , 인공지능 , 로봇 , 자율주행차 등이 있습니다. 이 중에서 특히 빅데이터, 인공지능 , 로봇과 관련된 기술이나 기사들이 다양한 언론을 통해서 미래의 기술로 소개되고 있고 수많은 연구자나 학생들 , 직장인들이 미래를 준비하기 위해 이런 기술들을 배우고 있습니다. 이런 시대적 흐름을 반영한 것이 바로 서점에 인공지능이나 빅데이터 관련 기술들에 대한 분석기법이나 다양한 연구 기법을 말하고 있는 책이 아주 많이 있다는 것입니다. 그런데 말입니다 ;; 아주 중요한 사실이 있습니다. 인공지능이 미래에 아주 중요한 기술인 것은 틀림없지만 인공지능이 더 똑똑해지려면 수많은 데이터를 활용해서 학습을 해야만 합니다. 지도학습이나 비지도학습, 더 알려진 용어로 보면 딥러닝이나 강화학습 모두 인공지능이 학습할 충분한 데이터를 필요로 한다는 것입니다. 수많은 연구자나 학생들이나 회사원들이 인공지능을 더 잘 활용하고 싶어해서 관련된 책을 많이 사서 공부를 열심히 합니다. 그런데 책에 있는 좋은 이론들과 내용들을 잘 이해하고 실습하고 활용하기 위해서는 수많은 데이터들이 필요한데 이때 필요한 수많은 데이터들이 인터넷 상에 아주 많이 있습니다. 문제는 인터넷에 있는 수많은 데이터를 수집하기가 아주 어렵다는 점입니다. 이 책은 인터넷에 있는 수많은 데이터들을 어떻게 수집하면 되는지 아주 친절하게 알려 드립니다. 파이썬 언어와 Beautiful Soup , Selenium 을 활용하여 인터넷에 있는 수많은 텍스트 데이터, 이미지 데이터 , 동영상 등의 다양한 데이터를 어떻게 수집하는 지 원리부터 응용까지 자세하게 설명하고 있습니다. 지금까지 이렇게 다양한 현실적인 예제를 활용하여 원리부터 실전 적용까지 응용할 수 있도록 안내하는 책은 없었습니다. 목차를 보시고 특히 목차 중에 연습문제 목차를 보시면 확실하게 이 말의 의미를 이해하실 거예요. 책의 내용 중 Part 1 에서는 파이썬을 처음 하시는 분들을 위해 웹크롤러를 만들 때 필요한 필수 이론들을 설명하고 있어요. 여러가지 예제들을 통해서 문법을 배우시고 연습문제를 풀어 보면서 배웠던 내용을 잘 이해하고 있는지 확인을 하게 됩니다. 학교에서 교재로 사용하시는 분들은 대략 1학기에 Part 1 부분의 기본 문법을 진행하시면 됩니다. 그리고 Part 2 부터는 한국관광공사 에서 운영하는 대한민국 구석구석 이라는 웹 페이지를 모델로하여 실제 웹크롤러를 만드는 과정을 단계별로 자세하게 안내하고 있습니다. 실습을 통해서 실제 웹크롤러를 어떻게 만드는지 스스로 학습이 가능할 정도로 화면과 설명으로 안내하고 있으며 특히 연습문제로 다양한 장르 ( 인터넷 쇼핑몰 , 인터넷 뉴스 , SNS 블로그 , 유투브 , 청와대 국민청원 , 조달청 나라장터 , 레스토랑 이용후기 사이트, 기상청 날씨 정보 등) 의 인터넷 사이트의 정보를 수집하도록 안내를 하고 있습니다. 그리고 학교 강의를 하시는 교수님들을 위해서 수업용 PPT도 제공하고 있고 교재에 있는 각 챕터별 소스코드도 제공해 드리고 있습니다. 또한 웹사이트의 변경으로 인한 크롤러 코드가 변경될 경우 가치랩스의 홈페이지 (www.gachilabs.com)에서 변경된 코드를 다운로드 받을 수 있도록 안내하고 있고 책에서 언급한 웹 크롤러의 실행파일을 가치랩스 홈페이지에서 무료로 다운로드 받을 수 있도록 제공하고 있습니다. 정말 이 책의 내용을 이해하시고 응용하신다면 여러분들은 대부분의 웹사이트에 있는 정보들을 원하시는 만큼 수집할 수 있게 됩니다. 이 책의 내용들은 미래를 준비하는 여러분께 큰 힘이 되어 줄 것입니다.

저자 소개

목 차

Chap 1 - 파이썬 프로그램 설치와 주피터 노트북 설치 및 사용법 Chap 2 - 변수 사용방법과 입출력 기능 활용방법 Chap 3 - 다양한 데이터 유형과 관련 함수 사용 방법 Chap 4 - 파이썬의 조건문과 반복문 활용하기 Chap 5 - 사용자 정의 함수와 모듈 활용하기 Chap 6 - 파이썬에서의 디렉토리와 파일 관리 방법 Chap 7 - 예외처리 활용하기 Chap 8 - HTML 기본 문법 배우기 Chap 9 - Beautiful Soup 활용방법 배우기 Chap 10 - 웹 브라우저 자동화를 위한 환경설정과 자동 검색 실행하기 Chap 11 - 검색된 결과에서 텍스트 추출하여 저장하기 Chap 12 - 검색된 결과를 다양한 형식( txt ,csv ,xls) 으로 저장하기 Chap 13 - 검색 건수를 입력 받아 요약 정보 추출후 다양한 형식으로 저장하 Chap 14 - 특정 페이지의 상세 정보 추출하여 저장하기 연습문제 1 - 네이버 블로그의 상세 정보 추출하여 저장하기 Chap 15 - 여러건의 게시물의 상세 정보 추출 후 다양한 형식으로 저장하기 연습문제 1 - 서울시 응답소의 민원 사항 추출하여 다양한 형식으로 저장하기 연습문제 2 - 청와대 국민청원 게시판의 정보를 추출하여 다양한 형식으로 저장하기 연습문제 3 - 국민신문고 사이트의 다양한 민원 정보 추출하여 저장하기 연습문제 4 - 조달청 나라장터의 입찰 정보 수집하여 저장하기 연습문제 5 - 여러건의 네이버 블로그 정보를 수집하여 저장하기 연습문제 6 - 기상청의 날씨 정보 수집하여 저장하기 Chap 16 - 이미지 수집 크롤러와 파일 다운로드 크롤러 만들기 연습문제 1 - 네이버 이미지 수집용 크롤러 만들기 연습문제 2 - 구글 이미지 수집용 크롤러 만들기 연습문제 3 - pixabay 이미지 수집용 크롤러 만들기 연습문제 4 - 구글 pdf 파일 다운로드용 크롤러 만들기 Chap 17 - 다양한 SNS 의 댓글 및 리뷰 정보 수집하기 연습문제 1 - 네이버 영화 후기 수집용 크롤러 만들기 연습문제 2 - 네이버 블로그의 댓글 수집하기 연습문제 3 - 유튜브 사이트의 동영상 댓글 수집하기 연습문제 4 - 다음 카카오 사이트의 뉴스 댓글 수집하기 연습문제 5 - 네이버 카페에서 특정 게시글과 댓글 정보 수집하기 Chap 18 - 다양한 인터넷 쇼핑몰의 판매 정보 수집하기 연습문제 1 - 아마존 닷컴의 판매 정보 수집하기(상품 이미지 포함) 연습문제 2 - 네이버 쇼핑의 판매 정보 수집하기(상품 이미지 포함) 연습문제 3 - 쿠팡 사이트의 판매 정보 수집하기(상품 이미지 포함) 연습문제 4 - 지마켓 사이트의 판매 정보 수집하기(상품 이미지 포함) 연습문제 5 - 인터파크 사이트의 판매 정보 수집하기(상품 이미지 포함) 연습문제 6 - 11번가 사이트의 판매 정보 수집하기(상품 이미지 포함) 연습문제 7 - 네이버에서 특정 키워드로 업체 정보 수집하기 Chap 19 - 다양한 언론사에서의 뉴스 정보 수집하기 연습문제 1 - 조선일보 경제면 뉴스 수집하기 연습문제 2 - 한겨레신문 경제면 뉴스 수집하기 연습문제 3 - 다음카카오 사이트의 연령별 랭킹 뉴스 수집하기 연습문제 4 - 경남 도민일보의 지역별 뉴스기사 수집하기 Chap 20 - 파이썬을 활용한 텍스트 분석 및 시각화 - 한글 텍스트 분석 후 워드 클라우드와 그래프로 시각화 하기 - 영문 텍스트 분석 후 워드 클라우드와 그래프로 시각화 하기

출판사 서평

요즘 많이 화두가 되고 있는 주요 용어들이 4차 산업혁명이나 빅데이터 , 인공지능 , 로봇 , 자율주행차 등이 있습니다. 이 중에서 특히 빅데이터, 인공지능 , 로봇과 관련된 기술이나 기사들이 다양한 언론을 통해서 미래의 기술로 소개되고 있고 수많은 연구자나 학생들 , 직장인들이 미래를 준비하기 위해 이런 기술들을 배우고 있습니다. 이런 시대적 흐름을 반영한 것이 바로 서점에 인공지능이나 빅데이터 관련 기술들에 대한 분석기법이나 다양한 연구 기법을 말하고 있는 책이 아주 많이 있다는 것입니다. 그런데 말입니다 ^^;; 아주 중요한 사실이 있습니다. 인공지능이 미래에 아주 중요한 기술인 것은 틀림없지만 인공지능이 더 똑똑해지려면 수많은 데이터를 활용해서 학습을 해야만 합니다. 지도학습이나 비지도학습, 더 알려진 용어로 보면 딥러닝이나 강화학습 모두 인공지능이 학습할 충분한 데이터를 필요로 한다는 것입니다. 수많은 연구자나 학생들이나 회사원들이 인공지능을 더 잘 활용하고 싶어해서 관련된 책을 많이 사서 공부를 열심히 합니다. 그런데 책에 있는 좋은 이론들과 내용들을 잘 이해하고 실습하고 활용하기 위해서는 수많은 데이터들이 필요한데 이때 필요한 수많은 데이터들이 인터넷 상에 아주 많이 있습니다. 문제는 인터넷에 있는 수많은 데이터를 수집하기가 아주 어렵다는 점입니다. 이 책은 인터넷에 있는 수많은 데이터들을 어떻게 수집하면 되는지 아주 친절하게 알려 드립니다. 파이썬 언어와 Beautiful Soup , Selenium 을 활용하여 인터넷에 있는 수많은 텍스트 데이터, 이미지 데이터 , 동영상 등의 다양한 데이터를 어떻게 수집하는 지 원리부터 응용까지 자세하게 설명하고 있습니다. 지금까지 이렇게 다양한 현실적인 예제를 활용하여 원리부터 실전 적용까지 응용할 수 있도록 안내하는 책은 없었습니다. 목차를 보시고 특히 목차 중에 연습문제 목차를 보시면 확실하게 이 말의 의미를 이해하실 거예요. 책의 내용 중 Part 1 에서는 파이썬을 처음 하시는 분들을 위해 웹크롤러를 만들 때 필요한 필수 이론들을 설명하고 있어요. 여러가지 예제들을 통해서 문법을 배우시고 연습문제를 풀어 보면서 배웠던 내용을 잘 이해하고 있는지 확인을 하게 됩니다. 학교에서 교재로 사용하시는 분들은 대략 1학기에 Part 1 부분의 기본 문법을 진행하시면 됩니다. 그리고 Part 2 부터는 한국관광공사 에서 운영하는 대한민국 구석구석 이라는 웹 페이지를 모델로하여 실제 웹크롤러를 만드는 과정을 단계별로 자세하게 안내하고 있습니다. 실습을 통해서 실제 웹크롤러를 어떻게 만드는지 스스로 학습이 가능할 정도로 화면과 설명으로 안내하고 있으며 특히 연습문제로 다양한 장르 ( 인터넷 쇼핑몰 , 인터넷 뉴스 , SNS 블로그 , 유투브 , 청와대 국민청원 , 조달청 나라장터 , 레스토랑 이용후기 사이트, 기상청 날씨 정보 등) 의 인터넷 사이트의 정보를 수집하도록 안내를 하고 있습니다. 그리고 학교 강의를 하시는 교수님들을 위해서 수업용 PPT도 제공하고 있고 교재에 있는 각 챕터별 소스코드도 제공해 드리고 있습니다. 또한 웹사이트의 변경으로 인한 크롤러 코드가 변경될 경우 가치랩스의 홈페이지 (www.gachilabs.com)에서 변경된 코드를 다운로드 받을 수 있도록 안내하고 있고 책에서 언급한 웹 크롤러의 실행파일을 가치랩스 홈페이지에서 무료로 다운로드 받을 수 있도록 제공하고 있습니다. 정말 이 책의 내용을 이해하시고 응용하신다면 여러분들은 대부분의 웹사이트에 있는 정보들을 원하시는 만큼 수집할 수 있게 됩니다. 이 책의 내용들은 미래를 준비하는 여러분께 큰 힘이 되어 줄 것입니다.

고객 리뷰

고객리뷰 쓰기 새 창 더보기

평점	리뷰제목	작성자	작성일	내용보기

아직 작성된 리뷰가 없습니다.

반품/교환

완친파 웹크롤러 대마왕편 (완전 친절한 파이썬,데이터 수집으로 상처입은 초보를 위한 책)

회원메뉴

쇼핑몰 검색

완친파 웹크롤러 대마왕편 (완전 친절한 파이썬,데이터 수집으로 상처입은 초보를 위한 책)

고객센터

(평일 09:30~17:30)

(점심 12:00~13:00)