会员
精通Scrapy网络爬虫
刘硕更新时间:2020-11-28 14:59:54
最新章节:本书特点:开会员,本书免费读 >
本书深入系统地介绍了Python流行框架Scrapy的相关技术及使用技巧。全书共14章,从逻辑上可分为基础篇和高级篇两部分,基础篇重点介绍Scrapy的核心元素,如spider、selector、item、link等;高级篇讲解爬虫的高级话题,如登录认证、文件下载、执行JavaScript、动态网页爬取、使用HTTP代理、分布式爬虫的编写等,并配合项目案例讲解,包括供练习使用的网站,以及京东、知乎、豆瓣、360爬虫案例等。本书案例丰富,注重实践,代码注释详尽,适合有一定Python语言基础,想学习编写复杂网络爬虫的读者使用。
品牌:清华大学
上架时间:2017-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
精通Scrapy网络爬虫最新章节
查看全部- 本书特点:
- 作者简介:
- 14.4 本章小结
- 14.3 使用scrapy-redis进行分布式爬取
- 14.2 scrapy-redis源码分析
- 14.1 Redis的使用
- 第14章 分布式爬取
- 13.6 本章小结
- 13.5 项目实战:爬取豆瓣电影信息
- 13.4 实现随机代理
刘硕
主页
同类热门书
最新上架
- 会员
Spring Cloud Alibaba微服务架构设计与开发实战
本书涵盖了SpringCloudAlibaba框架的八大核心技术主题,分别是注册中心、远程调用、负载均衡、配置中心、服务网关、消息通信、分布式事务和服务可用性。并且,通过一个系统性的项目案例,讲解企业级微服务系统开发的工程实践。其间提供大量的设计图例和示例代码,更提供配套的视频教程。对于每个主题,书中采用“技术概念和特性→框架使用方法→项目案例实战→核心原理和源码剖析”的方式讲解,使读者递进式计算机12.9万字 - 会员
细说PyTorch深度学习:理论、算法、模型与编程实现
《细说PyTorch深度学习:理论、算法、模型与编程实现》由业界专家编撰,采用理论描述加代码实践的思路,详细介绍PyTorch的理论知识及其在深度学习中的应用。全书分为两篇,共16章。第一篇为基础知识,主要介绍PyTorch的基本知识、构建开发环境、卷积网络、经典网络、模型保存和调用、网络可视化、数据加载和预处理、数据增强等内容;第二篇为高级应用,主要介绍数据分类、迁移学习、人脸检测和识别、生成对计算机11.1万字 - 会员
深入理解Go语言
本书为深入理解学习Go语言必经之路中的重点知识领域,采用大量精美详细的图文介绍,文章讲解深入浅出,极大降低了理解Golang底层精髓的学习门槛。本书包含3篇:第一篇为深度理论篇(第1章~第4章),包含深入理解Golang中GPM模型、深入理解Golang垃圾回收GC三色标记与混合写屏障、深入理解Golang内存管理模型、网络IO复用模型等。第二篇为Golang实战中需要进阶的知识盲区介绍(第5章~计算机0字 - 会员
R语言数据分析从入门到精通
《R语言数据分析从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了R语言基础知识、核心技术与高级应用。全书分为3篇,共16章,包括初识R语言、集成开发环境RStudio、R语言入门、数据结构、流程控制语句、日期和时间序列、获取数据、数据处理与清洗、数据计算与分组统计、基本绘图、ggplot2高级绘图、lattice高级绘图、基本统计分析、方差分析、回归分析和时间序列分析计算机12.2万字 - 会员
编程改变生活:用PySide6/PyQt6创建GUI程序(进阶篇·微课视频版)
本书以PySide6/PyQt6的实际应用为主线,以理论基础为核心,引导读者渐进式学习PySide6/PyQt6的编程基础和实际应用。本书共12章,可分为5部分。第一部分介绍基于项的控件、基于模型/视图的控件(第1章和第2章),第二部分介绍处理数据库、文件、路径、缓存相关的类和应用方法(第3章和第4章)、第三部分介绍使用Graphics/View框架绘图、绘制二维图表和三维图表的相关类和应用方法(计算机5.9万字 - 会员
Django 5企业级Web应用开发实战(视频教学版)
《Django5企业级Web应用开发实战:视频教学版》精选当前简单、实用和流行的Django实例代码,帮助读者学习和掌握Django5框架及其相关技术栈的开发知识。本书系统全面、内容翔实、重点突出、通俗易懂,基本涵盖Django5框架应用开发的所有技术。《Django5企业级Web应用开发实战:视频教学版》共分为13章,内容包括Django框架基础与环境搭建、常用配置、模型、视图与路由、模计算机15.9万字 - 会员
Podman实战
本书主要介绍了如何构建、管理和运行容器,解释如何将人们在Docker中学到的技能轻松地转移到Podman上,以及如果你以前从未使用过容器引擎,你该如何轻松地学习使用Podman。本书还教你使用像pod这样的高级功能,并指导你构建准备在Kubernetes边缘或内部运行的应用程序。最后,本书解释了Linux内核中用于将容器与系统和其他容器进行隔离的所有安全功能。本书适用于希望了解、开发和使用容器的软计算机11.9万字 - 会员
Python网络爬虫与数据分析从入门到实践
《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理计算机9.2万字 - 会员
算法训练营:提高篇(全彩版)
本书图文并茂、通俗易懂,详细讲解常用的算法知识,又融入大量的竞赛实例和解题技巧,可帮助读者熟练应用各种算法解决实际问题。本书总计8章。第1章讲解STL,涉及双端队列、优先队列、位图、集合、映射和STL中的常用函数;第2章讲解实用的数据结构,涉及并查集、倍增、稀疏表、区间最值查询、最近公共祖先、树状数组和线段树;第3章讲解查找算法,涉及散列表、字符串模式匹配和字典树;第4章讲解平衡树,涉及树高与性能计算机10.7万字