
会员
网络数据采集技术:Java网络爬虫实战
钱洋等更新时间:2020-09-29 15:50:25
最新章节:9.4 本章小结开会员,本书免费读 >
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
网络数据采集技术:Java网络爬虫实战最新章节
查看全部- 9.4 本章小结
- 9.3 WebMagic的使用
- 9.2 WebCollector的使用
- 9.1 Crawler4j的使用
- 第9章 网络爬虫开源框架
- 8.9 本章小结
- 8.8 截取验证码
- 8.7 隐藏浏览器
- 8.6 动态加载JavaScript数据(操作滚动条)
- 8.5 模拟登录
钱洋等
主页
最新上架
- 会员
编程改变生活:用PySide6/PyQt6创建GUI程序(进阶篇·微课视频版)
本书以PySide6/PyQt6的实际应用为主线,以理论基础为核心,引导读者渐进式学习PySide6/PyQt6的编程基础和实际应用。本书共12章,可分为5部分。第一部分介绍基于项的控件、基于模型/视图的控件(第1章和第2章),第二部分介绍处理数据库、文件、路径、缓存相关的类和应用方法(第3章和第4章)、第三部分介绍使用Graphics/View框架绘图、绘制二维图表和三维图表的相关类和应用方法(计算机5.9万字 - 会员
Arduino机器人系统设计及开发
Arduino是一款便捷灵活、方便上手的开源电子原型平台。本书系统地讲解了Arduino系统的构成、ArduinoIDE的安装及使用,以及常用的两种Arduino控制器的使用,并通过机器人比赛案例,对具体项目进行了剖析,从任务要求到器材选择,再到整机组装、程序编写、程序调试,为读者对具体项目的操作应用起到一个抛砖引玉的作用。本书主要适合中小学生和对机器人感兴趣的初学者使用。计算机2.2万字 - 会员
Java到Kotlin:代码重构指南
本书讲述了如何从Java过渡到Kotlin,主要关注代码,每章都阐述了从Java过渡到Kotlin的一个方面,考察了典型Java项目在这个过程中可以改进的方面。比如,从Optional到nullable,从Bean到值,从开放类到密封类。每章首先解释关键概念,然后展示如何在保持互操作性的前提下,逐步且安全地将生产型Java代码重构为惯用的Kotlin代码,由此产生的代码更简单、更有表现力,也更容易计算机14.5万字 - 会员
数据库管理与开发项目教程:MySQL(微课版·第4版)
本书以MySQL为平台,从数据库管理和开发的角度出发,介绍开发数据库应用系统所需的基础知识和技术。本书将一个贯穿全书的数据库应用系统开发实例“学生信息管理系统”融入各项目,将每个项目分解成若干任务,使读者逐步学会创建、管理、开发数据库,并掌握使用SQL进行程序设计的编程思想和技术。本书内容由浅入深,由实践到理论,再从理论到实践,通过任务驱动的方式将理论与实践密切结合,体现了高职高专和应用型本科教育计算机12.6万字 - 会员
Python应用轻松入门
本书以实战项目为主线,系统介绍了Python在自动化办公、图像处理、控制各种传感器、搭建网络等工作中的实际应用案例,能够让初学者快速入门Python系列知识。全书共分为18章,第一篇为Python基础(第1章~第3章),详细介绍了Python的基础知识;第二篇为自动化办公(第4章~第6章),介绍了Word、Excel、PPT、txt、csv、JSON、图像、声频、视频等各种文件的自动化操作;第三篇计算机12.8万字 - 会员
Go语言从入门到精通
《Go语言从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了Go语言的基础、进阶提高和高级应用知识。全书分为4篇,共19章,包括初识Go语言、Go语言基础、Go语言基本数据类型与运算符、流程控制、复合数据类型、函数、指针、结构体、接口、错误处理、并发编程、包管理、标准库、编译与测试工具、反射、MySQL数据库编程、文件处理、网络编程和Go语言在爬虫中的应用等内容。所有知计算机9.9万字 - 会员
机器学习系统:设计和实现
本书系统地介绍了机器学习系统的设计原则和实践经验,侧重于介绍机器学习的原理、神经网络和优化器、自动差分算法、机器学习系统编程模型、控制流和数据流,异构硬件加速器的原理和编程、数据流图编译器前端、数据流图编译器后端、数据准备和增强、模型部署相关技术、分布式训练、弹性训练、联合训练和评估平台、调试和优化工具、数据隐私和安全等。在讲授的过程中,本书将根据MindSpore的自身特点,在各个章节突出讨论M计算机19.7万字 - 会员
Java高级程序设计
本书系统地介绍了Java语言高级程序设计内容,主要包括Java集合框架、异常处理、输入/输出流、多线程、网络编程、图形用户界面程序设计、泛型、JDBC编程、Java8新特性。本书所有知识点都结合具体实例进行分析,既注重理论介绍,又强调实际应用,从实用的角度精心设计知识结构和代码示例,同时每章后面配有相应习题。本书可作为普通高等院校计算机及相关专业Java程序设计课程的教材,也适合程序开发人员学习计算机8.8万字 - 会员
Java Web基础与实例教程
本书采用“任务驱动”的编写模式,由浅入深、循序渐进、系统地介绍了JavaWeb开发的相关知识。通过实际应用的案例,帮助读者巩固所学知识,以便更好地进行开发实践。全书共15章,内容涵盖了JavaWeb开发基础知识、Servlet接收GET请求数据、Servlet接收POST请求数据、Servlet生成HTTP响应数据、异步请求和异步响应、会话控制技术:Cookie与Session、过滤器Filt计算机16.7万字