会员
自己动手写网络爬虫(修订版)
罗刚编著更新时间:2021-04-02 22:21:53
最新章节:本章小结开会员,本书免费读 >
本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教程。
品牌:清华大学
上架时间:2016-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
自己动手写网络爬虫(修订版)最新章节
查看全部- 本章小结
- 10.2 网页聚类
- 10.1 网页分类
- 第10章 分类与聚类的应用
- 本章小结
- 9.4 分布式文档排重
- 9.3 SimHash排重
- 9.2 利用“语义指纹”排重
- 9.1 何为“重复”的文档
- 第9章 去掉“重复”的文档
罗刚编著
主页
同类热门书
最新上架
- 会员
Python人工智能编程实践
本书在不涉及大量数学与编程知识的前提下,从零开始,逐步带领读者熟悉并掌握当下最新的基于Python3的人工智能编程工具,包括但不限于数据分析(Pandas),以及支持单机(Scikitlearn)、深度(PyTorch、TensorFlow、PaddlePaddle)和分布式(PySparkML)机器学习的开源程序库,等等。全书共分为4部分,分别如下。入门篇:包括对全书核心概念的指南性介绍,计算机9.4万字 - 会员
大数据可视化编程和应用
《大数据可视化编程和应用》从基础开始,全面介绍大数据可视化的底层原理和实现框架,并重点讲解一些常用的大数据可视化关键技术,包括Excel图表、TableauDesktop可视化组件、Web的可视化控件、Java可视化控件及Python数据可视化工具。《大数据可视化编程和应用》共分为8章,第1章着重介绍大数据的发展历程,以及在大数据发展背景下数据可视化的概念、可视化技术的使用及可视化的现实意义;第2计算机4.2万字 - 会员
Java从入门到精通(第7版)
《Java从入门到精通(第7版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细讲解了使用Java语言进行程序开发需要掌握的知识。全书分为4篇共24章,内容包括初识Java,开发工具(IDEA、Eclipse),Java语言基础,流程控制,数组,类和对象,继承、多态、抽象类与接口,包和内部类,异常处理,字符串,常用类库,集合类,枚举类型与泛型,lambda表达式与流处理,I/O(输入/计算机20.4万字 - 会员
剑指JVM:虚拟机实践与性能调优
《剑指JVM:虚拟机实践与性能调优》共分5篇:引言篇讲述了Java与Java虚拟机的关系,以及Java虚拟机的相关知识;第1篇讲述了运行时数据区,涉及Java内存区域的各个核心结构,以及对象创建的各种细节;第2篇讲述了垃圾收集,涉及各种收集算法、垃圾收集器;第3篇讲述了字节码与类的加载;第4篇讲述了性能监控与调优,带领读者学习Java虚拟机常用的监控与调优工具,并附有企业级的性能调优案例。计算机23万字 - 会员
算法训练营:提高篇(全彩版)
本书图文并茂、通俗易懂,详细讲解常用的算法知识,又融入大量的竞赛实例和解题技巧,可帮助读者熟练应用各种算法解决实际问题。本书总计8章。第1章讲解STL,涉及双端队列、优先队列、位图、集合、映射和STL中的常用函数;第2章讲解实用的数据结构,涉及并查集、倍增、稀疏表、区间最值查询、最近公共祖先、树状数组和线段树;第3章讲解查找算法,涉及散列表、字符串模式匹配和字典树;第4章讲解平衡树,涉及树高与性能计算机10.7万字 - 会员
C++从入门到精通(第6版)
《C++从入门到精通(第6版)》从初学者角度出发,以通俗易懂的语言和丰富多彩的实例,详细讲解了C++程序开发需要掌握的知识。本书分为4篇共19章:第1篇是基础知识,包括绪论,数据类型,运算符与表达式,条件判断语句,循环语句,函数,数组、指针和引用,以及构造数据类型;第2篇是面向对象,包括面向对象编程,类和对象,以及继承与派生;第3篇是高级应用,包括模板、标准模板库、RTTI与异常处理、程序调试、文计算机14.7万字 - 会员
写给设计师的技术书:从智能终端到感知交互
随着人机交互和AI技术的快速发展,设计师需要从基于屏幕的图形用户界面设计思维,转变为空间交互及智能交互的设计思维。本书从设计师要懂技术的原因讲起,引导设计师结合技术去思考设计,并针对跨设备交互设计、基于AI的设计及各种传感技术(姿态和手势识别、人脸识别和追踪、眼动追踪等)进行解读与案例分析,帮助设计师更好地应对未来的工作挑战。计算机15.8万字 - 会员
Java项目驱动开发教程
《Java项目驱动开发教程》是一本以项目驱动教学模式理念设计的Java入门书。全书内容以软件项目案例驱动,代码实例丰富,项目实训任务饱满,语言通俗易懂,不仅能够使读者全面掌握Java面向对象编程技术,还能够提升读者使用Java语言开发软件项目的能力。《Java项目驱动开发教程》分为3个专题,共14章,3个专题分别以面向过程版的商超购物管理系统、面向对象版的超市购物系统、端对端聊天系统为贯穿项目,内计算机8.9万字 - 会员
深入理解Go语言
本书为深入理解学习Go语言必经之路中的重点知识领域,采用大量精美详细的图文介绍,文章讲解深入浅出,极大降低了理解Golang底层精髓的学习门槛。本书包含3篇:第一篇为深度理论篇(第1章~第4章),包含深入理解Golang中GPM模型、深入理解Golang垃圾回收GC三色标记与混合写屏障、深入理解Golang内存管理模型、网络IO复用模型等。第二篇为Golang实战中需要进阶的知识盲区介绍(第5章~计算机0字