会员
深度强化学习实践(原书第2版)
(俄)马克西姆·拉潘更新时间:2021-08-18 17:40:31
最新章节:25.7 总结开会员,本书免费读 >
本书的主题是强化学习(ReinforcementLearning,RL),它是机器学习(MachineLearning,ML)的一个分支,强调如何解决在复杂环境中选择最优动作时产生的通用且极具挑战的问题。学习过程仅由奖励值和从环境中获得的观察驱动。该模型非常通用,能应用于多个真实场景,从玩游戏到优化复杂制造过程都能涵盖。
品牌:机械工业出版社
译者:林然 王薇
上架时间:2021-07-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
深度强化学习实践(原书第2版)最新章节
查看全部- 25.7 总结
- 25.6 相同actor之间的战斗
- 25.5 同时训练老虎和鹿
- 25.4 老虎的合作
- 25.3 老虎的深度Q-network
- 25.2 MAgent环境
- 25.1 多智能体RL的说明
- 第25章 多智能体强化学习
- 24.11 总结
- 24.10 进一步改进和实验
(俄)马克西姆·拉潘
主页
同类热门书
最新上架
- 会员
PyTorch 2.0深度学习从零开始学
PyTorch是一个开源的机器学习框架,它提供了动态计算图的支持,让用户能够自定义和训练自己的神经网络,目前是机器学习领域中的框架之一。《PyTorch2.0深度学习从零开始学》共分15章,内容包括PyTorch概述、开发环境搭建、基于PyTorch的MNIST分类实战、深度学习理论基础、MNIST分类实战、数据处理与模型可视化、基于PyTorch卷积层的分类实战、PyTorch数据处理与模型可计算机11.3万字 - 会员
智能计算系统:从深度学习到大模型
本书由中科院计算所、软件所的专家学者倾心写就,以“图像风格迁移”应用为例,全面介绍智能计算系统的软硬件技术栈。第2版以大模型为牵引进行更新,第1章回顾人工智能、智能计算系统的发展历程,第2、3章在介绍深度学习算法知识的基础上增加了大模型算法的相关知识,第4章介绍深度学习编程框架PyTorch的发展历程、基本概念、编程模型和使用方法,第5章介绍编程框架的工作原理,第6章回顾深度学习所用的处理器结构从计算机34.9万字 - 会员
基于信息增强的图神经网络学习方法研究
本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用计算机8.1万字 - 会员
自动驾驶:人工智能理论与实践
本书参照产业界自动驾驶技术研发的基本流程,充分借鉴了产业界在自动驾驶技术领域中的实际研发经验,以高性能的智能小车和高度仿真的车道沙盘为实验教具和运行环境,深入浅出地讲解自动驾驶技术的原理与实际应用,为初学者打开一扇通往人工智能世界的大门。本书以帮助初学者如何从无到有地打造出具备自动驾驶功能的智能小车为主线,内容分为看车(了解自动驾驶)、造车(设计智能小车)、开车(收集训练数据)、写车(编写自动驾驶计算机14.9万字 - 会员
玩赚ChatGPT:人人都能用的工作好帮手
本书以工作场景和具体任务来驱动,包括53个场景展示、85项任务模拟、237次提问示范,让完全不懂技术的小白,也能成为ChatGPT工具使用方面的行家。本书通过详细讲解具体任务的提问与追问方法,让ChatGPT成为每个人的工作好帮手,帮助人们提升工作效能,打造超能个体与超能团队。计算机13.8万字 - 会员
破解深度学习(核心篇):模型算法与实现
本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的核心知识、原理和内在逻辑。经过基础篇的学习,想必你已经对深度学习的总体框架有了初步的了解和认识,掌握了深度神经网络从核心概念、常见问题到典型网络的基本知识。本书为核心篇,将带领读者实现从入门到进阶、从理论到实战的跨越。全书共7章,前三章包括复杂CNN、RNN和注意力机制网络,深入详解各类主流模型及其变体;第4章介绍这三类基计算机13.4万字 - 会员
量子人工智能
量子计算与人工智能的交叉融合,促使量子人工智能的不断发展。本书旨在采用对深度学习爱好者友好的方式,构建量子人工智能应用。全书共13章,第1章和第2章系统介绍量子计算机发展脉络和量子计算编程的基础知识。第3~7章分别介绍不同的深度学习方法和在这些算法逻辑上构建量子启发算法的方式,用量子线路中的相位作为神经网络的可学习参数,重构为量子神经网络算子。这些算子可以在PyTorch环境中直接调用。第8章和第计算机7.6万字 - 会员
空间智能原理与应用
本书从空间信息处理角度出发,将人工智能领域的理论研究与专业实践相结合,完整介绍人工智能方法及其在空间信息处理中的应用,不仅涵盖人工智能领域的基础概念与基本方法,而且探讨知识图谱、计算智能、新兴机器学习、深度学习等前沿技术,同时介绍人工智能在地理文本大数据、遥感影像、激光点云等空间信息处理中的应用实例,具有较强的代表性和启发性。本书可以作为高等院校空间信息与数字技术、遥感科学与技术等专业高年级本科生计算机23.8万字 - 会员
华为MindSpore深度学习框架应用开发实战
全书从逻辑上共分3部分。第一部分由第1章和第2章组成,介绍深度学习的基础理论、MindSpore总体架构和编程基础。第二部分由第3~8章组成,介绍MindSpore框架各子系统的具体情况,包括数据处理、算子、神经网络模型开发、数据可视化组件MindInsight、推理、以及移动端AI框架MindSporeLite。第三部分由第9章和第10章组成,介绍使用MindSpore框架开发和训练的经典深度计算机13万字