
会员
Joy RL:强化学习实践教程
更新时间:2025-05-19 16:15:54 最新章节:第12章
书籍简介
本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
江季 王琦 杨毅远
最新上架
- 会员随着人工智能(AI)技术的迅猛发展,大模型技术已成为推动各行各业变革的重要力量。为了帮助企业管理者和技术人员更好地理解和应用这一前沿技术,本书精心编排多个篇章,从基础概念到实战应用,全面系统地介绍AI大模型的相关知识。概念普及篇(第1~2章)简要概述人工智能与大模型的基本概念及其对社会经济的广泛影响。企业落地准备篇(第3~4章)介绍企业大模型应用落地的常见形式,评估AI能力边界,解析大模型落地的必计算机14万字
- 会员本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第计算机16.4万字
- 会员本书全面解析了DeepSeek的崛起历程、技术突破及其对AI行业的深远影响。全书共6章,第1章追溯DeepSeek的起源与发展,展示其从初创到全球爆火的历程;第2章通过“AI领域拼多多”的比喻,分析其低成本、高性能的商业化路径,并深入探讨其核心技术;第3章介绍相关应用方法,包括优化交互方式、调用API服务、本地部署模型等;第4章、第5章分别分析DeepSeek引发的行业变革,以及其AI能力在垂直行计算机11.6万字
- 会员从电台、电视、互网联到人工智能,每一次技术迭代总能为营销带来广泛的机会,并促使营销自身产生翻天覆地的变化。作为新技术的代表,生成式AI正以其强大的功能和广泛的应用场景,塑造着人们对于未来的憧憬。其对于世界的影响越巨大,对于营销范式的重塑会越深刻。本书基于技术和营销的关系,阐述了生成式AI技术条件下营销演变的底层逻辑,并进一步明确了未来的营销新趋势。通过深入分析生成式AI的洞察、创意和媒介能力,本书计算机12.8万字
- 会员本书将为你揭开生成式AI重塑职场生态的终极密码,带你从“工具使用者”进阶为“AI协作大师”。通过DeepSeek、智谱清言、通义千问等前沿工具的实战解析,你将掌握AI时代的职场生存法则:告别低效与重复,解锁高阶创造力,构建人机协作系统,跨越职业天花板。书中融合了近百个真实案例,涵盖目标管理、会议组织、公文写作、公众演讲等12大职场刚需场景,提供即学即用的AI解决方案。无论你是疲于应付报表的职场新人计算机12.5万字