Joy RL:强化学习实践教程在线阅读
会员

Joy RL:强化学习实践教程

江季 王琦 杨毅远
开会员,本书免费读 >

计算机网络人工智能7.8万字

更新时间:2025-05-19 16:15:54 最新章节:第12章

立即阅读
加书架
下载
听书

书籍简介

本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

江季 王琦 杨毅远
主页

最新上架

  • 会员
    随着人工智能(AI)技术的迅猛发展,大模型技术已成为推动各行各业变革的重要力量。为了帮助企业管理者和技术人员更好地理解和应用这一前沿技术,本书精心编排多个篇章,从基础概念到实战应用,全面系统地介绍AI大模型的相关知识。概念普及篇(第1~2章)简要概述人工智能与大模型的基本概念及其对社会经济的广泛影响。企业落地准备篇(第3~4章)介绍企业大模型应用落地的常见形式,评估AI能力边界,解析大模型落地的必
    贾利阳 王奇计算机14万字
  • 会员
    本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第
    (沙特)杰伊·阿拉马尔 (荷)马尔滕·格鲁滕多斯特计算机16.4万字
  • 会员
    本书全面解析了DeepSeek的崛起历程、技术突破及其对AI行业的深远影响。全书共6章,第1章追溯DeepSeek的起源与发展,展示其从初创到全球爆火的历程;第2章通过“AI领域拼多多”的比喻,分析其低成本、高性能的商业化路径,并深入探讨其核心技术;第3章介绍相关应用方法,包括优化交互方式、调用API服务、本地部署模型等;第4章、第5章分别分析DeepSeek引发的行业变革,以及其AI能力在垂直行
    陈根计算机11.6万字
  • 会员
    从电台、电视、互网联到人工智能,每一次技术迭代总能为营销带来广泛的机会,并促使营销自身产生翻天覆地的变化。作为新技术的代表,生成式AI正以其强大的功能和广泛的应用场景,塑造着人们对于未来的憧憬。其对于世界的影响越巨大,对于营销范式的重塑会越深刻。本书基于技术和营销的关系,阐述了生成式AI技术条件下营销演变的底层逻辑,并进一步明确了未来的营销新趋势。通过深入分析生成式AI的洞察、创意和媒介能力,本书
    谭北平 金立印计算机12.8万字
  • 会员
    本书将为你揭开生成式AI重塑职场生态的终极密码,带你从“工具使用者”进阶为“AI协作大师”。通过DeepSeek、智谱清言、通义千问等前沿工具的实战解析,你将掌握AI时代的职场生存法则:告别低效与重复,解锁高阶创造力,构建人机协作系统,跨越职业天花板。书中融合了近百个真实案例,涵盖目标管理、会议组织、公文写作、公众演讲等12大职场刚需场景,提供即学即用的AI解决方案。无论你是疲于应付报表的职场新人
    王林 何平 郭龙计算机12.5万字
  • 我们当下正在经历一场AI革命。现在有创纪录的310万个机器人在工厂工作,从事从组装电脑到包装货物以及监测空气质量等各种工作。数量庞大的智能机器以各种各样的方式影响着我们的生活,如提高外科医生的手术精确度,清洁我们的家等等,我们正处于机器智能带来的令人兴奋的可能性当中。下一个万亿规模的企业,也许正在AI机器人领域诞生。当下的机器人产业,远远超出常人的想象。你会看到全世界最先锋的机器人研究团队如何开发
    (美)丹妮拉·鲁斯 (美)格雷戈里·莫内计算机13.5万字
  • 本书的主题是从通用人工智能的视角来诠释中国的思想。朱松纯教授致力于搭建人文社科与通用人工智能的双向连接,本书是为人文赋“理”,即以人工智能的数理与认知模型诠释中国思想,试图为中国优秀哲学思想构建严格的数理体系,以便中国思想可以在正在到来的智能时代指导社会治理与实践,从而转化成强大的生产力。为此,本书先从智能时代的文明与道路说起,基于文明起源与演化的历程指出演化的关键在于“心”的出现,探索“心”的构
    朱松纯计算机13.7万字
  • 会员
    优化提示词是用好GPT的关键。本书基于GPT,讨论提示词的使用技巧和优化方法。本书不仅讨论如何让GPT不再“胡说八道”,如何用GPT解决各种问题,如何让GPT了解用户的需求,如何让GPT记忆力超群,还讲述如何应用GPT,如何让GPT自动运行,如何打造商业级别的GPT,如何辨别GPT生成的内容。无论你是职场人士,还是在校大学生,通过阅读本书,都可以掌握用好GPT的关键,提升自己的工作或学习效率。
    梁成睿计算机8.5万字
  • 这是一本探讨人工智能与生物技术的融合颠覆传统医疗,并会对未来药物研发产生重大影响的书。作者凭借其在生物科学方面的专业背景,以及在生物技术和制药行业的从业经验,为读者呈现了对于医疗科技这一前沿领域的深刻见解。书中首先概述了数据科学方法的兴起以及生物学领域的范式转变,这一转变催生了计算生物学的革命,即通过计算机模拟进行生物实验和药物研发。作者详细介绍了人工智能和深度学习领域的重大突破,并探讨了这些技术
    (美)布赖恩·希尔布什计算机18.6万字