云计算百科
云计算领域专业知识百科平台

标签:强化学习

强化学习——马尔可夫过程-网硕互联帮助中心

强化学习——马尔可夫过程

强化学习——马尔可夫过程环境 智能体 目标玩家和环境是如何互动的呢?这就是强化学习的主要元素强化学习就是要求智能体知道在某种状态下,...

阅读(72)

半精度模型(16位)解析

文章浏览阅读22次。摘要:本文介绍了使用半精度模型(FP16/BF16)来优化深度学习模型内存占用的方法。通过PyTorch的torch_dtype参数可直接加...

阅读(221)
强化学习机器人路径规划——Sparrow复现-网硕互联帮助中心

强化学习机器人路径规划——Sparrow复现

文章浏览阅读121次。Sparrow是一个开源的移动机器人路径规划模拟器,重视模拟速度和轻量化,使用DDQN强化学习方法进行训练。本文在其基础上,增加了绘制训练...

阅读(355)