开源
Dopamine:用于强化学习算法快速原型设计的研究框架
来源:元经纪     阅读:872
网站管理员
发布于 2023-01-29 07:46
查看主页

概述

Dopamine是一种用于强化学习算法快速原型设计的研究框架。它旨在满足对小型、易于理解的代码库的需求,用户可以在其中自由地尝试疯狂的想法(推测性研究)。

我们的设计原则是:

Dopamine支持以下使用 jax 实现的代理:

有关可用代理的更多信息,请参阅文档

许多这些代理也有一个 tensorflow(遗留)实现,尽管新添加的代理很可能是 jax-only。

这不是 Google 的官方产品。

入门

可以从源代码安装Dopamine(首选)或使用 pip 安装。对于这些方法中的任何一种,请继续阅读先决条件。

必要条件

[hidecontent type="logged" desc="隐藏内容:登录后可查看"]

Dopamine支持 Atari 环境和 Mujoco 环境。在安装 Dopamine 之前安装您打算使用的环境:

Atari

  1. 按照atari-py的说明安装 atari rom 。
  2. pip install ale-py(我们推荐使用虚拟环境):
  3. unzip $ROM_DIR/ROMS.zip -d $ROM_DIR && ale-import-roms $ROM_DIR/ROMS (将 $ROM_DIR 替换为您将 ROM 解压缩到的目录)。

Mujoco

  1. 在此处安装 Mujoco 并获得许可证 。
  2. 运行pip install mujoco-py(我们推荐使用 虚拟环境)。

从源安装

Dopamine最常见的使用方式是源码安装,直接修改源码:

git clone https://github.com/google/dopamine

克隆后,安装依赖项:

pip install -r dopamine/requirements.txt

Dopamine支持 tensorflow(遗留)和 jax(主动维护)代理。查看Tensorflow 文档以获取有关安装 tensorflow 的更多信息。

注意:我们建议在使用多巴胺时使用虚拟环境。

使用 Pip 安装

注意:我们强烈建议大多数用户从源代码安装。

用pip安装很简单,但是Dopamine是为了直接修改而设计的。我们建议从源代码安装以编写您自己的实验。

pip install dopamine-rl

运行测试

您可以通过从Dopamine根目录运行以下命令来测试安装是否成功。

export PYTHONPATH=$PYTHONPATH:$PWD
python -m tests.dopamine.atari_init_test

[/hidecontent]

 
免责声明:本文为用户发表,不代表网站立场,仅供参考,不构成引导等用途。 开源
聚焦数博会丨“元宇宙”时代来临 探索智慧出版新蓝图
新款macbookair13英寸m3配备四种颜色选择
宝德加速计算服务器市场规模再创新高,荣登中国NO.2
2024杭州市海外高层次人才创新创业大赛复赛开启
走俏全球的中华老字号 苏州稻香村做对了什么?

首页

分类

定制方案

消息

我的