要在 tinyshakespeare 语料库上使用默认参数进行训练,请运行python train.py
. 要访问所有参数,请使用python train.py --help
.
要从检查点模型中采样,
[hidecontent type="logged" desc="隐藏内容:登录后可查看"]
python sample.py
. 在学习仍在进行时进行采样(检查最后一个检查点)仅适用于 CPU 或使用另一个 GPU。要强制使用 CPU 模式,请使用export CUDA_VISIBLE_DEVICES=""
andunset CUDA_VISIBLE_DEVICES
之后(分别set CUDA_VISIBLE_DEVICES=""
在set CUDA_VISIBLE_DEVICES=
Windows 上)。
要在中断后继续训练或运行更多纪元,python train.py --init_from=save
您可以使用任何纯文本文件作为输入。例如,您可以这样下载完整的夏洛克·福尔摩斯:
cd data
mkdir sherlock
cd sherlock
wget https://sherlock-holm.es/stories/plain-text/cnus.txt
mv cnus.txt input.txt
然后使用从顶级目录开始训练python train.py --data_dir=./data/sherlock/
.txt
将许多不同的小文件连接成一个大的训练文件的快速提示: ls *.txt | xargs -L 1 cat >> input.txt
.
在这一点上,调整你的模型是一种“黑暗艺术”。一般来说:
要可视化训练进度、模型图和内部状态直方图:启动 Tensorboard 并将其指向您的log_dir
. 例如:
$ tensorboard --logdir=./logs/
然后打开浏览器访问http://localhost:6006或指定的正确 IP/端口。
[/hidecontent]