colab notebook

2cf6e7a0 · Varuna Jayasiri · e3675057 · 2cf6e7a0 · 2cf6e7a0
展开全部隐藏空白更改
内联并排

Showing with 629 addition and 0 deletion

labml_nn/transformers/gpt/__init__.py labml_nn/transformers/gpt/__init__.py +5 -0

labml_nn/transformers/gpt/experiment.ipynb labml_nn/transformers/gpt/experiment.ipynb +624 -0

未找到文件。
--- a/labml_nn/transformers/gpt/__init__.py
+++ b/labml_nn/transformers/gpt/__init__.py
@@ -24,6 +24,11 @@ Main differences of this to a standard autoregressive transformer
 are the parameter initialization, weight decay, and learning rate schedule.
 For the transformer we reuse the
 [existing labml/nn transformer implementation](https://lab-ml.com/labml_nn/transformers/).
+
+Here's a notebook for training a GPT mode on Tiny Shakespeare dataset.
+
+[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/lab-ml/nn/blob/master/labml_nn/transformers/gpt/experiment.ipynb)
+[![View Run](https://img.shields.io/badge/labml-experiment-brightgreen)](https://web.lab-ml.com/run?uuid=0324c6d0562111eba65d0242ac1c0002)
 """

 import torch

--- a/labml_nn/transformers/gpt/experiment.ipynb
+++ b/labml_nn/transformers/gpt/experiment.ipynb