hyper parameters

2025-10-31 10:48:49 +08:00 · 2022-08-26 16:13:31 +05:30
parent 0eb74d7b20
commit 1dbc2cbc04
1 changed files with 6 additions and 2 deletions
--- a/labml_nn/normalization/deep_norm/experiment.py
+++ b/labml_nn/normalization/deep_norm/experiment.py
@ -74,7 +74,7 @@ class Configs(NLPAutoRegressionConfigs):
    model: AutoregressiveTransformer
    # Number of layers
-    n_layers: int = 64
+    n_layers: int = 32
    # $\alpha$ and $\beta$ for DeepNorm
    deep_norm_alpha: float
@ -153,9 +153,13 @@ def main():
        # Switch between training and validation for $10$ times per epoch
        'inner_iterations': 10,
        # Number of layers
        'n_layers': 50,
        # Adam optimizer with no warmup
        'optimizer.optimizer': 'Adam',
-        'optimizer.learning_rate': 3e-4,
+        'optimizer.learning_rate': 1.25e-4,
    })
    # Set model(s) for saving and loading