diff --git a/docs/activations/index.html b/docs/activations/index.html
index 47bffbdd..6f9e2821 100644
--- a/docs/activations/index.html
+++ b/docs/activations/index.html
@@ -84,7 +84,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/activations/swish.html b/docs/activations/swish.html
index a53db223..e1b3984c 100644
--- a/docs/activations/swish.html
+++ b/docs/activations/swish.html
@@ -123,7 +123,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/adaptive_computation/index.html b/docs/adaptive_computation/index.html
index 798b23e4..718fc2dc 100644
--- a/docs/adaptive_computation/index.html
+++ b/docs/adaptive_computation/index.html
@@ -88,7 +88,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/adaptive_computation/parity.html b/docs/adaptive_computation/parity.html
index 9e9119b3..925c31d7 100644
--- a/docs/adaptive_computation/parity.html
+++ b/docs/adaptive_computation/parity.html
@@ -236,7 +236,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/adaptive_computation/ponder_net/experiment.html b/docs/adaptive_computation/ponder_net/experiment.html
index 372c80c8..3ff6165a 100644
--- a/docs/adaptive_computation/ponder_net/experiment.html
+++ b/docs/adaptive_computation/ponder_net/experiment.html
@@ -599,7 +599,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/adaptive_computation/ponder_net/index.html b/docs/adaptive_computation/ponder_net/index.html
index 5ac045dc..6c8d1813 100644
--- a/docs/adaptive_computation/ponder_net/index.html
+++ b/docs/adaptive_computation/ponder_net/index.html
@@ -765,7 +765,6 @@ s is odd and false otherwise.</p>
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/adaptive_computation/ponder_net/readme.html b/docs/adaptive_computation/ponder_net/readme.html
index 07e4c924..e242a77f 100644
--- a/docs/adaptive_computation/ponder_net/readme.html
+++ b/docs/adaptive_computation/ponder_net/readme.html
@@ -88,7 +88,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/adaptive_computation/readme.html b/docs/adaptive_computation/readme.html
index 8268a4a6..52f739d0 100644
--- a/docs/adaptive_computation/readme.html
+++ b/docs/adaptive_computation/readme.html
@@ -88,7 +88,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/capsule_networks/index.html b/docs/capsule_networks/index.html
index a3a535e3..3d0df89a 100644
--- a/docs/capsule_networks/index.html
+++ b/docs/capsule_networks/index.html
@@ -449,7 +449,6 @@ M1001 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/capsule_networks/mnist.html b/docs/capsule_networks/mnist.html
index c24ff3f6..6bd85274 100644
--- a/docs/capsule_networks/mnist.html
+++ b/docs/capsule_networks/mnist.html
@@ -559,7 +559,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/capsule_networks/readme.html b/docs/capsule_networks/readme.html
index 59f56294..4ba2c9df 100644
--- a/docs/capsule_networks/readme.html
+++ b/docs/capsule_networks/readme.html
@@ -92,7 +92,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/cfr/analytics.html b/docs/cfr/analytics.html
index 32b645c3..818b1e63 100644
--- a/docs/cfr/analytics.html
+++ b/docs/cfr/analytics.html
@@ -165,7 +165,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/cfr/index.html b/docs/cfr/index.html
index 3a1ddeb0..b095575e 100644
--- a/docs/cfr/index.html
+++ b/docs/cfr/index.html
@@ -1372,7 +1372,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/cfr/infoset_saver.html b/docs/cfr/infoset_saver.html
index 8d589755..0b34e2eb 100644
--- a/docs/cfr/infoset_saver.html
+++ b/docs/cfr/infoset_saver.html
@@ -146,7 +146,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/cfr/kuhn/index.html b/docs/cfr/kuhn/index.html
index 1a26a86e..1104bfc8 100644
--- a/docs/cfr/kuhn/index.html
+++ b/docs/cfr/kuhn/index.html
@@ -846,7 +846,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/conv_mixer/experiment.html b/docs/conv_mixer/experiment.html
index e1126261..f2fdc0f3 100644
--- a/docs/conv_mixer/experiment.html
+++ b/docs/conv_mixer/experiment.html
@@ -338,7 +338,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/conv_mixer/index.html b/docs/conv_mixer/index.html
index e646a809..bcb01fae 100644
--- a/docs/conv_mixer/index.html
+++ b/docs/conv_mixer/index.html
@@ -686,7 +686,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/conv_mixer/readme.html b/docs/conv_mixer/readme.html
index d6a50371..47aed1fc 100644
--- a/docs/conv_mixer/readme.html
+++ b/docs/conv_mixer/readme.html
@@ -91,7 +91,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/diffusion/ddpm/evaluate.html b/docs/diffusion/ddpm/evaluate.html
index 5f759a45..c25ad829 100644
--- a/docs/diffusion/ddpm/evaluate.html
+++ b/docs/diffusion/ddpm/evaluate.html
@@ -1354,7 +1354,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/diffusion/ddpm/experiment.html b/docs/diffusion/ddpm/experiment.html
index b7d9a09f..0f9b88e5 100644
--- a/docs/diffusion/ddpm/experiment.html
+++ b/docs/diffusion/ddpm/experiment.html
@@ -946,7 +946,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/diffusion/ddpm/index.html b/docs/diffusion/ddpm/index.html
index 0e33c2a8..3680db5d 100644
--- a/docs/diffusion/ddpm/index.html
+++ b/docs/diffusion/ddpm/index.html
@@ -845,7 +845,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/diffusion/ddpm/readme.html b/docs/diffusion/ddpm/readme.html
index 8c637386..568c4d2e 100644
--- a/docs/diffusion/ddpm/readme.html
+++ b/docs/diffusion/ddpm/readme.html
@@ -90,7 +90,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/diffusion/ddpm/unet.html b/docs/diffusion/ddpm/unet.html
index 53c06fb8..db279241 100644
--- a/docs/diffusion/ddpm/unet.html
+++ b/docs/diffusion/ddpm/unet.html
@@ -1407,7 +1407,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/diffusion/ddpm/utils.html b/docs/diffusion/ddpm/utils.html
index 041ab383..b2bc2224 100644
--- a/docs/diffusion/ddpm/utils.html
+++ b/docs/diffusion/ddpm/utils.html
@@ -110,7 +110,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/diffusion/index.html b/docs/diffusion/index.html
index bdef2c14..61736161 100644
--- a/docs/diffusion/index.html
+++ b/docs/diffusion/index.html
@@ -86,7 +86,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/distillation/index.html b/docs/distillation/index.html
index 7ad42a71..db2cbfe4 100644
--- a/docs/distillation/index.html
+++ b/docs/distillation/index.html
@@ -740,7 +740,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/distillation/large.html b/docs/distillation/large.html
index 3acc0035..6ce89365 100644
--- a/docs/distillation/large.html
+++ b/docs/distillation/large.html
@@ -351,7 +351,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/distillation/readme.html b/docs/distillation/readme.html
index da4d6c81..39f785bc 100644
--- a/docs/distillation/readme.html
+++ b/docs/distillation/readme.html
@@ -90,7 +90,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/distillation/small.html b/docs/distillation/small.html
index f252465e..238fad85 100644
--- a/docs/distillation/small.html
+++ b/docs/distillation/small.html
@@ -338,7 +338,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/experiments/cifar10.html b/docs/experiments/cifar10.html
index d5b76ad5..edb811d8 100644
--- a/docs/experiments/cifar10.html
+++ b/docs/experiments/cifar10.html
@@ -403,7 +403,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/experiments/index.html b/docs/experiments/index.html
index 7afaf1be..1187dc77 100644
--- a/docs/experiments/index.html
+++ b/docs/experiments/index.html
@@ -73,7 +73,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/experiments/mnist.html b/docs/experiments/mnist.html
index 9a3284a7..d0ce5731 100644
--- a/docs/experiments/mnist.html
+++ b/docs/experiments/mnist.html
@@ -440,7 +440,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/experiments/nlp_autoregression.html b/docs/experiments/nlp_autoregression.html
index 1fa02cb2..fe824990 100644
--- a/docs/experiments/nlp_autoregression.html
+++ b/docs/experiments/nlp_autoregression.html
@@ -1042,7 +1042,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/experiments/nlp_classification.html b/docs/experiments/nlp_classification.html
index c9a5b61a..917dcda1 100644
--- a/docs/experiments/nlp_classification.html
+++ b/docs/experiments/nlp_classification.html
@@ -79,15 +79,16 @@
 <span class="lineno">15</span><span class="kn">import</span> <span class="nn">torchtext</span>
 <span class="lineno">16</span><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">nn</span>
 <span class="lineno">17</span><span class="kn">from</span> <span class="nn">torch.utils.data</span> <span class="kn">import</span> <span class="n">DataLoader</span>
-<span class="lineno">18</span><span class="kn">from</span> <span class="nn">torchtext.vocab</span> <span class="kn">import</span> <span class="n">Vocab</span>
-<span class="lineno">19</span>
-<span class="lineno">20</span><span class="kn">from</span> <span class="nn">labml</span> <span class="kn">import</span> <span class="n">lab</span><span class="p">,</span> <span class="n">tracker</span><span class="p">,</span> <span class="n">monit</span>
-<span class="lineno">21</span><span class="kn">from</span> <span class="nn">labml.configs</span> <span class="kn">import</span> <span class="n">option</span>
-<span class="lineno">22</span><span class="kn">from</span> <span class="nn">labml_helpers.device</span> <span class="kn">import</span> <span class="n">DeviceConfigs</span>
-<span class="lineno">23</span><span class="kn">from</span> <span class="nn">labml_helpers.metrics.accuracy</span> <span class="kn">import</span> <span class="n">Accuracy</span>
-<span class="lineno">24</span><span class="kn">from</span> <span class="nn">labml_helpers.module</span> <span class="kn">import</span> <span class="n">Module</span>
-<span class="lineno">25</span><span class="kn">from</span> <span class="nn">labml_helpers.train_valid</span> <span class="kn">import</span> <span class="n">TrainValidConfigs</span><span class="p">,</span> <span class="n">hook_model_outputs</span><span class="p">,</span> <span class="n">BatchIndex</span>
-<span class="lineno">26</span><span class="kn">from</span> <span class="nn">labml_nn.optimizers.configs</span> <span class="kn">import</span> <span class="n">OptimizerConfigs</span></pre></div>
+<span class="lineno">18</span><span class="kn">import</span> <span class="nn">torchtext.vocab</span>
+<span class="lineno">19</span><span class="kn">from</span> <span class="nn">torchtext.vocab</span> <span class="kn">import</span> <span class="n">Vocab</span>
+<span class="lineno">20</span>
+<span class="lineno">21</span><span class="kn">from</span> <span class="nn">labml</span> <span class="kn">import</span> <span class="n">lab</span><span class="p">,</span> <span class="n">tracker</span><span class="p">,</span> <span class="n">monit</span>
+<span class="lineno">22</span><span class="kn">from</span> <span class="nn">labml.configs</span> <span class="kn">import</span> <span class="n">option</span>
+<span class="lineno">23</span><span class="kn">from</span> <span class="nn">labml_helpers.device</span> <span class="kn">import</span> <span class="n">DeviceConfigs</span>
+<span class="lineno">24</span><span class="kn">from</span> <span class="nn">labml_helpers.metrics.accuracy</span> <span class="kn">import</span> <span class="n">Accuracy</span>
+<span class="lineno">25</span><span class="kn">from</span> <span class="nn">labml_helpers.module</span> <span class="kn">import</span> <span class="n">Module</span>
+<span class="lineno">26</span><span class="kn">from</span> <span class="nn">labml_helpers.train_valid</span> <span class="kn">import</span> <span class="n">TrainValidConfigs</span><span class="p">,</span> <span class="n">hook_model_outputs</span><span class="p">,</span> <span class="n">BatchIndex</span>
+<span class="lineno">27</span><span class="kn">from</span> <span class="nn">labml_nn.optimizers.configs</span> <span class="kn">import</span> <span class="n">OptimizerConfigs</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-1'>
@@ -101,7 +102,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">29</span><span class="k">class</span> <span class="nc">NLPClassificationConfigs</span><span class="p">(</span><span class="n">TrainValidConfigs</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">30</span><span class="k">class</span> <span class="nc">NLPClassificationConfigs</span><span class="p">(</span><span class="n">TrainValidConfigs</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-2'>
@@ -113,7 +114,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">40</span>    <span class="n">optimizer</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">Adam</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">41</span>    <span class="n">optimizer</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">Adam</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-3'>
@@ -125,7 +126,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">42</span>    <span class="n">device</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">DeviceConfigs</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">43</span>    <span class="n">device</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">DeviceConfigs</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-4'>
@@ -137,7 +138,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">45</span>    <span class="n">model</span><span class="p">:</span> <span class="n">Module</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">46</span>    <span class="n">model</span><span class="p">:</span> <span class="n">Module</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-5'>
@@ -149,7 +150,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">47</span>    <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">16</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">48</span>    <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">16</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-6'>
@@ -161,7 +162,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">49</span>    <span class="n">seq_len</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">512</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">50</span>    <span class="n">seq_len</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">512</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-7'>
@@ -173,7 +174,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">51</span>    <span class="n">vocab</span><span class="p">:</span> <span class="n">Vocab</span> <span class="o">=</span> <span class="s1">&#39;ag_news&#39;</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">52</span>    <span class="n">vocab</span><span class="p">:</span> <span class="n">Vocab</span> <span class="o">=</span> <span class="s1">&#39;ag_news&#39;</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-8'>
@@ -185,7 +186,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">53</span>    <span class="n">n_tokens</span><span class="p">:</span> <span class="nb">int</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">54</span>    <span class="n">n_tokens</span><span class="p">:</span> <span class="nb">int</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-9'>
@@ -197,7 +198,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">55</span>    <span class="n">n_classes</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="s1">&#39;ag_news&#39;</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">56</span>    <span class="n">n_classes</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="s1">&#39;ag_news&#39;</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-10'>
@@ -209,7 +210,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">57</span>    <span class="n">tokenizer</span><span class="p">:</span> <span class="n">Callable</span> <span class="o">=</span> <span class="s1">&#39;character&#39;</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">58</span>    <span class="n">tokenizer</span><span class="p">:</span> <span class="n">Callable</span> <span class="o">=</span> <span class="s1">&#39;character&#39;</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-11'>
@@ -221,7 +222,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">60</span>    <span class="n">is_save_models</span> <span class="o">=</span> <span class="kc">True</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">61</span>    <span class="n">is_save_models</span> <span class="o">=</span> <span class="kc">True</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-12'>
@@ -233,7 +234,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">63</span>    <span class="n">loss_func</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">CrossEntropyLoss</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">64</span>    <span class="n">loss_func</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">CrossEntropyLoss</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-13'>
@@ -245,7 +246,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">65</span>    <span class="n">accuracy</span> <span class="o">=</span> <span class="n">Accuracy</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">66</span>    <span class="n">accuracy</span> <span class="o">=</span> <span class="n">Accuracy</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-14'>
@@ -257,7 +258,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">67</span>    <span class="n">d_model</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">512</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">68</span>    <span class="n">d_model</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">512</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-15'>
@@ -269,7 +270,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">69</span>    <span class="n">grad_norm_clip</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1.0</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">70</span>    <span class="n">grad_norm_clip</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1.0</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-16'>
@@ -281,7 +282,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">72</span>    <span class="n">train_loader</span><span class="p">:</span> <span class="n">DataLoader</span> <span class="o">=</span> <span class="s1">&#39;ag_news&#39;</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">73</span>    <span class="n">train_loader</span><span class="p">:</span> <span class="n">DataLoader</span> <span class="o">=</span> <span class="s1">&#39;ag_news&#39;</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-17'>
@@ -293,7 +294,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">74</span>    <span class="n">valid_loader</span><span class="p">:</span> <span class="n">DataLoader</span> <span class="o">=</span> <span class="s1">&#39;ag_news&#39;</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">75</span>    <span class="n">valid_loader</span><span class="p">:</span> <span class="n">DataLoader</span> <span class="o">=</span> <span class="s1">&#39;ag_news&#39;</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-18'>
@@ -305,7 +306,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">76</span>    <span class="k">def</span> <span class="nf">init</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">77</span>    <span class="k">def</span> <span class="nf">init</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-19'>
@@ -317,8 +318,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">81</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">set_scalar</span><span class="p">(</span><span class="s2">&quot;accuracy.*&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
-<span class="lineno">82</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">set_scalar</span><span class="p">(</span><span class="s2">&quot;loss.*&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">82</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">set_scalar</span><span class="p">(</span><span class="s2">&quot;accuracy.*&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
+<span class="lineno">83</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">set_scalar</span><span class="p">(</span><span class="s2">&quot;loss.*&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-20'>
@@ -330,7 +331,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">84</span>        <span class="n">hook_model_outputs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="p">,</span> <span class="s1">&#39;model&#39;</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">85</span>        <span class="n">hook_model_outputs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="p">,</span> <span class="s1">&#39;model&#39;</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-21'>
@@ -342,7 +343,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">89</span>        <span class="bp">self</span><span class="o">.</span><span class="n">state_modules</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">accuracy</span><span class="p">]</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">90</span>        <span class="bp">self</span><span class="o">.</span><span class="n">state_modules</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">accuracy</span><span class="p">]</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-22'>
@@ -354,7 +355,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">91</span>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">:</span> <span class="nb">any</span><span class="p">,</span> <span class="n">batch_idx</span><span class="p">:</span> <span class="n">BatchIndex</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">92</span>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">:</span> <span class="nb">any</span><span class="p">,</span> <span class="n">batch_idx</span><span class="p">:</span> <span class="n">BatchIndex</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-23'>
@@ -366,7 +367,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">97</span>        <span class="n">data</span><span class="p">,</span> <span class="n">target</span> <span class="o">=</span> <span class="n">batch</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">),</span> <span class="n">batch</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">98</span>        <span class="n">data</span><span class="p">,</span> <span class="n">target</span> <span class="o">=</span> <span class="n">batch</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">),</span> <span class="n">batch</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-24'>
@@ -378,8 +379,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">100</span>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="o">.</span><span class="n">is_train</span><span class="p">:</span>
-<span class="lineno">101</span>            <span class="n">tracker</span><span class="o">.</span><span class="n">add_global_step</span><span class="p">(</span><span class="n">data</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">101</span>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="o">.</span><span class="n">is_train</span><span class="p">:</span>
+<span class="lineno">102</span>            <span class="n">tracker</span><span class="o">.</span><span class="n">add_global_step</span><span class="p">(</span><span class="n">data</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-25'>
@@ -391,7 +392,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">104</span>        <span class="k">with</span> <span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">is_log_activations</span><span class="o">=</span><span class="n">batch_idx</span><span class="o">.</span><span class="n">is_last</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">105</span>        <span class="k">with</span> <span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">is_log_activations</span><span class="o">=</span><span class="n">batch_idx</span><span class="o">.</span><span class="n">is_last</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-26'>
@@ -403,7 +404,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">108</span>            <span class="n">output</span><span class="p">,</span> <span class="o">*</span><span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="p">(</span><span class="n">data</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">109</span>            <span class="n">output</span><span class="p">,</span> <span class="o">*</span><span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="p">(</span><span class="n">data</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-27'>
@@ -415,8 +416,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">111</span>        <span class="n">loss</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_func</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
-<span class="lineno">112</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="s2">&quot;loss.&quot;</span><span class="p">,</span> <span class="n">loss</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">112</span>        <span class="n">loss</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_func</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+<span class="lineno">113</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="s2">&quot;loss.&quot;</span><span class="p">,</span> <span class="n">loss</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-28'>
@@ -428,8 +429,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">115</span>        <span class="bp">self</span><span class="o">.</span><span class="n">accuracy</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
-<span class="lineno">116</span>        <span class="bp">self</span><span class="o">.</span><span class="n">accuracy</span><span class="o">.</span><span class="n">track</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">116</span>        <span class="bp">self</span><span class="o">.</span><span class="n">accuracy</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+<span class="lineno">117</span>        <span class="bp">self</span><span class="o">.</span><span class="n">accuracy</span><span class="o">.</span><span class="n">track</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-29'>
@@ -441,7 +442,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">119</span>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="o">.</span><span class="n">is_train</span><span class="p">:</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">120</span>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="o">.</span><span class="n">is_train</span><span class="p">:</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-30'>
@@ -453,7 +454,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">121</span>            <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">122</span>            <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-31'>
@@ -465,7 +466,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">123</span>            <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">max_norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">grad_norm_clip</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">124</span>            <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">max_norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">grad_norm_clip</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-32'>
@@ -477,7 +478,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">125</span>            <span class="bp">self</span><span class="o">.</span><span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">126</span>            <span class="bp">self</span><span class="o">.</span><span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-33'>
@@ -489,8 +490,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">127</span>            <span class="k">if</span> <span class="n">batch_idx</span><span class="o">.</span><span class="n">is_last</span><span class="p">:</span>
-<span class="lineno">128</span>                <span class="n">tracker</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="s1">&#39;model&#39;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">128</span>            <span class="k">if</span> <span class="n">batch_idx</span><span class="o">.</span><span class="n">is_last</span><span class="p">:</span>
+<span class="lineno">129</span>                <span class="n">tracker</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="s1">&#39;model&#39;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-34'>
@@ -502,7 +503,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">130</span>            <span class="bp">self</span><span class="o">.</span><span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">131</span>            <span class="bp">self</span><span class="o">.</span><span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-35'>
@@ -514,7 +515,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">133</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">save</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">134</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">save</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-36'>
@@ -526,8 +527,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">136</span><span class="nd">@option</span><span class="p">(</span><span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">optimizer</span><span class="p">)</span>
-<span class="lineno">137</span><span class="k">def</span> <span class="nf">_optimizer</span><span class="p">(</span><span class="n">c</span><span class="p">:</span> <span class="n">NLPClassificationConfigs</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">137</span><span class="nd">@option</span><span class="p">(</span><span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">optimizer</span><span class="p">)</span>
+<span class="lineno">138</span><span class="k">def</span> <span class="nf">_optimizer</span><span class="p">(</span><span class="n">c</span><span class="p">:</span> <span class="n">NLPClassificationConfigs</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-37'>
@@ -538,12 +539,12 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">142</span>    <span class="n">optimizer</span> <span class="o">=</span> <span class="n">OptimizerConfigs</span><span class="p">()</span>
-<span class="lineno">143</span>    <span class="n">optimizer</span><span class="o">.</span><span class="n">parameters</span> <span class="o">=</span> <span class="n">c</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">parameters</span><span class="p">()</span>
-<span class="lineno">144</span>    <span class="n">optimizer</span><span class="o">.</span><span class="n">optimizer</span> <span class="o">=</span> <span class="s1">&#39;Adam&#39;</span>
-<span class="lineno">145</span>    <span class="n">optimizer</span><span class="o">.</span><span class="n">d_model</span> <span class="o">=</span> <span class="n">c</span><span class="o">.</span><span class="n">d_model</span>
-<span class="lineno">146</span>
-<span class="lineno">147</span>    <span class="k">return</span> <span class="n">optimizer</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">143</span>    <span class="n">optimizer</span> <span class="o">=</span> <span class="n">OptimizerConfigs</span><span class="p">()</span>
+<span class="lineno">144</span>    <span class="n">optimizer</span><span class="o">.</span><span class="n">parameters</span> <span class="o">=</span> <span class="n">c</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">parameters</span><span class="p">()</span>
+<span class="lineno">145</span>    <span class="n">optimizer</span><span class="o">.</span><span class="n">optimizer</span> <span class="o">=</span> <span class="s1">&#39;Adam&#39;</span>
+<span class="lineno">146</span>    <span class="n">optimizer</span><span class="o">.</span><span class="n">d_model</span> <span class="o">=</span> <span class="n">c</span><span class="o">.</span><span class="n">d_model</span>
+<span class="lineno">147</span>
+<span class="lineno">148</span>    <span class="k">return</span> <span class="n">optimizer</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-38'>
@@ -558,8 +559,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">150</span><span class="nd">@option</span><span class="p">(</span><span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">tokenizer</span><span class="p">)</span>
-<span class="lineno">151</span><span class="k">def</span> <span class="nf">basic_english</span><span class="p">():</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">151</span><span class="nd">@option</span><span class="p">(</span><span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">tokenizer</span><span class="p">)</span>
+<span class="lineno">152</span><span class="k">def</span> <span class="nf">basic_english</span><span class="p">():</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-39'>
@@ -570,8 +571,8 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">165</span>    <span class="kn">from</span> <span class="nn">torchtext.data</span> <span class="kn">import</span> <span class="n">get_tokenizer</span>
-<span class="lineno">166</span>    <span class="k">return</span> <span class="n">get_tokenizer</span><span class="p">(</span><span class="s1">&#39;basic_english&#39;</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">166</span>    <span class="kn">from</span> <span class="nn">torchtext.data</span> <span class="kn">import</span> <span class="n">get_tokenizer</span>
+<span class="lineno">167</span>    <span class="k">return</span> <span class="n">get_tokenizer</span><span class="p">(</span><span class="s1">&#39;basic_english&#39;</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-40'>
@@ -583,7 +584,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">169</span><span class="k">def</span> <span class="nf">character_tokenizer</span><span class="p">(</span><span class="n">x</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">170</span><span class="k">def</span> <span class="nf">character_tokenizer</span><span class="p">(</span><span class="n">x</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-41'>
@@ -594,7 +595,7 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">173</span>    <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="n">x</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">174</span>    <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="n">x</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-42'>
@@ -606,8 +607,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">176</span><span class="nd">@option</span><span class="p">(</span><span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">tokenizer</span><span class="p">)</span>
-<span class="lineno">177</span><span class="k">def</span> <span class="nf">character</span><span class="p">():</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">177</span><span class="nd">@option</span><span class="p">(</span><span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">tokenizer</span><span class="p">)</span>
+<span class="lineno">178</span><span class="k">def</span> <span class="nf">character</span><span class="p">():</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-43'>
@@ -618,7 +619,7 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">181</span>    <span class="k">return</span> <span class="n">character_tokenizer</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">182</span>    <span class="k">return</span> <span class="n">character_tokenizer</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-44'>
@@ -630,8 +631,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">184</span><span class="nd">@option</span><span class="p">(</span><span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">n_tokens</span><span class="p">)</span>
-<span class="lineno">185</span><span class="k">def</span> <span class="nf">_n_tokens</span><span class="p">(</span><span class="n">c</span><span class="p">:</span> <span class="n">NLPClassificationConfigs</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">185</span><span class="nd">@option</span><span class="p">(</span><span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">n_tokens</span><span class="p">)</span>
+<span class="lineno">186</span><span class="k">def</span> <span class="nf">_n_tokens</span><span class="p">(</span><span class="n">c</span><span class="p">:</span> <span class="n">NLPClassificationConfigs</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-45'>
@@ -642,7 +643,7 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">189</span>    <span class="k">return</span> <span class="nb">len</span><span class="p">(</span><span class="n">c</span><span class="o">.</span><span class="n">vocab</span><span class="p">)</span> <span class="o">+</span> <span class="mi">2</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">190</span>    <span class="k">return</span> <span class="nb">len</span><span class="p">(</span><span class="n">c</span><span class="o">.</span><span class="n">vocab</span><span class="p">)</span> <span class="o">+</span> <span class="mi">2</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-46'>
@@ -654,7 +655,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">192</span><span class="k">class</span> <span class="nc">CollateFunc</span><span class="p">:</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">193</span><span class="k">class</span> <span class="nc">CollateFunc</span><span class="p">:</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-47'>
@@ -677,7 +678,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">197</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">tokenizer</span><span class="p">,</span> <span class="n">vocab</span><span class="p">:</span> <span class="n">Vocab</span><span class="p">,</span> <span class="n">seq_len</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">padding_token</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">classifier_token</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">198</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">tokenizer</span><span class="p">,</span> <span class="n">vocab</span><span class="p">:</span> <span class="n">Vocab</span><span class="p">,</span> <span class="n">seq_len</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">padding_token</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">classifier_token</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-48'>
@@ -688,11 +689,11 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">205</span>        <span class="bp">self</span><span class="o">.</span><span class="n">classifier_token</span> <span class="o">=</span> <span class="n">classifier_token</span>
-<span class="lineno">206</span>        <span class="bp">self</span><span class="o">.</span><span class="n">padding_token</span> <span class="o">=</span> <span class="n">padding_token</span>
-<span class="lineno">207</span>        <span class="bp">self</span><span class="o">.</span><span class="n">seq_len</span> <span class="o">=</span> <span class="n">seq_len</span>
-<span class="lineno">208</span>        <span class="bp">self</span><span class="o">.</span><span class="n">vocab</span> <span class="o">=</span> <span class="n">vocab</span>
-<span class="lineno">209</span>        <span class="bp">self</span><span class="o">.</span><span class="n">tokenizer</span> <span class="o">=</span> <span class="n">tokenizer</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">206</span>        <span class="bp">self</span><span class="o">.</span><span class="n">classifier_token</span> <span class="o">=</span> <span class="n">classifier_token</span>
+<span class="lineno">207</span>        <span class="bp">self</span><span class="o">.</span><span class="n">padding_token</span> <span class="o">=</span> <span class="n">padding_token</span>
+<span class="lineno">208</span>        <span class="bp">self</span><span class="o">.</span><span class="n">seq_len</span> <span class="o">=</span> <span class="n">seq_len</span>
+<span class="lineno">209</span>        <span class="bp">self</span><span class="o">.</span><span class="n">vocab</span> <span class="o">=</span> <span class="n">vocab</span>
+<span class="lineno">210</span>        <span class="bp">self</span><span class="o">.</span><span class="n">tokenizer</span> <span class="o">=</span> <span class="n">tokenizer</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-49'>
@@ -706,7 +707,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">211</span>    <span class="k">def</span> <span class="fm">__call__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">212</span>    <span class="k">def</span> <span class="fm">__call__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-50'>
@@ -719,7 +720,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">217</span>        <span class="n">data</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">seq_len</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">batch</span><span class="p">)),</span> <span class="bp">self</span><span class="o">.</span><span class="n">padding_token</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">long</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">218</span>        <span class="n">data</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">seq_len</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">batch</span><span class="p">)),</span> <span class="bp">self</span><span class="o">.</span><span class="n">padding_token</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">long</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-51'>
@@ -731,7 +732,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">219</span>        <span class="n">labels</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">batch</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">long</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">220</span>        <span class="n">labels</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">batch</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">long</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-52'>
@@ -743,7 +744,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">222</span>        <span class="k">for</span> <span class="p">(</span><span class="n">i</span><span class="p">,</span> <span class="p">(</span><span class="n">_label</span><span class="p">,</span> <span class="n">_text</span><span class="p">))</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">batch</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">223</span>        <span class="k">for</span> <span class="p">(</span><span class="n">i</span><span class="p">,</span> <span class="p">(</span><span class="n">_label</span><span class="p">,</span> <span class="n">_text</span><span class="p">))</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">batch</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-53'>
@@ -755,7 +756,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">224</span>            <span class="n">labels</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">_label</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">225</span>            <span class="n">labels</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">_label</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-54'>
@@ -767,7 +768,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">226</span>            <span class="n">_text</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">vocab</span><span class="p">[</span><span class="n">token</span><span class="p">]</span> <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">tokenizer</span><span class="p">(</span><span class="n">_text</span><span class="p">)]</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">227</span>            <span class="n">_text</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">vocab</span><span class="p">[</span><span class="n">token</span><span class="p">]</span> <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">tokenizer</span><span class="p">(</span><span class="n">_text</span><span class="p">)]</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-55'>
@@ -780,7 +781,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">228</span>            <span class="n">_text</span> <span class="o">=</span> <span class="n">_text</span><span class="p">[:</span><span class="bp">self</span><span class="o">.</span><span class="n">seq_len</span><span class="p">]</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">229</span>            <span class="n">_text</span> <span class="o">=</span> <span class="n">_text</span><span class="p">[:</span><span class="bp">self</span><span class="o">.</span><span class="n">seq_len</span><span class="p">]</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-56'>
@@ -792,7 +793,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">230</span>            <span class="n">data</span><span class="p">[:</span><span class="nb">len</span><span class="p">(</span><span class="n">_text</span><span class="p">),</span> <span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">new_tensor</span><span class="p">(</span><span class="n">_text</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">231</span>            <span class="n">data</span><span class="p">[:</span><span class="nb">len</span><span class="p">(</span><span class="n">_text</span><span class="p">),</span> <span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">new_tensor</span><span class="p">(</span><span class="n">_text</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-57'>
@@ -805,7 +806,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">233</span>        <span class="n">data</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">classifier_token</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">234</span>        <span class="n">data</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">classifier_token</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-58'>
@@ -817,7 +818,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">236</span>        <span class="k">return</span> <span class="n">data</span><span class="p">,</span> <span class="n">labels</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">237</span>        <span class="k">return</span> <span class="n">data</span><span class="p">,</span> <span class="n">labels</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-59'>
@@ -834,11 +835,11 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">239</span><span class="nd">@option</span><span class="p">([</span><span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">n_classes</span><span class="p">,</span>
-<span class="lineno">240</span>         <span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">vocab</span><span class="p">,</span>
-<span class="lineno">241</span>         <span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">train_loader</span><span class="p">,</span>
-<span class="lineno">242</span>         <span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">valid_loader</span><span class="p">])</span>
-<span class="lineno">243</span><span class="k">def</span> <span class="nf">ag_news</span><span class="p">(</span><span class="n">c</span><span class="p">:</span> <span class="n">NLPClassificationConfigs</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">240</span><span class="nd">@option</span><span class="p">([</span><span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">n_classes</span><span class="p">,</span>
+<span class="lineno">241</span>         <span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">vocab</span><span class="p">,</span>
+<span class="lineno">242</span>         <span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">train_loader</span><span class="p">,</span>
+<span class="lineno">243</span>         <span class="n">NLPClassificationConfigs</span><span class="o">.</span><span class="n">valid_loader</span><span class="p">])</span>
+<span class="lineno">244</span><span class="k">def</span> <span class="nf">ag_news</span><span class="p">(</span><span class="n">c</span><span class="p">:</span> <span class="n">NLPClassificationConfigs</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-60'>
@@ -850,7 +851,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">252</span>    <span class="n">train</span><span class="p">,</span> <span class="n">valid</span> <span class="o">=</span> <span class="n">torchtext</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">AG_NEWS</span><span class="p">(</span><span class="n">root</span><span class="o">=</span><span class="nb">str</span><span class="p">(</span><span class="n">lab</span><span class="o">.</span><span class="n">get_data_path</span><span class="p">()</span> <span class="o">/</span> <span class="s1">&#39;ag_news&#39;</span><span class="p">),</span> <span class="n">split</span><span class="o">=</span><span class="p">(</span><span class="s1">&#39;train&#39;</span><span class="p">,</span> <span class="s1">&#39;test&#39;</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">253</span>    <span class="n">train</span><span class="p">,</span> <span class="n">valid</span> <span class="o">=</span> <span class="n">torchtext</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">AG_NEWS</span><span class="p">(</span><span class="n">root</span><span class="o">=</span><span class="nb">str</span><span class="p">(</span><span class="n">lab</span><span class="o">.</span><span class="n">get_data_path</span><span class="p">()</span> <span class="o">/</span> <span class="s1">&#39;ag_news&#39;</span><span class="p">),</span> <span class="n">split</span><span class="o">=</span><span class="p">(</span><span class="s1">&#39;train&#39;</span><span class="p">,</span> <span class="s1">&#39;test&#39;</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-61'>
@@ -862,8 +863,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">255</span>    <span class="k">with</span> <span class="n">monit</span><span class="o">.</span><span class="n">section</span><span class="p">(</span><span class="s1">&#39;Load data&#39;</span><span class="p">):</span>
-<span class="lineno">256</span>        <span class="kn">from</span> <span class="nn">labml_nn.utils</span> <span class="kn">import</span> <span class="n">MapStyleDataset</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">256</span>    <span class="k">with</span> <span class="n">monit</span><span class="o">.</span><span class="n">section</span><span class="p">(</span><span class="s1">&#39;Load data&#39;</span><span class="p">):</span>
+<span class="lineno">257</span>        <span class="kn">from</span> <span class="nn">labml_nn.utils</span> <span class="kn">import</span> <span class="n">MapStyleDataset</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-62'>
@@ -875,7 +876,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">259</span>        <span class="n">train</span><span class="p">,</span> <span class="n">valid</span> <span class="o">=</span> <span class="n">MapStyleDataset</span><span class="p">(</span><span class="n">train</span><span class="p">),</span> <span class="n">MapStyleDataset</span><span class="p">(</span><span class="n">valid</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">260</span>        <span class="n">train</span><span class="p">,</span> <span class="n">valid</span> <span class="o">=</span> <span class="n">MapStyleDataset</span><span class="p">(</span><span class="n">train</span><span class="p">),</span> <span class="n">MapStyleDataset</span><span class="p">(</span><span class="n">valid</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-63'>
@@ -887,7 +888,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">262</span>    <span class="n">tokenizer</span> <span class="o">=</span> <span class="n">c</span><span class="o">.</span><span class="n">tokenizer</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">263</span>    <span class="n">tokenizer</span> <span class="o">=</span> <span class="n">c</span><span class="o">.</span><span class="n">tokenizer</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-64'>
@@ -899,7 +900,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">265</span>    <span class="n">counter</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">266</span>    <span class="n">counter</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-65'>
@@ -911,8 +912,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">267</span>    <span class="k">for</span> <span class="p">(</span><span class="n">label</span><span class="p">,</span> <span class="n">line</span><span class="p">)</span> <span class="ow">in</span> <span class="n">train</span><span class="p">:</span>
-<span class="lineno">268</span>        <span class="n">counter</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">tokenizer</span><span class="p">(</span><span class="n">line</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">268</span>    <span class="k">for</span> <span class="p">(</span><span class="n">label</span><span class="p">,</span> <span class="n">line</span><span class="p">)</span> <span class="ow">in</span> <span class="n">train</span><span class="p">:</span>
+<span class="lineno">269</span>        <span class="n">counter</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">tokenizer</span><span class="p">(</span><span class="n">line</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-66'>
@@ -924,8 +925,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">270</span>    <span class="k">for</span> <span class="p">(</span><span class="n">label</span><span class="p">,</span> <span class="n">line</span><span class="p">)</span> <span class="ow">in</span> <span class="n">valid</span><span class="p">:</span>
-<span class="lineno">271</span>        <span class="n">counter</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">tokenizer</span><span class="p">(</span><span class="n">line</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">271</span>    <span class="k">for</span> <span class="p">(</span><span class="n">label</span><span class="p">,</span> <span class="n">line</span><span class="p">)</span> <span class="ow">in</span> <span class="n">valid</span><span class="p">:</span>
+<span class="lineno">272</span>        <span class="n">counter</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">tokenizer</span><span class="p">(</span><span class="n">line</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-67'>
@@ -937,7 +938,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">273</span>    <span class="n">vocab</span> <span class="o">=</span> <span class="n">Vocab</span><span class="p">(</span><span class="n">counter</span><span class="p">,</span> <span class="n">min_freq</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">274</span>    <span class="n">vocab</span> <span class="o">=</span> <span class="n">torchtext</span><span class="o">.</span><span class="n">vocab</span><span class="o">.</span><span class="n">vocab</span><span class="p">(</span><span class="n">counter</span><span class="p">,</span> <span class="n">min_freq</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-68'>
@@ -949,8 +950,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">276</span>    <span class="n">train_loader</span> <span class="o">=</span> <span class="n">DataLoader</span><span class="p">(</span><span class="n">train</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="n">c</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-<span class="lineno">277</span>                              <span class="n">collate_fn</span><span class="o">=</span><span class="n">CollateFunc</span><span class="p">(</span><span class="n">tokenizer</span><span class="p">,</span> <span class="n">vocab</span><span class="p">,</span> <span class="n">c</span><span class="o">.</span><span class="n">seq_len</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">vocab</span><span class="p">),</span> <span class="nb">len</span><span class="p">(</span><span class="n">vocab</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">277</span>    <span class="n">train_loader</span> <span class="o">=</span> <span class="n">DataLoader</span><span class="p">(</span><span class="n">train</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="n">c</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+<span class="lineno">278</span>                              <span class="n">collate_fn</span><span class="o">=</span><span class="n">CollateFunc</span><span class="p">(</span><span class="n">tokenizer</span><span class="p">,</span> <span class="n">vocab</span><span class="p">,</span> <span class="n">c</span><span class="o">.</span><span class="n">seq_len</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">vocab</span><span class="p">),</span> <span class="nb">len</span><span class="p">(</span><span class="n">vocab</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-69'>
@@ -962,8 +963,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">279</span>    <span class="n">valid_loader</span> <span class="o">=</span> <span class="n">DataLoader</span><span class="p">(</span><span class="n">valid</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="n">c</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-<span class="lineno">280</span>                              <span class="n">collate_fn</span><span class="o">=</span><span class="n">CollateFunc</span><span class="p">(</span><span class="n">tokenizer</span><span class="p">,</span> <span class="n">vocab</span><span class="p">,</span> <span class="n">c</span><span class="o">.</span><span class="n">seq_len</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">vocab</span><span class="p">),</span> <span class="nb">len</span><span class="p">(</span><span class="n">vocab</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">280</span>    <span class="n">valid_loader</span> <span class="o">=</span> <span class="n">DataLoader</span><span class="p">(</span><span class="n">valid</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="n">c</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+<span class="lineno">281</span>                              <span class="n">collate_fn</span><span class="o">=</span><span class="n">CollateFunc</span><span class="p">(</span><span class="n">tokenizer</span><span class="p">,</span> <span class="n">vocab</span><span class="p">,</span> <span class="n">c</span><span class="o">.</span><span class="n">seq_len</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">vocab</span><span class="p">),</span> <span class="nb">len</span><span class="p">(</span><span class="n">vocab</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-70'>
@@ -979,7 +980,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">283</span>    <span class="k">return</span> <span class="mi">4</span><span class="p">,</span> <span class="n">vocab</span><span class="p">,</span> <span class="n">train_loader</span><span class="p">,</span> <span class="n">valid_loader</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">284</span>    <span class="k">return</span> <span class="mi">4</span><span class="p">,</span> <span class="n">vocab</span><span class="p">,</span> <span class="n">train_loader</span><span class="p">,</span> <span class="n">valid_loader</span></pre></div>
         </div>
     </div>
     <div class='footer'>
@@ -992,7 +993,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/cycle_gan/index.html b/docs/gan/cycle_gan/index.html
index 9ebc9fc7..4e8558a1 100644
--- a/docs/gan/cycle_gan/index.html
+++ b/docs/gan/cycle_gan/index.html
@@ -89,14 +89,15 @@
 <span class="lineno">43</span><span class="kn">import</span> <span class="nn">torchvision.transforms</span> <span class="k">as</span> <span class="nn">transforms</span>
 <span class="lineno">44</span><span class="kn">from</span> <span class="nn">PIL</span> <span class="kn">import</span> <span class="n">Image</span>
 <span class="lineno">45</span><span class="kn">from</span> <span class="nn">torch.utils.data</span> <span class="kn">import</span> <span class="n">DataLoader</span><span class="p">,</span> <span class="n">Dataset</span>
-<span class="lineno">46</span><span class="kn">from</span> <span class="nn">torchvision.utils</span> <span class="kn">import</span> <span class="n">make_grid</span>
-<span class="lineno">47</span>
-<span class="lineno">48</span><span class="kn">from</span> <span class="nn">labml</span> <span class="kn">import</span> <span class="n">lab</span><span class="p">,</span> <span class="n">tracker</span><span class="p">,</span> <span class="n">experiment</span><span class="p">,</span> <span class="n">monit</span>
-<span class="lineno">49</span><span class="kn">from</span> <span class="nn">labml.configs</span> <span class="kn">import</span> <span class="n">BaseConfigs</span>
-<span class="lineno">50</span><span class="kn">from</span> <span class="nn">labml.utils.download</span> <span class="kn">import</span> <span class="n">download_file</span>
-<span class="lineno">51</span><span class="kn">from</span> <span class="nn">labml.utils.pytorch</span> <span class="kn">import</span> <span class="n">get_modules</span>
-<span class="lineno">52</span><span class="kn">from</span> <span class="nn">labml_helpers.device</span> <span class="kn">import</span> <span class="n">DeviceConfigs</span>
-<span class="lineno">53</span><span class="kn">from</span> <span class="nn">labml_helpers.module</span> <span class="kn">import</span> <span class="n">Module</span></pre></div>
+<span class="lineno">46</span><span class="kn">from</span> <span class="nn">torchvision.transforms</span> <span class="kn">import</span> <span class="n">InterpolationMode</span>
+<span class="lineno">47</span><span class="kn">from</span> <span class="nn">torchvision.utils</span> <span class="kn">import</span> <span class="n">make_grid</span>
+<span class="lineno">48</span>
+<span class="lineno">49</span><span class="kn">from</span> <span class="nn">labml</span> <span class="kn">import</span> <span class="n">lab</span><span class="p">,</span> <span class="n">tracker</span><span class="p">,</span> <span class="n">experiment</span><span class="p">,</span> <span class="n">monit</span>
+<span class="lineno">50</span><span class="kn">from</span> <span class="nn">labml.configs</span> <span class="kn">import</span> <span class="n">BaseConfigs</span>
+<span class="lineno">51</span><span class="kn">from</span> <span class="nn">labml.utils.download</span> <span class="kn">import</span> <span class="n">download_file</span>
+<span class="lineno">52</span><span class="kn">from</span> <span class="nn">labml.utils.pytorch</span> <span class="kn">import</span> <span class="n">get_modules</span>
+<span class="lineno">53</span><span class="kn">from</span> <span class="nn">labml_helpers.device</span> <span class="kn">import</span> <span class="n">DeviceConfigs</span>
+<span class="lineno">54</span><span class="kn">from</span> <span class="nn">labml_helpers.module</span> <span class="kn">import</span> <span class="n">Module</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-1'>
@@ -108,7 +109,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">56</span><span class="k">class</span> <span class="nc">GeneratorResNet</span><span class="p">(</span><span class="n">Module</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">57</span><span class="k">class</span> <span class="nc">GeneratorResNet</span><span class="p">(</span><span class="n">Module</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-2'>
@@ -119,8 +120,8 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">61</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_channels</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">n_residual_blocks</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
-<span class="lineno">62</span>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">62</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_channels</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">n_residual_blocks</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
+<span class="lineno">63</span>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-3'>
@@ -135,13 +136,13 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">70</span>        <span class="n">out_features</span> <span class="o">=</span> <span class="mi">64</span>
-<span class="lineno">71</span>        <span class="n">layers</span> <span class="o">=</span> <span class="p">[</span>
-<span class="lineno">72</span>            <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">input_channels</span><span class="p">,</span> <span class="n">out_features</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">7</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">padding_mode</span><span class="o">=</span><span class="s1">&#39;reflect&#39;</span><span class="p">),</span>
-<span class="lineno">73</span>            <span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">out_features</span><span class="p">),</span>
-<span class="lineno">74</span>            <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">),</span>
-<span class="lineno">75</span>        <span class="p">]</span>
-<span class="lineno">76</span>        <span class="n">in_features</span> <span class="o">=</span> <span class="n">out_features</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">71</span>        <span class="n">out_features</span> <span class="o">=</span> <span class="mi">64</span>
+<span class="lineno">72</span>        <span class="n">layers</span> <span class="o">=</span> <span class="p">[</span>
+<span class="lineno">73</span>            <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">input_channels</span><span class="p">,</span> <span class="n">out_features</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">7</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">padding_mode</span><span class="o">=</span><span class="s1">&#39;reflect&#39;</span><span class="p">),</span>
+<span class="lineno">74</span>            <span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">out_features</span><span class="p">),</span>
+<span class="lineno">75</span>            <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">),</span>
+<span class="lineno">76</span>        <span class="p">]</span>
+<span class="lineno">77</span>        <span class="n">in_features</span> <span class="o">=</span> <span class="n">out_features</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-4'>
@@ -153,14 +154,14 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">80</span>        <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">):</span>
-<span class="lineno">81</span>            <span class="n">out_features</span> <span class="o">*=</span> <span class="mi">2</span>
-<span class="lineno">82</span>            <span class="n">layers</span> <span class="o">+=</span> <span class="p">[</span>
-<span class="lineno">83</span>                <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">,</span> <span class="n">out_features</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">stride</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span>
-<span class="lineno">84</span>                <span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">out_features</span><span class="p">),</span>
-<span class="lineno">85</span>                <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">),</span>
-<span class="lineno">86</span>            <span class="p">]</span>
-<span class="lineno">87</span>            <span class="n">in_features</span> <span class="o">=</span> <span class="n">out_features</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">81</span>        <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">):</span>
+<span class="lineno">82</span>            <span class="n">out_features</span> <span class="o">*=</span> <span class="mi">2</span>
+<span class="lineno">83</span>            <span class="n">layers</span> <span class="o">+=</span> <span class="p">[</span>
+<span class="lineno">84</span>                <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">,</span> <span class="n">out_features</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">stride</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span>
+<span class="lineno">85</span>                <span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">out_features</span><span class="p">),</span>
+<span class="lineno">86</span>                <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">),</span>
+<span class="lineno">87</span>            <span class="p">]</span>
+<span class="lineno">88</span>            <span class="n">in_features</span> <span class="o">=</span> <span class="n">out_features</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-5'>
@@ -173,8 +174,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">91</span>        <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_residual_blocks</span><span class="p">):</span>
-<span class="lineno">92</span>            <span class="n">layers</span> <span class="o">+=</span> <span class="p">[</span><span class="n">ResidualBlock</span><span class="p">(</span><span class="n">out_features</span><span class="p">)]</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">92</span>        <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_residual_blocks</span><span class="p">):</span>
+<span class="lineno">93</span>            <span class="n">layers</span> <span class="o">+=</span> <span class="p">[</span><span class="n">ResidualBlock</span><span class="p">(</span><span class="n">out_features</span><span class="p">)]</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-6'>
@@ -186,15 +187,15 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">96</span>        <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">):</span>
-<span class="lineno">97</span>            <span class="n">out_features</span> <span class="o">//=</span> <span class="mi">2</span>
-<span class="lineno">98</span>            <span class="n">layers</span> <span class="o">+=</span> <span class="p">[</span>
-<span class="lineno">99</span>                <span class="n">nn</span><span class="o">.</span><span class="n">Upsample</span><span class="p">(</span><span class="n">scale_factor</span><span class="o">=</span><span class="mi">2</span><span class="p">),</span>
-<span class="lineno">100</span>                <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">,</span> <span class="n">out_features</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">stride</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span>
-<span class="lineno">101</span>                <span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">out_features</span><span class="p">),</span>
-<span class="lineno">102</span>                <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">),</span>
-<span class="lineno">103</span>            <span class="p">]</span>
-<span class="lineno">104</span>            <span class="n">in_features</span> <span class="o">=</span> <span class="n">out_features</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">97</span>        <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">):</span>
+<span class="lineno">98</span>            <span class="n">out_features</span> <span class="o">//=</span> <span class="mi">2</span>
+<span class="lineno">99</span>            <span class="n">layers</span> <span class="o">+=</span> <span class="p">[</span>
+<span class="lineno">100</span>                <span class="n">nn</span><span class="o">.</span><span class="n">Upsample</span><span class="p">(</span><span class="n">scale_factor</span><span class="o">=</span><span class="mi">2</span><span class="p">),</span>
+<span class="lineno">101</span>                <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">,</span> <span class="n">out_features</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">stride</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span>
+<span class="lineno">102</span>                <span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">out_features</span><span class="p">),</span>
+<span class="lineno">103</span>                <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">),</span>
+<span class="lineno">104</span>            <span class="p">]</span>
+<span class="lineno">105</span>            <span class="n">in_features</span> <span class="o">=</span> <span class="n">out_features</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-7'>
@@ -206,7 +207,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">107</span>        <span class="n">layers</span> <span class="o">+=</span> <span class="p">[</span><span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">out_features</span><span class="p">,</span> <span class="n">input_channels</span><span class="p">,</span> <span class="mi">7</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">padding_mode</span><span class="o">=</span><span class="s1">&#39;reflect&#39;</span><span class="p">),</span> <span class="n">nn</span><span class="o">.</span><span class="n">Tanh</span><span class="p">()]</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">108</span>        <span class="n">layers</span> <span class="o">+=</span> <span class="p">[</span><span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">out_features</span><span class="p">,</span> <span class="n">input_channels</span><span class="p">,</span> <span class="mi">7</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">padding_mode</span><span class="o">=</span><span class="s1">&#39;reflect&#39;</span><span class="p">),</span> <span class="n">nn</span><span class="o">.</span><span class="n">Tanh</span><span class="p">()]</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-8'>
@@ -218,7 +219,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">110</span>        <span class="bp">self</span><span class="o">.</span><span class="n">layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span><span class="o">*</span><span class="n">layers</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">111</span>        <span class="bp">self</span><span class="o">.</span><span class="n">layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span><span class="o">*</span><span class="n">layers</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-9'>
@@ -230,7 +231,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">113</span>        <span class="bp">self</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="n">weights_init_normal</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">114</span>        <span class="bp">self</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="n">weights_init_normal</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-10'>
@@ -241,8 +242,8 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">115</span>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">):</span>
-<span class="lineno">116</span>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="p">(</span><span class="n">x</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">116</span>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">):</span>
+<span class="lineno">117</span>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="p">(</span><span class="n">x</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-11'>
@@ -254,7 +255,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">119</span><span class="k">class</span> <span class="nc">ResidualBlock</span><span class="p">(</span><span class="n">Module</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">120</span><span class="k">class</span> <span class="nc">ResidualBlock</span><span class="p">(</span><span class="n">Module</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-12'>
@@ -265,16 +266,16 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">124</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">in_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
-<span class="lineno">125</span>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-<span class="lineno">126</span>        <span class="bp">self</span><span class="o">.</span><span class="n">block</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span>
-<span class="lineno">127</span>            <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">,</span> <span class="n">in_features</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">padding_mode</span><span class="o">=</span><span class="s1">&#39;reflect&#39;</span><span class="p">),</span>
-<span class="lineno">128</span>            <span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">),</span>
-<span class="lineno">129</span>            <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">),</span>
-<span class="lineno">130</span>            <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">,</span> <span class="n">in_features</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">padding_mode</span><span class="o">=</span><span class="s1">&#39;reflect&#39;</span><span class="p">),</span>
-<span class="lineno">131</span>            <span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">),</span>
-<span class="lineno">132</span>            <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">),</span>
-<span class="lineno">133</span>        <span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">125</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">in_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
+<span class="lineno">126</span>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+<span class="lineno">127</span>        <span class="bp">self</span><span class="o">.</span><span class="n">block</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span>
+<span class="lineno">128</span>            <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">,</span> <span class="n">in_features</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">padding_mode</span><span class="o">=</span><span class="s1">&#39;reflect&#39;</span><span class="p">),</span>
+<span class="lineno">129</span>            <span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">),</span>
+<span class="lineno">130</span>            <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">),</span>
+<span class="lineno">131</span>            <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">,</span> <span class="n">in_features</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">padding_mode</span><span class="o">=</span><span class="s1">&#39;reflect&#39;</span><span class="p">),</span>
+<span class="lineno">132</span>            <span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">in_features</span><span class="p">),</span>
+<span class="lineno">133</span>            <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">),</span>
+<span class="lineno">134</span>        <span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-13'>
@@ -285,8 +286,8 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">135</span>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span>
-<span class="lineno">136</span>        <span class="k">return</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">block</span><span class="p">(</span><span class="n">x</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">136</span>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span>
+<span class="lineno">137</span>        <span class="k">return</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">block</span><span class="p">(</span><span class="n">x</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-14'>
@@ -298,7 +299,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">139</span><span class="k">class</span> <span class="nc">Discriminator</span><span class="p">(</span><span class="n">Module</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">140</span><span class="k">class</span> <span class="nc">Discriminator</span><span class="p">(</span><span class="n">Module</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-15'>
@@ -309,9 +310,9 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">144</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_shape</span><span class="p">:</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">]):</span>
-<span class="lineno">145</span>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-<span class="lineno">146</span>        <span class="n">channels</span><span class="p">,</span> <span class="n">height</span><span class="p">,</span> <span class="n">width</span> <span class="o">=</span> <span class="n">input_shape</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">145</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_shape</span><span class="p">:</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">]):</span>
+<span class="lineno">146</span>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+<span class="lineno">147</span>        <span class="n">channels</span><span class="p">,</span> <span class="n">height</span><span class="p">,</span> <span class="n">width</span> <span class="o">=</span> <span class="n">input_shape</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-16'>
@@ -323,9 +324,9 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">150</span>        <span class="bp">self</span><span class="o">.</span><span class="n">output_shape</span> <span class="o">=</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">height</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">**</span> <span class="mi">4</span><span class="p">,</span> <span class="n">width</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">**</span> <span class="mi">4</span><span class="p">)</span>
-<span class="lineno">151</span>
-<span class="lineno">152</span>        <span class="bp">self</span><span class="o">.</span><span class="n">layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">151</span>        <span class="bp">self</span><span class="o">.</span><span class="n">output_shape</span> <span class="o">=</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">height</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">**</span> <span class="mi">4</span><span class="p">,</span> <span class="n">width</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">**</span> <span class="mi">4</span><span class="p">)</span>
+<span class="lineno">152</span>
+<span class="lineno">153</span>        <span class="bp">self</span><span class="o">.</span><span class="n">layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-17'>
@@ -337,10 +338,10 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">154</span>            <span class="n">DiscriminatorBlock</span><span class="p">(</span><span class="n">channels</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">),</span>
-<span class="lineno">155</span>            <span class="n">DiscriminatorBlock</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">),</span>
-<span class="lineno">156</span>            <span class="n">DiscriminatorBlock</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="mi">256</span><span class="p">),</span>
-<span class="lineno">157</span>            <span class="n">DiscriminatorBlock</span><span class="p">(</span><span class="mi">256</span><span class="p">,</span> <span class="mi">512</span><span class="p">),</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">155</span>            <span class="n">DiscriminatorBlock</span><span class="p">(</span><span class="n">channels</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">),</span>
+<span class="lineno">156</span>            <span class="n">DiscriminatorBlock</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">),</span>
+<span class="lineno">157</span>            <span class="n">DiscriminatorBlock</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="mi">256</span><span class="p">),</span>
+<span class="lineno">158</span>            <span class="n">DiscriminatorBlock</span><span class="p">(</span><span class="mi">256</span><span class="p">,</span> <span class="mi">512</span><span class="p">),</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-18'>
@@ -352,9 +353,9 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">160</span>            <span class="n">nn</span><span class="o">.</span><span class="n">ZeroPad2d</span><span class="p">((</span><span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)),</span>
-<span class="lineno">161</span>            <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="mi">512</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-<span class="lineno">162</span>        <span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">161</span>            <span class="n">nn</span><span class="o">.</span><span class="n">ZeroPad2d</span><span class="p">((</span><span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)),</span>
+<span class="lineno">162</span>            <span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="mi">512</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+<span class="lineno">163</span>        <span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-19'>
@@ -366,7 +367,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">165</span>        <span class="bp">self</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="n">weights_init_normal</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">166</span>        <span class="bp">self</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="n">weights_init_normal</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-20'>
@@ -377,8 +378,8 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">167</span>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">img</span><span class="p">):</span>
-<span class="lineno">168</span>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="p">(</span><span class="n">img</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">168</span>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">img</span><span class="p">):</span>
+<span class="lineno">169</span>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="p">(</span><span class="n">img</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-21'>
@@ -391,7 +392,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">171</span><span class="k">class</span> <span class="nc">DiscriminatorBlock</span><span class="p">(</span><span class="n">Module</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">172</span><span class="k">class</span> <span class="nc">DiscriminatorBlock</span><span class="p">(</span><span class="n">Module</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-22'>
@@ -402,13 +403,13 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">179</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">in_filters</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">out_filters</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">normalize</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">):</span>
-<span class="lineno">180</span>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-<span class="lineno">181</span>        <span class="n">layers</span> <span class="o">=</span> <span class="p">[</span><span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">in_filters</span><span class="p">,</span> <span class="n">out_filters</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span> <span class="n">stride</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">)]</span>
-<span class="lineno">182</span>        <span class="k">if</span> <span class="n">normalize</span><span class="p">:</span>
-<span class="lineno">183</span>            <span class="n">layers</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">out_filters</span><span class="p">))</span>
-<span class="lineno">184</span>        <span class="n">layers</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">LeakyReLU</span><span class="p">(</span><span class="mf">0.2</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">))</span>
-<span class="lineno">185</span>        <span class="bp">self</span><span class="o">.</span><span class="n">layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span><span class="o">*</span><span class="n">layers</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">180</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">in_filters</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">out_filters</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">normalize</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">):</span>
+<span class="lineno">181</span>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+<span class="lineno">182</span>        <span class="n">layers</span> <span class="o">=</span> <span class="p">[</span><span class="n">nn</span><span class="o">.</span><span class="n">Conv2d</span><span class="p">(</span><span class="n">in_filters</span><span class="p">,</span> <span class="n">out_filters</span><span class="p">,</span> <span class="n">kernel_size</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span> <span class="n">stride</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="mi">1</span><span class="p">)]</span>
+<span class="lineno">183</span>        <span class="k">if</span> <span class="n">normalize</span><span class="p">:</span>
+<span class="lineno">184</span>            <span class="n">layers</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">InstanceNorm2d</span><span class="p">(</span><span class="n">out_filters</span><span class="p">))</span>
+<span class="lineno">185</span>        <span class="n">layers</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">LeakyReLU</span><span class="p">(</span><span class="mf">0.2</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">))</span>
+<span class="lineno">186</span>        <span class="bp">self</span><span class="o">.</span><span class="n">layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span><span class="o">*</span><span class="n">layers</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-23'>
@@ -419,8 +420,8 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">187</span>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span>
-<span class="lineno">188</span>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="p">(</span><span class="n">x</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">188</span>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span>
+<span class="lineno">189</span>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="p">(</span><span class="n">x</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-24'>
@@ -432,7 +433,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">191</span><span class="k">def</span> <span class="nf">weights_init_normal</span><span class="p">(</span><span class="n">m</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">192</span><span class="k">def</span> <span class="nf">weights_init_normal</span><span class="p">(</span><span class="n">m</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-25'>
@@ -443,9 +444,9 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">195</span>    <span class="n">classname</span> <span class="o">=</span> <span class="n">m</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span>
-<span class="lineno">196</span>    <span class="k">if</span> <span class="n">classname</span><span class="o">.</span><span class="n">find</span><span class="p">(</span><span class="s2">&quot;Conv&quot;</span><span class="p">)</span> <span class="o">!=</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
-<span class="lineno">197</span>        <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">init</span><span class="o">.</span><span class="n">normal_</span><span class="p">(</span><span class="n">m</span><span class="o">.</span><span class="n">weight</span><span class="o">.</span><span class="n">data</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">,</span> <span class="mf">0.02</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">196</span>    <span class="n">classname</span> <span class="o">=</span> <span class="n">m</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span>
+<span class="lineno">197</span>    <span class="k">if</span> <span class="n">classname</span><span class="o">.</span><span class="n">find</span><span class="p">(</span><span class="s2">&quot;Conv&quot;</span><span class="p">)</span> <span class="o">!=</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
+<span class="lineno">198</span>        <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">init</span><span class="o">.</span><span class="n">normal_</span><span class="p">(</span><span class="n">m</span><span class="o">.</span><span class="n">weight</span><span class="o">.</span><span class="n">data</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">,</span> <span class="mf">0.02</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-26'>
@@ -457,7 +458,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">200</span><span class="k">def</span> <span class="nf">load_image</span><span class="p">(</span><span class="n">path</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">201</span><span class="k">def</span> <span class="nf">load_image</span><span class="p">(</span><span class="n">path</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-27'>
@@ -468,11 +469,11 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">204</span>    <span class="n">image</span> <span class="o">=</span> <span class="n">Image</span><span class="o">.</span><span class="n">open</span><span class="p">(</span><span class="n">path</span><span class="p">)</span>
-<span class="lineno">205</span>    <span class="k">if</span> <span class="n">image</span><span class="o">.</span><span class="n">mode</span> <span class="o">!=</span> <span class="s1">&#39;RGB&#39;</span><span class="p">:</span>
-<span class="lineno">206</span>        <span class="n">image</span> <span class="o">=</span> <span class="n">Image</span><span class="o">.</span><span class="n">new</span><span class="p">(</span><span class="s2">&quot;RGB&quot;</span><span class="p">,</span> <span class="n">image</span><span class="o">.</span><span class="n">size</span><span class="p">)</span><span class="o">.</span><span class="n">paste</span><span class="p">(</span><span class="n">image</span><span class="p">)</span>
-<span class="lineno">207</span>
-<span class="lineno">208</span>    <span class="k">return</span> <span class="n">image</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">205</span>    <span class="n">image</span> <span class="o">=</span> <span class="n">Image</span><span class="o">.</span><span class="n">open</span><span class="p">(</span><span class="n">path</span><span class="p">)</span>
+<span class="lineno">206</span>    <span class="k">if</span> <span class="n">image</span><span class="o">.</span><span class="n">mode</span> <span class="o">!=</span> <span class="s1">&#39;RGB&#39;</span><span class="p">:</span>
+<span class="lineno">207</span>        <span class="n">image</span> <span class="o">=</span> <span class="n">Image</span><span class="o">.</span><span class="n">new</span><span class="p">(</span><span class="s2">&quot;RGB&quot;</span><span class="p">,</span> <span class="n">image</span><span class="o">.</span><span class="n">size</span><span class="p">)</span><span class="o">.</span><span class="n">paste</span><span class="p">(</span><span class="n">image</span><span class="p">)</span>
+<span class="lineno">208</span>
+<span class="lineno">209</span>    <span class="k">return</span> <span class="n">image</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-28'>
@@ -484,7 +485,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">211</span><span class="k">class</span> <span class="nc">ImageDataset</span><span class="p">(</span><span class="n">Dataset</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">212</span><span class="k">class</span> <span class="nc">ImageDataset</span><span class="p">(</span><span class="n">Dataset</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-29'>
@@ -496,8 +497,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">216</span>    <span class="nd">@staticmethod</span>
-<span class="lineno">217</span>    <span class="k">def</span> <span class="nf">download</span><span class="p">(</span><span class="n">dataset_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">217</span>    <span class="nd">@staticmethod</span>
+<span class="lineno">218</span>    <span class="k">def</span> <span class="nf">download</span><span class="p">(</span><span class="n">dataset_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-30'>
@@ -509,7 +510,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">222</span>        <span class="n">url</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;https://people.eecs.berkeley.edu/~taesung_park/CycleGAN/datasets/</span><span class="si">{</span><span class="n">dataset_name</span><span class="si">}</span><span class="s1">.zip&#39;</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">223</span>        <span class="n">url</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;https://people.eecs.berkeley.edu/~taesung_park/CycleGAN/datasets/</span><span class="si">{</span><span class="n">dataset_name</span><span class="si">}</span><span class="s1">.zip&#39;</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-31'>
@@ -521,9 +522,9 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">224</span>        <span class="n">root</span> <span class="o">=</span> <span class="n">lab</span><span class="o">.</span><span class="n">get_data_path</span><span class="p">()</span> <span class="o">/</span> <span class="s1">&#39;cycle_gan&#39;</span>
-<span class="lineno">225</span>        <span class="k">if</span> <span class="ow">not</span> <span class="n">root</span><span class="o">.</span><span class="n">exists</span><span class="p">():</span>
-<span class="lineno">226</span>            <span class="n">root</span><span class="o">.</span><span class="n">mkdir</span><span class="p">(</span><span class="n">parents</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">225</span>        <span class="n">root</span> <span class="o">=</span> <span class="n">lab</span><span class="o">.</span><span class="n">get_data_path</span><span class="p">()</span> <span class="o">/</span> <span class="s1">&#39;cycle_gan&#39;</span>
+<span class="lineno">226</span>        <span class="k">if</span> <span class="ow">not</span> <span class="n">root</span><span class="o">.</span><span class="n">exists</span><span class="p">():</span>
+<span class="lineno">227</span>            <span class="n">root</span><span class="o">.</span><span class="n">mkdir</span><span class="p">(</span><span class="n">parents</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-32'>
@@ -535,7 +536,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">228</span>        <span class="n">archive</span> <span class="o">=</span> <span class="n">root</span> <span class="o">/</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">dataset_name</span><span class="si">}</span><span class="s1">.zip&#39;</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">229</span>        <span class="n">archive</span> <span class="o">=</span> <span class="n">root</span> <span class="o">/</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">dataset_name</span><span class="si">}</span><span class="s1">.zip&#39;</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-33'>
@@ -547,7 +548,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">230</span>        <span class="n">download_file</span><span class="p">(</span><span class="n">url</span><span class="p">,</span> <span class="n">archive</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">231</span>        <span class="n">download_file</span><span class="p">(</span><span class="n">url</span><span class="p">,</span> <span class="n">archive</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-34'>
@@ -559,8 +560,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">232</span>        <span class="k">with</span> <span class="n">zipfile</span><span class="o">.</span><span class="n">ZipFile</span><span class="p">(</span><span class="n">archive</span><span class="p">,</span> <span class="s1">&#39;r&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
-<span class="lineno">233</span>            <span class="n">f</span><span class="o">.</span><span class="n">extractall</span><span class="p">(</span><span class="n">root</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">233</span>        <span class="k">with</span> <span class="n">zipfile</span><span class="o">.</span><span class="n">ZipFile</span><span class="p">(</span><span class="n">archive</span><span class="p">,</span> <span class="s1">&#39;r&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+<span class="lineno">234</span>            <span class="n">f</span><span class="o">.</span><span class="n">extractall</span><span class="p">(</span><span class="n">root</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-35'>
@@ -580,7 +581,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">235</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dataset_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">transforms_</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">236</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dataset_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">transforms_</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-36'>
@@ -592,7 +593,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">244</span>        <span class="n">root</span> <span class="o">=</span> <span class="n">lab</span><span class="o">.</span><span class="n">get_data_path</span><span class="p">()</span> <span class="o">/</span> <span class="s1">&#39;cycle_gan&#39;</span> <span class="o">/</span> <span class="n">dataset_name</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">245</span>        <span class="n">root</span> <span class="o">=</span> <span class="n">lab</span><span class="o">.</span><span class="n">get_data_path</span><span class="p">()</span> <span class="o">/</span> <span class="s1">&#39;cycle_gan&#39;</span> <span class="o">/</span> <span class="n">dataset_name</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-37'>
@@ -604,8 +605,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">246</span>        <span class="k">if</span> <span class="ow">not</span> <span class="n">root</span><span class="o">.</span><span class="n">exists</span><span class="p">():</span>
-<span class="lineno">247</span>            <span class="bp">self</span><span class="o">.</span><span class="n">download</span><span class="p">(</span><span class="n">dataset_name</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">247</span>        <span class="k">if</span> <span class="ow">not</span> <span class="n">root</span><span class="o">.</span><span class="n">exists</span><span class="p">():</span>
+<span class="lineno">248</span>            <span class="bp">self</span><span class="o">.</span><span class="n">download</span><span class="p">(</span><span class="n">dataset_name</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-38'>
@@ -617,7 +618,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">250</span>        <span class="bp">self</span><span class="o">.</span><span class="n">transform</span> <span class="o">=</span> <span class="n">transforms</span><span class="o">.</span><span class="n">Compose</span><span class="p">(</span><span class="n">transforms_</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">251</span>        <span class="bp">self</span><span class="o">.</span><span class="n">transform</span> <span class="o">=</span> <span class="n">transforms</span><span class="o">.</span><span class="n">Compose</span><span class="p">(</span><span class="n">transforms_</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-39'>
@@ -629,10 +630,10 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">253</span>        <span class="n">path_a</span> <span class="o">=</span> <span class="n">root</span> <span class="o">/</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">mode</span><span class="si">}</span><span class="s1">A&#39;</span>
-<span class="lineno">254</span>        <span class="n">path_b</span> <span class="o">=</span> <span class="n">root</span> <span class="o">/</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">mode</span><span class="si">}</span><span class="s1">B&#39;</span>
-<span class="lineno">255</span>        <span class="bp">self</span><span class="o">.</span><span class="n">files_a</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">f</span><span class="p">)</span> <span class="k">for</span> <span class="n">f</span> <span class="ow">in</span> <span class="n">path_a</span><span class="o">.</span><span class="n">iterdir</span><span class="p">())</span>
-<span class="lineno">256</span>        <span class="bp">self</span><span class="o">.</span><span class="n">files_b</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">f</span><span class="p">)</span> <span class="k">for</span> <span class="n">f</span> <span class="ow">in</span> <span class="n">path_b</span><span class="o">.</span><span class="n">iterdir</span><span class="p">())</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">254</span>        <span class="n">path_a</span> <span class="o">=</span> <span class="n">root</span> <span class="o">/</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">mode</span><span class="si">}</span><span class="s1">A&#39;</span>
+<span class="lineno">255</span>        <span class="n">path_b</span> <span class="o">=</span> <span class="n">root</span> <span class="o">/</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">mode</span><span class="si">}</span><span class="s1">B&#39;</span>
+<span class="lineno">256</span>        <span class="bp">self</span><span class="o">.</span><span class="n">files_a</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">f</span><span class="p">)</span> <span class="k">for</span> <span class="n">f</span> <span class="ow">in</span> <span class="n">path_a</span><span class="o">.</span><span class="n">iterdir</span><span class="p">())</span>
+<span class="lineno">257</span>        <span class="bp">self</span><span class="o">.</span><span class="n">files_b</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">f</span><span class="p">)</span> <span class="k">for</span> <span class="n">f</span> <span class="ow">in</span> <span class="n">path_b</span><span class="o">.</span><span class="n">iterdir</span><span class="p">())</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-40'>
@@ -643,7 +644,7 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">258</span>    <span class="k">def</span> <span class="fm">__getitem__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">index</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">259</span>    <span class="k">def</span> <span class="fm">__getitem__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">index</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-41'>
@@ -655,8 +656,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">262</span>        <span class="k">return</span> <span class="p">{</span><span class="s2">&quot;x&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transform</span><span class="p">(</span><span class="n">load_image</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_a</span><span class="p">[</span><span class="n">index</span> <span class="o">%</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_a</span><span class="p">)])),</span>
-<span class="lineno">263</span>                <span class="s2">&quot;y&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transform</span><span class="p">(</span><span class="n">load_image</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_b</span><span class="p">[</span><span class="n">index</span> <span class="o">%</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_b</span><span class="p">)]))}</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">263</span>        <span class="k">return</span> <span class="p">{</span><span class="s2">&quot;x&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transform</span><span class="p">(</span><span class="n">load_image</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_a</span><span class="p">[</span><span class="n">index</span> <span class="o">%</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_a</span><span class="p">)])),</span>
+<span class="lineno">264</span>                <span class="s2">&quot;y&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transform</span><span class="p">(</span><span class="n">load_image</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_b</span><span class="p">[</span><span class="n">index</span> <span class="o">%</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_b</span><span class="p">)]))}</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-42'>
@@ -667,7 +668,7 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">265</span>    <span class="k">def</span> <span class="fm">__len__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">266</span>    <span class="k">def</span> <span class="fm">__len__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-43'>
@@ -679,7 +680,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">267</span>        <span class="k">return</span> <span class="nb">max</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_a</span><span class="p">),</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_b</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">268</span>        <span class="k">return</span> <span class="nb">max</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_a</span><span class="p">),</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">files_b</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-44'>
@@ -694,7 +695,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">270</span><span class="k">class</span> <span class="nc">ReplayBuffer</span><span class="p">:</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">271</span><span class="k">class</span> <span class="nc">ReplayBuffer</span><span class="p">:</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-45'>
@@ -705,9 +706,9 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">284</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">max_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">50</span><span class="p">):</span>
-<span class="lineno">285</span>        <span class="bp">self</span><span class="o">.</span><span class="n">max_size</span> <span class="o">=</span> <span class="n">max_size</span>
-<span class="lineno">286</span>        <span class="bp">self</span><span class="o">.</span><span class="n">data</span> <span class="o">=</span> <span class="p">[]</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">285</span>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">max_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">50</span><span class="p">):</span>
+<span class="lineno">286</span>        <span class="bp">self</span><span class="o">.</span><span class="n">max_size</span> <span class="o">=</span> <span class="n">max_size</span>
+<span class="lineno">287</span>        <span class="bp">self</span><span class="o">.</span><span class="n">data</span> <span class="o">=</span> <span class="p">[]</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-46'>
@@ -719,7 +720,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">288</span>    <span class="k">def</span> <span class="nf">push_and_pop</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">289</span>    <span class="k">def</span> <span class="nf">push_and_pop</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-47'>
@@ -730,20 +731,20 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">290</span>        <span class="n">data</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span>
-<span class="lineno">291</span>        <span class="n">res</span> <span class="o">=</span> <span class="p">[]</span>
-<span class="lineno">292</span>        <span class="k">for</span> <span class="n">element</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
-<span class="lineno">293</span>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_size</span><span class="p">:</span>
-<span class="lineno">294</span>                <span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">element</span><span class="p">)</span>
-<span class="lineno">295</span>                <span class="n">res</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">element</span><span class="p">)</span>
-<span class="lineno">296</span>            <span class="k">else</span><span class="p">:</span>
-<span class="lineno">297</span>                <span class="k">if</span> <span class="n">random</span><span class="o">.</span><span class="n">uniform</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mf">0.5</span><span class="p">:</span>
-<span class="lineno">298</span>                    <span class="n">i</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_size</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span>
-<span class="lineno">299</span>                    <span class="n">res</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
-<span class="lineno">300</span>                    <span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">element</span>
-<span class="lineno">301</span>                <span class="k">else</span><span class="p">:</span>
-<span class="lineno">302</span>                    <span class="n">res</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">element</span><span class="p">)</span>
-<span class="lineno">303</span>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">res</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">291</span>        <span class="n">data</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span>
+<span class="lineno">292</span>        <span class="n">res</span> <span class="o">=</span> <span class="p">[]</span>
+<span class="lineno">293</span>        <span class="k">for</span> <span class="n">element</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
+<span class="lineno">294</span>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_size</span><span class="p">:</span>
+<span class="lineno">295</span>                <span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">element</span><span class="p">)</span>
+<span class="lineno">296</span>                <span class="n">res</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">element</span><span class="p">)</span>
+<span class="lineno">297</span>            <span class="k">else</span><span class="p">:</span>
+<span class="lineno">298</span>                <span class="k">if</span> <span class="n">random</span><span class="o">.</span><span class="n">uniform</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mf">0.5</span><span class="p">:</span>
+<span class="lineno">299</span>                    <span class="n">i</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_size</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span>
+<span class="lineno">300</span>                    <span class="n">res</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
+<span class="lineno">301</span>                    <span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">element</span>
+<span class="lineno">302</span>                <span class="k">else</span><span class="p">:</span>
+<span class="lineno">303</span>                    <span class="n">res</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">element</span><span class="p">)</span>
+<span class="lineno">304</span>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">res</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-48'>
@@ -755,7 +756,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">306</span><span class="k">class</span> <span class="nc">Configs</span><span class="p">(</span><span class="n">BaseConfigs</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">307</span><span class="k">class</span> <span class="nc">Configs</span><span class="p">(</span><span class="n">BaseConfigs</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-49'>
@@ -768,7 +769,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">310</span>    <span class="n">device</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">DeviceConfigs</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">311</span>    <span class="n">device</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">DeviceConfigs</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-50'>
@@ -780,15 +781,15 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">313</span>    <span class="n">epochs</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">200</span>
-<span class="lineno">314</span>    <span class="n">dataset_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;monet2photo&#39;</span>
-<span class="lineno">315</span>    <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span>
-<span class="lineno">316</span>
-<span class="lineno">317</span>    <span class="n">data_loader_workers</span> <span class="o">=</span> <span class="mi">8</span>
-<span class="lineno">318</span>
-<span class="lineno">319</span>    <span class="n">learning_rate</span> <span class="o">=</span> <span class="mf">0.0002</span>
-<span class="lineno">320</span>    <span class="n">adam_betas</span> <span class="o">=</span> <span class="p">(</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.999</span><span class="p">)</span>
-<span class="lineno">321</span>    <span class="n">decay_start</span> <span class="o">=</span> <span class="mi">100</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">314</span>    <span class="n">epochs</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">200</span>
+<span class="lineno">315</span>    <span class="n">dataset_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;monet2photo&#39;</span>
+<span class="lineno">316</span>    <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span>
+<span class="lineno">317</span>
+<span class="lineno">318</span>    <span class="n">data_loader_workers</span> <span class="o">=</span> <span class="mi">8</span>
+<span class="lineno">319</span>
+<span class="lineno">320</span>    <span class="n">learning_rate</span> <span class="o">=</span> <span class="mf">0.0002</span>
+<span class="lineno">321</span>    <span class="n">adam_betas</span> <span class="o">=</span> <span class="p">(</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.999</span><span class="p">)</span>
+<span class="lineno">322</span>    <span class="n">decay_start</span> <span class="o">=</span> <span class="mi">100</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-51'>
@@ -800,7 +801,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">325</span>    <span class="n">gan_loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">MSELoss</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">326</span>    <span class="n">gan_loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">MSELoss</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-52'>
@@ -812,8 +813,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">328</span>    <span class="n">cycle_loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">L1Loss</span><span class="p">()</span>
-<span class="lineno">329</span>    <span class="n">identity_loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">L1Loss</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">329</span>    <span class="n">cycle_loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">L1Loss</span><span class="p">()</span>
+<span class="lineno">330</span>    <span class="n">identity_loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">L1Loss</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-53'>
@@ -825,9 +826,9 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">332</span>    <span class="n">img_height</span> <span class="o">=</span> <span class="mi">256</span>
-<span class="lineno">333</span>    <span class="n">img_width</span> <span class="o">=</span> <span class="mi">256</span>
-<span class="lineno">334</span>    <span class="n">img_channels</span> <span class="o">=</span> <span class="mi">3</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">333</span>    <span class="n">img_height</span> <span class="o">=</span> <span class="mi">256</span>
+<span class="lineno">334</span>    <span class="n">img_width</span> <span class="o">=</span> <span class="mi">256</span>
+<span class="lineno">335</span>    <span class="n">img_channels</span> <span class="o">=</span> <span class="mi">3</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-54'>
@@ -839,7 +840,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">337</span>    <span class="n">n_residual_blocks</span> <span class="o">=</span> <span class="mi">9</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">338</span>    <span class="n">n_residual_blocks</span> <span class="o">=</span> <span class="mi">9</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-55'>
@@ -851,10 +852,10 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">340</span>    <span class="n">cyclic_loss_coefficient</span> <span class="o">=</span> <span class="mf">10.0</span>
-<span class="lineno">341</span>    <span class="n">identity_loss_coefficient</span> <span class="o">=</span> <span class="mf">5.</span>
-<span class="lineno">342</span>
-<span class="lineno">343</span>    <span class="n">sample_interval</span> <span class="o">=</span> <span class="mi">500</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">341</span>    <span class="n">cyclic_loss_coefficient</span> <span class="o">=</span> <span class="mf">10.0</span>
+<span class="lineno">342</span>    <span class="n">identity_loss_coefficient</span> <span class="o">=</span> <span class="mf">5.</span>
+<span class="lineno">343</span>
+<span class="lineno">344</span>    <span class="n">sample_interval</span> <span class="o">=</span> <span class="mi">500</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-56'>
@@ -866,10 +867,10 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">346</span>    <span class="n">generator_xy</span><span class="p">:</span> <span class="n">GeneratorResNet</span>
-<span class="lineno">347</span>    <span class="n">generator_yx</span><span class="p">:</span> <span class="n">GeneratorResNet</span>
-<span class="lineno">348</span>    <span class="n">discriminator_x</span><span class="p">:</span> <span class="n">Discriminator</span>
-<span class="lineno">349</span>    <span class="n">discriminator_y</span><span class="p">:</span> <span class="n">Discriminator</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">347</span>    <span class="n">generator_xy</span><span class="p">:</span> <span class="n">GeneratorResNet</span>
+<span class="lineno">348</span>    <span class="n">generator_yx</span><span class="p">:</span> <span class="n">GeneratorResNet</span>
+<span class="lineno">349</span>    <span class="n">discriminator_x</span><span class="p">:</span> <span class="n">Discriminator</span>
+<span class="lineno">350</span>    <span class="n">discriminator_y</span><span class="p">:</span> <span class="n">Discriminator</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-57'>
@@ -881,8 +882,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">352</span>    <span class="n">generator_optimizer</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">Adam</span>
-<span class="lineno">353</span>    <span class="n">discriminator_optimizer</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">Adam</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">353</span>    <span class="n">generator_optimizer</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">Adam</span>
+<span class="lineno">354</span>    <span class="n">discriminator_optimizer</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">Adam</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-58'>
@@ -894,8 +895,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">356</span>    <span class="n">generator_lr_scheduler</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">lr_scheduler</span><span class="o">.</span><span class="n">LambdaLR</span>
-<span class="lineno">357</span>    <span class="n">discriminator_lr_scheduler</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">lr_scheduler</span><span class="o">.</span><span class="n">LambdaLR</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">357</span>    <span class="n">generator_lr_scheduler</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">lr_scheduler</span><span class="o">.</span><span class="n">LambdaLR</span>
+<span class="lineno">358</span>    <span class="n">discriminator_lr_scheduler</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">lr_scheduler</span><span class="o">.</span><span class="n">LambdaLR</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-59'>
@@ -907,8 +908,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">360</span>    <span class="n">dataloader</span><span class="p">:</span> <span class="n">DataLoader</span>
-<span class="lineno">361</span>    <span class="n">valid_dataloader</span><span class="p">:</span> <span class="n">DataLoader</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">361</span>    <span class="n">dataloader</span><span class="p">:</span> <span class="n">DataLoader</span>
+<span class="lineno">362</span>    <span class="n">valid_dataloader</span><span class="p">:</span> <span class="n">DataLoader</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-60'>
@@ -920,7 +921,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">363</span>    <span class="k">def</span> <span class="nf">sample_images</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">364</span>    <span class="k">def</span> <span class="nf">sample_images</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-61'>
@@ -931,13 +932,13 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">365</span>        <span class="n">batch</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="nb">iter</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">valid_dataloader</span><span class="p">))</span>
-<span class="lineno">366</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
-<span class="lineno">367</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
-<span class="lineno">368</span>        <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">no_grad</span><span class="p">():</span>
-<span class="lineno">369</span>            <span class="n">data_x</span><span class="p">,</span> <span class="n">data_y</span> <span class="o">=</span> <span class="n">batch</span><span class="p">[</span><span class="s1">&#39;x&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="o">.</span><span class="n">device</span><span class="p">),</span> <span class="n">batch</span><span class="p">[</span><span class="s1">&#39;y&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-<span class="lineno">370</span>            <span class="n">gen_y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="p">(</span><span class="n">data_x</span><span class="p">)</span>
-<span class="lineno">371</span>            <span class="n">gen_x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="p">(</span><span class="n">data_y</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">366</span>        <span class="n">batch</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="nb">iter</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">valid_dataloader</span><span class="p">))</span>
+<span class="lineno">367</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
+<span class="lineno">368</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
+<span class="lineno">369</span>        <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">no_grad</span><span class="p">():</span>
+<span class="lineno">370</span>            <span class="n">data_x</span><span class="p">,</span> <span class="n">data_y</span> <span class="o">=</span> <span class="n">batch</span><span class="p">[</span><span class="s1">&#39;x&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="o">.</span><span class="n">device</span><span class="p">),</span> <span class="n">batch</span><span class="p">[</span><span class="s1">&#39;y&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+<span class="lineno">371</span>            <span class="n">gen_y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="p">(</span><span class="n">data_x</span><span class="p">)</span>
+<span class="lineno">372</span>            <span class="n">gen_x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="p">(</span><span class="n">data_y</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-62'>
@@ -949,10 +950,10 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">374</span>            <span class="n">data_x</span> <span class="o">=</span> <span class="n">make_grid</span><span class="p">(</span><span class="n">data_x</span><span class="p">,</span> <span class="n">nrow</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-<span class="lineno">375</span>            <span class="n">data_y</span> <span class="o">=</span> <span class="n">make_grid</span><span class="p">(</span><span class="n">data_y</span><span class="p">,</span> <span class="n">nrow</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-<span class="lineno">376</span>            <span class="n">gen_x</span> <span class="o">=</span> <span class="n">make_grid</span><span class="p">(</span><span class="n">gen_x</span><span class="p">,</span> <span class="n">nrow</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-<span class="lineno">377</span>            <span class="n">gen_y</span> <span class="o">=</span> <span class="n">make_grid</span><span class="p">(</span><span class="n">gen_y</span><span class="p">,</span> <span class="n">nrow</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">375</span>            <span class="n">data_x</span> <span class="o">=</span> <span class="n">make_grid</span><span class="p">(</span><span class="n">data_x</span><span class="p">,</span> <span class="n">nrow</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+<span class="lineno">376</span>            <span class="n">data_y</span> <span class="o">=</span> <span class="n">make_grid</span><span class="p">(</span><span class="n">data_y</span><span class="p">,</span> <span class="n">nrow</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+<span class="lineno">377</span>            <span class="n">gen_x</span> <span class="o">=</span> <span class="n">make_grid</span><span class="p">(</span><span class="n">gen_x</span><span class="p">,</span> <span class="n">nrow</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+<span class="lineno">378</span>            <span class="n">gen_y</span> <span class="o">=</span> <span class="n">make_grid</span><span class="p">(</span><span class="n">gen_y</span><span class="p">,</span> <span class="n">nrow</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-63'>
@@ -964,7 +965,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">380</span>            <span class="n">image_grid</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cat</span><span class="p">((</span><span class="n">data_x</span><span class="p">,</span> <span class="n">gen_y</span><span class="p">,</span> <span class="n">data_y</span><span class="p">,</span> <span class="n">gen_x</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">381</span>            <span class="n">image_grid</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cat</span><span class="p">((</span><span class="n">data_x</span><span class="p">,</span> <span class="n">gen_y</span><span class="p">,</span> <span class="n">data_y</span><span class="p">,</span> <span class="n">gen_x</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-64'>
@@ -976,7 +977,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">383</span>        <span class="n">plot_image</span><span class="p">(</span><span class="n">image_grid</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">384</span>        <span class="n">plot_image</span><span class="p">(</span><span class="n">image_grid</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-65'>
@@ -988,7 +989,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">385</span>    <span class="k">def</span> <span class="nf">initialize</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">386</span>    <span class="k">def</span> <span class="nf">initialize</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-66'>
@@ -999,7 +1000,7 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">389</span>        <span class="n">input_shape</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_channels</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">img_height</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">img_width</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">390</span>        <span class="n">input_shape</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_channels</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">img_height</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">img_width</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-67'>
@@ -1011,10 +1012,10 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">392</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span> <span class="o">=</span> <span class="n">GeneratorResNet</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_channels</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_residual_blocks</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-<span class="lineno">393</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span> <span class="o">=</span> <span class="n">GeneratorResNet</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_channels</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_residual_blocks</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-<span class="lineno">394</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span> <span class="o">=</span> <span class="n">Discriminator</span><span class="p">(</span><span class="n">input_shape</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-<span class="lineno">395</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_y</span> <span class="o">=</span> <span class="n">Discriminator</span><span class="p">(</span><span class="n">input_shape</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">393</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span> <span class="o">=</span> <span class="n">GeneratorResNet</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_channels</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_residual_blocks</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+<span class="lineno">394</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span> <span class="o">=</span> <span class="n">GeneratorResNet</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_channels</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_residual_blocks</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+<span class="lineno">395</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span> <span class="o">=</span> <span class="n">Discriminator</span><span class="p">(</span><span class="n">input_shape</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+<span class="lineno">396</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_y</span> <span class="o">=</span> <span class="n">Discriminator</span><span class="p">(</span><span class="n">input_shape</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-68'>
@@ -1026,12 +1027,12 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">398</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_optimizer</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span>
-<span class="lineno">399</span>            <span class="n">itertools</span><span class="o">.</span><span class="n">chain</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="o">.</span><span class="n">parameters</span><span class="p">()),</span>
-<span class="lineno">400</span>            <span class="n">lr</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">,</span> <span class="n">betas</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">adam_betas</span><span class="p">)</span>
-<span class="lineno">401</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_optimizer</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span>
-<span class="lineno">402</span>            <span class="n">itertools</span><span class="o">.</span><span class="n">chain</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_y</span><span class="o">.</span><span class="n">parameters</span><span class="p">()),</span>
-<span class="lineno">403</span>            <span class="n">lr</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">,</span> <span class="n">betas</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">adam_betas</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">399</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_optimizer</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span>
+<span class="lineno">400</span>            <span class="n">itertools</span><span class="o">.</span><span class="n">chain</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="o">.</span><span class="n">parameters</span><span class="p">()),</span>
+<span class="lineno">401</span>            <span class="n">lr</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">,</span> <span class="n">betas</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">adam_betas</span><span class="p">)</span>
+<span class="lineno">402</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_optimizer</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span>
+<span class="lineno">403</span>            <span class="n">itertools</span><span class="o">.</span><span class="n">chain</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_y</span><span class="o">.</span><span class="n">parameters</span><span class="p">()),</span>
+<span class="lineno">404</span>            <span class="n">lr</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">,</span> <span class="n">betas</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">adam_betas</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-69'>
@@ -1044,11 +1045,11 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">408</span>        <span class="n">decay_epochs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">epochs</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">decay_start</span>
-<span class="lineno">409</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_lr_scheduler</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">lr_scheduler</span><span class="o">.</span><span class="n">LambdaLR</span><span class="p">(</span>
-<span class="lineno">410</span>            <span class="bp">self</span><span class="o">.</span><span class="n">generator_optimizer</span><span class="p">,</span> <span class="n">lr_lambda</span><span class="o">=</span><span class="k">lambda</span> <span class="n">e</span><span class="p">:</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">e</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">decay_start</span><span class="p">)</span> <span class="o">/</span> <span class="n">decay_epochs</span><span class="p">)</span>
-<span class="lineno">411</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_lr_scheduler</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">lr_scheduler</span><span class="o">.</span><span class="n">LambdaLR</span><span class="p">(</span>
-<span class="lineno">412</span>            <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_optimizer</span><span class="p">,</span> <span class="n">lr_lambda</span><span class="o">=</span><span class="k">lambda</span> <span class="n">e</span><span class="p">:</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">e</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">decay_start</span><span class="p">)</span> <span class="o">/</span> <span class="n">decay_epochs</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">409</span>        <span class="n">decay_epochs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">epochs</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">decay_start</span>
+<span class="lineno">410</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_lr_scheduler</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">lr_scheduler</span><span class="o">.</span><span class="n">LambdaLR</span><span class="p">(</span>
+<span class="lineno">411</span>            <span class="bp">self</span><span class="o">.</span><span class="n">generator_optimizer</span><span class="p">,</span> <span class="n">lr_lambda</span><span class="o">=</span><span class="k">lambda</span> <span class="n">e</span><span class="p">:</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">e</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">decay_start</span><span class="p">)</span> <span class="o">/</span> <span class="n">decay_epochs</span><span class="p">)</span>
+<span class="lineno">412</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_lr_scheduler</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">lr_scheduler</span><span class="o">.</span><span class="n">LambdaLR</span><span class="p">(</span>
+<span class="lineno">413</span>            <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_optimizer</span><span class="p">,</span> <span class="n">lr_lambda</span><span class="o">=</span><span class="k">lambda</span> <span class="n">e</span><span class="p">:</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">e</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">decay_start</span><span class="p">)</span> <span class="o">/</span> <span class="n">decay_epochs</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-70'>
@@ -1060,13 +1061,13 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">415</span>        <span class="n">transforms_</span> <span class="o">=</span> <span class="p">[</span>
-<span class="lineno">416</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">Resize</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_height</span> <span class="o">*</span> <span class="mf">1.12</span><span class="p">),</span> <span class="n">Image</span><span class="o">.</span><span class="n">BICUBIC</span><span class="p">),</span>
-<span class="lineno">417</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">RandomCrop</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">img_height</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">img_width</span><span class="p">)),</span>
-<span class="lineno">418</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">RandomHorizontalFlip</span><span class="p">(),</span>
-<span class="lineno">419</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">ToTensor</span><span class="p">(),</span>
-<span class="lineno">420</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">Normalize</span><span class="p">((</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">),</span> <span class="p">(</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">)),</span>
-<span class="lineno">421</span>        <span class="p">]</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">416</span>        <span class="n">transforms_</span> <span class="o">=</span> <span class="p">[</span>
+<span class="lineno">417</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">Resize</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_height</span> <span class="o">*</span> <span class="mf">1.12</span><span class="p">),</span> <span class="n">InterpolationMode</span><span class="o">.</span><span class="n">BICUBIC</span><span class="p">),</span>
+<span class="lineno">418</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">RandomCrop</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">img_height</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">img_width</span><span class="p">)),</span>
+<span class="lineno">419</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">RandomHorizontalFlip</span><span class="p">(),</span>
+<span class="lineno">420</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">ToTensor</span><span class="p">(),</span>
+<span class="lineno">421</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">Normalize</span><span class="p">((</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">),</span> <span class="p">(</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">)),</span>
+<span class="lineno">422</span>        <span class="p">]</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-71'>
@@ -1078,12 +1079,12 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">424</span>        <span class="bp">self</span><span class="o">.</span><span class="n">dataloader</span> <span class="o">=</span> <span class="n">DataLoader</span><span class="p">(</span>
-<span class="lineno">425</span>            <span class="n">ImageDataset</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_name</span><span class="p">,</span> <span class="n">transforms_</span><span class="p">,</span> <span class="s1">&#39;train&#39;</span><span class="p">),</span>
-<span class="lineno">426</span>            <span class="n">batch_size</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-<span class="lineno">427</span>            <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-<span class="lineno">428</span>            <span class="n">num_workers</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">data_loader_workers</span><span class="p">,</span>
-<span class="lineno">429</span>        <span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">425</span>        <span class="bp">self</span><span class="o">.</span><span class="n">dataloader</span> <span class="o">=</span> <span class="n">DataLoader</span><span class="p">(</span>
+<span class="lineno">426</span>            <span class="n">ImageDataset</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_name</span><span class="p">,</span> <span class="n">transforms_</span><span class="p">,</span> <span class="s1">&#39;train&#39;</span><span class="p">),</span>
+<span class="lineno">427</span>            <span class="n">batch_size</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+<span class="lineno">428</span>            <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+<span class="lineno">429</span>            <span class="n">num_workers</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">data_loader_workers</span><span class="p">,</span>
+<span class="lineno">430</span>        <span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-72'>
@@ -1095,12 +1096,12 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">432</span>        <span class="bp">self</span><span class="o">.</span><span class="n">valid_dataloader</span> <span class="o">=</span> <span class="n">DataLoader</span><span class="p">(</span>
-<span class="lineno">433</span>            <span class="n">ImageDataset</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_name</span><span class="p">,</span> <span class="n">transforms_</span><span class="p">,</span> <span class="s2">&quot;test&quot;</span><span class="p">),</span>
-<span class="lineno">434</span>            <span class="n">batch_size</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span>
-<span class="lineno">435</span>            <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-<span class="lineno">436</span>            <span class="n">num_workers</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">data_loader_workers</span><span class="p">,</span>
-<span class="lineno">437</span>        <span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">433</span>        <span class="bp">self</span><span class="o">.</span><span class="n">valid_dataloader</span> <span class="o">=</span> <span class="n">DataLoader</span><span class="p">(</span>
+<span class="lineno">434</span>            <span class="n">ImageDataset</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_name</span><span class="p">,</span> <span class="n">transforms_</span><span class="p">,</span> <span class="s2">&quot;test&quot;</span><span class="p">),</span>
+<span class="lineno">435</span>            <span class="n">batch_size</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span>
+<span class="lineno">436</span>            <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+<span class="lineno">437</span>            <span class="n">num_workers</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">data_loader_workers</span><span class="p">,</span>
+<span class="lineno">438</span>        <span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-73'>
@@ -1126,7 +1127,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">439</span>    <span class="k">def</span> <span class="nf">run</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">440</span>    <span class="k">def</span> <span class="nf">run</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-74'>
@@ -1138,8 +1139,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">541</span>        <span class="n">gen_x_buffer</span> <span class="o">=</span> <span class="n">ReplayBuffer</span><span class="p">()</span>
-<span class="lineno">542</span>        <span class="n">gen_y_buffer</span> <span class="o">=</span> <span class="n">ReplayBuffer</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">542</span>        <span class="n">gen_x_buffer</span> <span class="o">=</span> <span class="n">ReplayBuffer</span><span class="p">()</span>
+<span class="lineno">543</span>        <span class="n">gen_y_buffer</span> <span class="o">=</span> <span class="n">ReplayBuffer</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-75'>
@@ -1151,7 +1152,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">545</span>        <span class="k">for</span> <span class="n">epoch</span> <span class="ow">in</span> <span class="n">monit</span><span class="o">.</span><span class="n">loop</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">epochs</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">546</span>        <span class="k">for</span> <span class="n">epoch</span> <span class="ow">in</span> <span class="n">monit</span><span class="o">.</span><span class="n">loop</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">epochs</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-76'>
@@ -1163,7 +1164,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">547</span>            <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">batch</span> <span class="ow">in</span> <span class="n">monit</span><span class="o">.</span><span class="n">enum</span><span class="p">(</span><span class="s1">&#39;Train&#39;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataloader</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">548</span>            <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">batch</span> <span class="ow">in</span> <span class="n">monit</span><span class="o">.</span><span class="n">enum</span><span class="p">(</span><span class="s1">&#39;Train&#39;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataloader</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-77'>
@@ -1175,7 +1176,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">549</span>                <span class="n">data_x</span><span class="p">,</span> <span class="n">data_y</span> <span class="o">=</span> <span class="n">batch</span><span class="p">[</span><span class="s1">&#39;x&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">),</span> <span class="n">batch</span><span class="p">[</span><span class="s1">&#39;y&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">550</span>                <span class="n">data_x</span><span class="p">,</span> <span class="n">data_y</span> <span class="o">=</span> <span class="n">batch</span><span class="p">[</span><span class="s1">&#39;x&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">),</span> <span class="n">batch</span><span class="p">[</span><span class="s1">&#39;y&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-78'>
@@ -1187,8 +1188,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">552</span>                <span class="n">true_labels</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="n">data_x</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span> <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="o">.</span><span class="n">output_shape</span><span class="p">,</span>
-<span class="lineno">553</span>                                         <span class="n">device</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">,</span> <span class="n">requires_grad</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">553</span>                <span class="n">true_labels</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="n">data_x</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span> <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="o">.</span><span class="n">output_shape</span><span class="p">,</span>
+<span class="lineno">554</span>                                         <span class="n">device</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">,</span> <span class="n">requires_grad</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-79'>
@@ -1200,8 +1201,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">555</span>                <span class="n">false_labels</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">data_x</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span> <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="o">.</span><span class="n">output_shape</span><span class="p">,</span>
-<span class="lineno">556</span>                                           <span class="n">device</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">,</span> <span class="n">requires_grad</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">556</span>                <span class="n">false_labels</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">data_x</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span> <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="o">.</span><span class="n">output_shape</span><span class="p">,</span>
+<span class="lineno">557</span>                                           <span class="n">device</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">,</span> <span class="n">requires_grad</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-80'>
@@ -1213,7 +1214,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">560</span>                <span class="n">gen_x</span><span class="p">,</span> <span class="n">gen_y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">optimize_generators</span><span class="p">(</span><span class="n">data_x</span><span class="p">,</span> <span class="n">data_y</span><span class="p">,</span> <span class="n">true_labels</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">561</span>                <span class="n">gen_x</span><span class="p">,</span> <span class="n">gen_y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">optimize_generators</span><span class="p">(</span><span class="n">data_x</span><span class="p">,</span> <span class="n">data_y</span><span class="p">,</span> <span class="n">true_labels</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-81'>
@@ -1225,9 +1226,9 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">563</span>                <span class="bp">self</span><span class="o">.</span><span class="n">optimize_discriminator</span><span class="p">(</span><span class="n">data_x</span><span class="p">,</span> <span class="n">data_y</span><span class="p">,</span>
-<span class="lineno">564</span>                                            <span class="n">gen_x_buffer</span><span class="o">.</span><span class="n">push_and_pop</span><span class="p">(</span><span class="n">gen_x</span><span class="p">),</span> <span class="n">gen_y_buffer</span><span class="o">.</span><span class="n">push_and_pop</span><span class="p">(</span><span class="n">gen_y</span><span class="p">),</span>
-<span class="lineno">565</span>                                            <span class="n">true_labels</span><span class="p">,</span> <span class="n">false_labels</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">564</span>                <span class="bp">self</span><span class="o">.</span><span class="n">optimize_discriminator</span><span class="p">(</span><span class="n">data_x</span><span class="p">,</span> <span class="n">data_y</span><span class="p">,</span>
+<span class="lineno">565</span>                                            <span class="n">gen_x_buffer</span><span class="o">.</span><span class="n">push_and_pop</span><span class="p">(</span><span class="n">gen_x</span><span class="p">),</span> <span class="n">gen_y_buffer</span><span class="o">.</span><span class="n">push_and_pop</span><span class="p">(</span><span class="n">gen_y</span><span class="p">),</span>
+<span class="lineno">566</span>                                            <span class="n">true_labels</span><span class="p">,</span> <span class="n">false_labels</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-82'>
@@ -1239,8 +1240,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">568</span>                <span class="n">tracker</span><span class="o">.</span><span class="n">save</span><span class="p">()</span>
-<span class="lineno">569</span>                <span class="n">tracker</span><span class="o">.</span><span class="n">add_global_step</span><span class="p">(</span><span class="nb">max</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">data_x</span><span class="p">),</span> <span class="nb">len</span><span class="p">(</span><span class="n">data_y</span><span class="p">)))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">569</span>                <span class="n">tracker</span><span class="o">.</span><span class="n">save</span><span class="p">()</span>
+<span class="lineno">570</span>                <span class="n">tracker</span><span class="o">.</span><span class="n">add_global_step</span><span class="p">(</span><span class="nb">max</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">data_x</span><span class="p">),</span> <span class="nb">len</span><span class="p">(</span><span class="n">data_y</span><span class="p">)))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-83'>
@@ -1252,8 +1253,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">572</span>                <span class="n">batches_done</span> <span class="o">=</span> <span class="n">epoch</span> <span class="o">*</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataloader</span><span class="p">)</span> <span class="o">+</span> <span class="n">i</span>
-<span class="lineno">573</span>                <span class="k">if</span> <span class="n">batches_done</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_interval</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">573</span>                <span class="n">batches_done</span> <span class="o">=</span> <span class="n">epoch</span> <span class="o">*</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataloader</span><span class="p">)</span> <span class="o">+</span> <span class="n">i</span>
+<span class="lineno">574</span>                <span class="k">if</span> <span class="n">batches_done</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_interval</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-84'>
@@ -1265,7 +1266,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">575</span>                    <span class="n">experiment</span><span class="o">.</span><span class="n">save_checkpoint</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">576</span>                    <span class="n">experiment</span><span class="o">.</span><span class="n">save_checkpoint</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-85'>
@@ -1277,7 +1278,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">577</span>                    <span class="bp">self</span><span class="o">.</span><span class="n">sample_images</span><span class="p">(</span><span class="n">batches_done</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">578</span>                    <span class="bp">self</span><span class="o">.</span><span class="n">sample_images</span><span class="p">(</span><span class="n">batches_done</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-86'>
@@ -1289,8 +1290,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">580</span>            <span class="bp">self</span><span class="o">.</span><span class="n">generator_lr_scheduler</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
-<span class="lineno">581</span>            <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_lr_scheduler</span><span class="o">.</span><span class="n">step</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">581</span>            <span class="bp">self</span><span class="o">.</span><span class="n">generator_lr_scheduler</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
+<span class="lineno">582</span>            <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_lr_scheduler</span><span class="o">.</span><span class="n">step</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-87'>
@@ -1302,7 +1303,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">583</span>            <span class="n">tracker</span><span class="o">.</span><span class="n">new_line</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">584</span>            <span class="n">tracker</span><span class="o">.</span><span class="n">new_line</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-88'>
@@ -1314,7 +1315,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">585</span>    <span class="k">def</span> <span class="nf">optimize_generators</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">data_x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">data_y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">true_labels</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">586</span>    <span class="k">def</span> <span class="nf">optimize_generators</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">data_x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">data_y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">true_labels</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-89'>
@@ -1326,8 +1327,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">591</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
-<span class="lineno">592</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="o">.</span><span class="n">train</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">592</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
+<span class="lineno">593</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="o">.</span><span class="n">train</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-90'>
@@ -1339,8 +1340,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">597</span>        <span class="n">loss_identity</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">identity_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="p">(</span><span class="n">data_x</span><span class="p">),</span> <span class="n">data_x</span><span class="p">)</span> <span class="o">+</span>
-<span class="lineno">598</span>                         <span class="bp">self</span><span class="o">.</span><span class="n">identity_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="p">(</span><span class="n">data_y</span><span class="p">),</span> <span class="n">data_y</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">598</span>        <span class="n">loss_identity</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">identity_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="p">(</span><span class="n">data_x</span><span class="p">),</span> <span class="n">data_x</span><span class="p">)</span> <span class="o">+</span>
+<span class="lineno">599</span>                         <span class="bp">self</span><span class="o">.</span><span class="n">identity_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="p">(</span><span class="n">data_y</span><span class="p">),</span> <span class="n">data_y</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-91'>
@@ -1352,8 +1353,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">601</span>        <span class="n">gen_y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="p">(</span><span class="n">data_x</span><span class="p">)</span>
-<span class="lineno">602</span>        <span class="n">gen_x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="p">(</span><span class="n">data_y</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">602</span>        <span class="n">gen_y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="p">(</span><span class="n">data_x</span><span class="p">)</span>
+<span class="lineno">603</span>        <span class="n">gen_x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="p">(</span><span class="n">data_y</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-92'>
@@ -1365,8 +1366,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">607</span>        <span class="n">loss_gan</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_y</span><span class="p">(</span><span class="n">gen_y</span><span class="p">),</span> <span class="n">true_labels</span><span class="p">)</span> <span class="o">+</span>
-<span class="lineno">608</span>                    <span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="p">(</span><span class="n">gen_x</span><span class="p">),</span> <span class="n">true_labels</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">608</span>        <span class="n">loss_gan</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_y</span><span class="p">(</span><span class="n">gen_y</span><span class="p">),</span> <span class="n">true_labels</span><span class="p">)</span> <span class="o">+</span>
+<span class="lineno">609</span>                    <span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="p">(</span><span class="n">gen_x</span><span class="p">),</span> <span class="n">true_labels</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-93'>
@@ -1378,8 +1379,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">615</span>        <span class="n">loss_cycle</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">cycle_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="p">(</span><span class="n">gen_y</span><span class="p">),</span> <span class="n">data_x</span><span class="p">)</span> <span class="o">+</span>
-<span class="lineno">616</span>                      <span class="bp">self</span><span class="o">.</span><span class="n">cycle_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="p">(</span><span class="n">gen_x</span><span class="p">),</span> <span class="n">data_y</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">616</span>        <span class="n">loss_cycle</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">cycle_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_yx</span><span class="p">(</span><span class="n">gen_y</span><span class="p">),</span> <span class="n">data_x</span><span class="p">)</span> <span class="o">+</span>
+<span class="lineno">617</span>                      <span class="bp">self</span><span class="o">.</span><span class="n">cycle_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">generator_xy</span><span class="p">(</span><span class="n">gen_x</span><span class="p">),</span> <span class="n">data_y</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-94'>
@@ -1391,9 +1392,9 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">619</span>        <span class="n">loss_generator</span> <span class="o">=</span> <span class="p">(</span><span class="n">loss_gan</span> <span class="o">+</span>
-<span class="lineno">620</span>                          <span class="bp">self</span><span class="o">.</span><span class="n">cyclic_loss_coefficient</span> <span class="o">*</span> <span class="n">loss_cycle</span> <span class="o">+</span>
-<span class="lineno">621</span>                          <span class="bp">self</span><span class="o">.</span><span class="n">identity_loss_coefficient</span> <span class="o">*</span> <span class="n">loss_identity</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">620</span>        <span class="n">loss_generator</span> <span class="o">=</span> <span class="p">(</span><span class="n">loss_gan</span> <span class="o">+</span>
+<span class="lineno">621</span>                          <span class="bp">self</span><span class="o">.</span><span class="n">cyclic_loss_coefficient</span> <span class="o">*</span> <span class="n">loss_cycle</span> <span class="o">+</span>
+<span class="lineno">622</span>                          <span class="bp">self</span><span class="o">.</span><span class="n">identity_loss_coefficient</span> <span class="o">*</span> <span class="n">loss_identity</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-95'>
@@ -1405,9 +1406,9 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">624</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
-<span class="lineno">625</span>        <span class="n">loss_generator</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
-<span class="lineno">626</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">625</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
+<span class="lineno">626</span>        <span class="n">loss_generator</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
+<span class="lineno">627</span>        <span class="bp">self</span><span class="o">.</span><span class="n">generator_optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-96'>
@@ -1419,10 +1420,10 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">629</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">add</span><span class="p">({</span><span class="s1">&#39;loss.generator&#39;</span><span class="p">:</span> <span class="n">loss_generator</span><span class="p">,</span>
-<span class="lineno">630</span>                     <span class="s1">&#39;loss.generator.cycle&#39;</span><span class="p">:</span> <span class="n">loss_cycle</span><span class="p">,</span>
-<span class="lineno">631</span>                     <span class="s1">&#39;loss.generator.gan&#39;</span><span class="p">:</span> <span class="n">loss_gan</span><span class="p">,</span>
-<span class="lineno">632</span>                     <span class="s1">&#39;loss.generator.identity&#39;</span><span class="p">:</span> <span class="n">loss_identity</span><span class="p">})</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">630</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">add</span><span class="p">({</span><span class="s1">&#39;loss.generator&#39;</span><span class="p">:</span> <span class="n">loss_generator</span><span class="p">,</span>
+<span class="lineno">631</span>                     <span class="s1">&#39;loss.generator.cycle&#39;</span><span class="p">:</span> <span class="n">loss_cycle</span><span class="p">,</span>
+<span class="lineno">632</span>                     <span class="s1">&#39;loss.generator.gan&#39;</span><span class="p">:</span> <span class="n">loss_gan</span><span class="p">,</span>
+<span class="lineno">633</span>                     <span class="s1">&#39;loss.generator.identity&#39;</span><span class="p">:</span> <span class="n">loss_identity</span><span class="p">})</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-97'>
@@ -1434,7 +1435,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">635</span>        <span class="k">return</span> <span class="n">gen_x</span><span class="p">,</span> <span class="n">gen_y</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">636</span>        <span class="k">return</span> <span class="n">gen_x</span><span class="p">,</span> <span class="n">gen_y</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-98'>
@@ -1446,9 +1447,9 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">637</span>    <span class="k">def</span> <span class="nf">optimize_discriminator</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">data_x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">data_y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
-<span class="lineno">638</span>                               <span class="n">gen_x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">gen_y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
-<span class="lineno">639</span>                               <span class="n">true_labels</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">false_labels</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">638</span>    <span class="k">def</span> <span class="nf">optimize_discriminator</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">data_x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">data_y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+<span class="lineno">639</span>                               <span class="n">gen_x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">gen_y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+<span class="lineno">640</span>                               <span class="n">true_labels</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">false_labels</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-99'>
@@ -1461,10 +1462,10 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">652</span>        <span class="n">loss_discriminator</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="p">(</span><span class="n">data_x</span><span class="p">),</span> <span class="n">true_labels</span><span class="p">)</span> <span class="o">+</span>
-<span class="lineno">653</span>                              <span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="p">(</span><span class="n">gen_x</span><span class="p">),</span> <span class="n">false_labels</span><span class="p">)</span> <span class="o">+</span>
-<span class="lineno">654</span>                              <span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_y</span><span class="p">(</span><span class="n">data_y</span><span class="p">),</span> <span class="n">true_labels</span><span class="p">)</span> <span class="o">+</span>
-<span class="lineno">655</span>                              <span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_y</span><span class="p">(</span><span class="n">gen_y</span><span class="p">),</span> <span class="n">false_labels</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">653</span>        <span class="n">loss_discriminator</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="p">(</span><span class="n">data_x</span><span class="p">),</span> <span class="n">true_labels</span><span class="p">)</span> <span class="o">+</span>
+<span class="lineno">654</span>                              <span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_x</span><span class="p">(</span><span class="n">gen_x</span><span class="p">),</span> <span class="n">false_labels</span><span class="p">)</span> <span class="o">+</span>
+<span class="lineno">655</span>                              <span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_y</span><span class="p">(</span><span class="n">data_y</span><span class="p">),</span> <span class="n">true_labels</span><span class="p">)</span> <span class="o">+</span>
+<span class="lineno">656</span>                              <span class="bp">self</span><span class="o">.</span><span class="n">gan_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">discriminator_y</span><span class="p">(</span><span class="n">gen_y</span><span class="p">),</span> <span class="n">false_labels</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-100'>
@@ -1476,9 +1477,9 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">658</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
-<span class="lineno">659</span>        <span class="n">loss_discriminator</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
-<span class="lineno">660</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">659</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
+<span class="lineno">660</span>        <span class="n">loss_discriminator</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
+<span class="lineno">661</span>        <span class="bp">self</span><span class="o">.</span><span class="n">discriminator_optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-101'>
@@ -1490,7 +1491,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">663</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">add</span><span class="p">({</span><span class="s1">&#39;loss.discriminator&#39;</span><span class="p">:</span> <span class="n">loss_discriminator</span><span class="p">})</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">664</span>        <span class="n">tracker</span><span class="o">.</span><span class="n">add</span><span class="p">({</span><span class="s1">&#39;loss.discriminator&#39;</span><span class="p">:</span> <span class="n">loss_discriminator</span><span class="p">})</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-102'>
@@ -1502,7 +1503,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">666</span><span class="k">def</span> <span class="nf">train</span><span class="p">():</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">667</span><span class="k">def</span> <span class="nf">train</span><span class="p">():</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-103'>
@@ -1514,7 +1515,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">671</span>    <span class="n">conf</span> <span class="o">=</span> <span class="n">Configs</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">672</span>    <span class="n">conf</span> <span class="o">=</span> <span class="n">Configs</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-104'>
@@ -1526,7 +1527,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">673</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">create</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s1">&#39;cycle_gan&#39;</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">674</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">create</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s1">&#39;cycle_gan&#39;</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-105'>
@@ -1539,8 +1540,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">676</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">configs</span><span class="p">(</span><span class="n">conf</span><span class="p">,</span> <span class="p">{</span><span class="s1">&#39;dataset_name&#39;</span><span class="p">:</span> <span class="s1">&#39;summer2winter_yosemite&#39;</span><span class="p">})</span>
-<span class="lineno">677</span>    <span class="n">conf</span><span class="o">.</span><span class="n">initialize</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">677</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">configs</span><span class="p">(</span><span class="n">conf</span><span class="p">,</span> <span class="p">{</span><span class="s1">&#39;dataset_name&#39;</span><span class="p">:</span> <span class="s1">&#39;summer2winter_yosemite&#39;</span><span class="p">})</span>
+<span class="lineno">678</span>    <span class="n">conf</span><span class="o">.</span><span class="n">initialize</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-106'>
@@ -1555,7 +1556,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">682</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">add_pytorch_models</span><span class="p">(</span><span class="n">get_modules</span><span class="p">(</span><span class="n">conf</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">683</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">add_pytorch_models</span><span class="p">(</span><span class="n">get_modules</span><span class="p">(</span><span class="n">conf</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-107'>
@@ -1567,7 +1568,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">684</span>    <span class="k">with</span> <span class="n">experiment</span><span class="o">.</span><span class="n">start</span><span class="p">():</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">685</span>    <span class="k">with</span> <span class="n">experiment</span><span class="o">.</span><span class="n">start</span><span class="p">():</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-108'>
@@ -1579,7 +1580,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">686</span>        <span class="n">conf</span><span class="o">.</span><span class="n">run</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">687</span>        <span class="n">conf</span><span class="o">.</span><span class="n">run</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-109'>
@@ -1591,7 +1592,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">689</span><span class="k">def</span> <span class="nf">plot_image</span><span class="p">(</span><span class="n">img</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">690</span><span class="k">def</span> <span class="nf">plot_image</span><span class="p">(</span><span class="n">img</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">):</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-110'>
@@ -1602,7 +1603,7 @@
             
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">693</span>    <span class="kn">from</span> <span class="nn">matplotlib</span> <span class="kn">import</span> <span class="n">pyplot</span> <span class="k">as</span> <span class="n">plt</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">694</span>    <span class="kn">from</span> <span class="nn">matplotlib</span> <span class="kn">import</span> <span class="n">pyplot</span> <span class="k">as</span> <span class="n">plt</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-111'>
@@ -1614,7 +1615,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">696</span>    <span class="n">img</span> <span class="o">=</span> <span class="n">img</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">697</span>    <span class="n">img</span> <span class="o">=</span> <span class="n">img</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-112'>
@@ -1626,7 +1627,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">698</span>    <span class="n">img_min</span><span class="p">,</span> <span class="n">img_max</span> <span class="o">=</span> <span class="n">img</span><span class="o">.</span><span class="n">min</span><span class="p">(),</span> <span class="n">img</span><span class="o">.</span><span class="n">max</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">699</span>    <span class="n">img_min</span><span class="p">,</span> <span class="n">img_max</span> <span class="o">=</span> <span class="n">img</span><span class="o">.</span><span class="n">min</span><span class="p">(),</span> <span class="n">img</span><span class="o">.</span><span class="n">max</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-113'>
@@ -1638,7 +1639,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">700</span>    <span class="n">img</span> <span class="o">=</span> <span class="p">(</span><span class="n">img</span> <span class="o">-</span> <span class="n">img_min</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span><span class="n">img_max</span> <span class="o">-</span> <span class="n">img_min</span> <span class="o">+</span> <span class="mf">1e-5</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">701</span>    <span class="n">img</span> <span class="o">=</span> <span class="p">(</span><span class="n">img</span> <span class="o">-</span> <span class="n">img_min</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span><span class="n">img_max</span> <span class="o">-</span> <span class="n">img_min</span> <span class="o">+</span> <span class="mf">1e-5</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-114'>
@@ -1650,7 +1651,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">702</span>    <span class="n">img</span> <span class="o">=</span> <span class="n">img</span><span class="o">.</span><span class="n">permute</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">703</span>    <span class="n">img</span> <span class="o">=</span> <span class="n">img</span><span class="o">.</span><span class="n">permute</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-115'>
@@ -1662,7 +1663,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">704</span>    <span class="n">plt</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">img</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">705</span>    <span class="n">plt</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">img</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-116'>
@@ -1674,7 +1675,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">706</span>    <span class="n">plt</span><span class="o">.</span><span class="n">axis</span><span class="p">(</span><span class="s1">&#39;off&#39;</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">707</span>    <span class="n">plt</span><span class="o">.</span><span class="n">axis</span><span class="p">(</span><span class="s1">&#39;off&#39;</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-117'>
@@ -1686,7 +1687,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">708</span>    <span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">709</span>    <span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-118'>
@@ -1698,7 +1699,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">711</span><span class="k">def</span> <span class="nf">evaluate</span><span class="p">():</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">712</span><span class="k">def</span> <span class="nf">evaluate</span><span class="p">():</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-119'>
@@ -1710,7 +1711,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">716</span>    <span class="n">trained_run_uuid</span> <span class="o">=</span> <span class="s1">&#39;f73c1164184711eb9190b74249275441&#39;</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">717</span>    <span class="n">trained_run_uuid</span> <span class="o">=</span> <span class="s1">&#39;f73c1164184711eb9190b74249275441&#39;</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-120'>
@@ -1722,7 +1723,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">718</span>    <span class="n">conf</span> <span class="o">=</span> <span class="n">Configs</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">719</span>    <span class="n">conf</span> <span class="o">=</span> <span class="n">Configs</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-121'>
@@ -1734,7 +1735,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">720</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">create</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s1">&#39;cycle_gan_inference&#39;</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">721</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">create</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s1">&#39;cycle_gan_inference&#39;</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-122'>
@@ -1746,7 +1747,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">722</span>    <span class="n">conf_dict</span> <span class="o">=</span> <span class="n">experiment</span><span class="o">.</span><span class="n">load_configs</span><span class="p">(</span><span class="n">trained_run_uuid</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">723</span>    <span class="n">conf_dict</span> <span class="o">=</span> <span class="n">experiment</span><span class="o">.</span><span class="n">load_configs</span><span class="p">(</span><span class="n">trained_run_uuid</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-123'>
@@ -1766,8 +1767,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">731</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">configs</span><span class="p">(</span><span class="n">conf</span><span class="p">,</span> <span class="n">conf_dict</span><span class="p">)</span>
-<span class="lineno">732</span>    <span class="n">conf</span><span class="o">.</span><span class="n">initialize</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">732</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">configs</span><span class="p">(</span><span class="n">conf</span><span class="p">,</span> <span class="n">conf_dict</span><span class="p">)</span>
+<span class="lineno">733</span>    <span class="n">conf</span><span class="o">.</span><span class="n">initialize</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-124'>
@@ -1782,7 +1783,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">737</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">add_pytorch_models</span><span class="p">(</span><span class="n">get_modules</span><span class="p">(</span><span class="n">conf</span><span class="p">))</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">738</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">add_pytorch_models</span><span class="p">(</span><span class="n">get_modules</span><span class="p">(</span><span class="n">conf</span><span class="p">))</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-125'>
@@ -1795,7 +1796,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">740</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">trained_run_uuid</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">741</span>    <span class="n">experiment</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">trained_run_uuid</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-126'>
@@ -1807,7 +1808,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">743</span>    <span class="k">with</span> <span class="n">experiment</span><span class="o">.</span><span class="n">start</span><span class="p">():</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">744</span>    <span class="k">with</span> <span class="n">experiment</span><span class="o">.</span><span class="n">start</span><span class="p">():</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-127'>
@@ -1819,10 +1820,10 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">745</span>        <span class="n">transforms_</span> <span class="o">=</span> <span class="p">[</span>
-<span class="lineno">746</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">ToTensor</span><span class="p">(),</span>
-<span class="lineno">747</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">Normalize</span><span class="p">((</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">),</span> <span class="p">(</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">)),</span>
-<span class="lineno">748</span>        <span class="p">]</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">746</span>        <span class="n">transforms_</span> <span class="o">=</span> <span class="p">[</span>
+<span class="lineno">747</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">ToTensor</span><span class="p">(),</span>
+<span class="lineno">748</span>            <span class="n">transforms</span><span class="o">.</span><span class="n">Normalize</span><span class="p">((</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">),</span> <span class="p">(</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">)),</span>
+<span class="lineno">749</span>        <span class="p">]</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-128'>
@@ -1837,7 +1838,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">754</span>        <span class="n">dataset</span> <span class="o">=</span> <span class="n">ImageDataset</span><span class="p">(</span><span class="n">conf</span><span class="o">.</span><span class="n">dataset_name</span><span class="p">,</span> <span class="n">transforms_</span><span class="p">,</span> <span class="s1">&#39;train&#39;</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">755</span>        <span class="n">dataset</span> <span class="o">=</span> <span class="n">ImageDataset</span><span class="p">(</span><span class="n">conf</span><span class="o">.</span><span class="n">dataset_name</span><span class="p">,</span> <span class="n">transforms_</span><span class="p">,</span> <span class="s1">&#39;train&#39;</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-129'>
@@ -1849,7 +1850,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">756</span>        <span class="n">x_image</span> <span class="o">=</span> <span class="n">dataset</span><span class="p">[</span><span class="mi">10</span><span class="p">][</span><span class="s1">&#39;x&#39;</span><span class="p">]</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">757</span>        <span class="n">x_image</span> <span class="o">=</span> <span class="n">dataset</span><span class="p">[</span><span class="mi">10</span><span class="p">][</span><span class="s1">&#39;x&#39;</span><span class="p">]</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-130'>
@@ -1861,7 +1862,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">758</span>        <span class="n">plot_image</span><span class="p">(</span><span class="n">x_image</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">759</span>        <span class="n">plot_image</span><span class="p">(</span><span class="n">x_image</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-131'>
@@ -1873,8 +1874,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">761</span>        <span class="n">conf</span><span class="o">.</span><span class="n">generator_xy</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
-<span class="lineno">762</span>        <span class="n">conf</span><span class="o">.</span><span class="n">generator_yx</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">762</span>        <span class="n">conf</span><span class="o">.</span><span class="n">generator_xy</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
+<span class="lineno">763</span>        <span class="n">conf</span><span class="o">.</span><span class="n">generator_yx</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-132'>
@@ -1886,7 +1887,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">765</span>        <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">no_grad</span><span class="p">():</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">766</span>        <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">no_grad</span><span class="p">():</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-133'>
@@ -1898,8 +1899,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">767</span>            <span class="n">data</span> <span class="o">=</span> <span class="n">x_image</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">conf</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-<span class="lineno">768</span>            <span class="n">generated_y</span> <span class="o">=</span> <span class="n">conf</span><span class="o">.</span><span class="n">generator_xy</span><span class="p">(</span><span class="n">data</span><span class="p">)</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">768</span>            <span class="n">data</span> <span class="o">=</span> <span class="n">x_image</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">conf</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+<span class="lineno">769</span>            <span class="n">generated_y</span> <span class="o">=</span> <span class="n">conf</span><span class="o">.</span><span class="n">generator_xy</span><span class="p">(</span><span class="n">data</span><span class="p">)</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-134'>
@@ -1911,11 +1912,11 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">771</span>        <span class="n">plot_image</span><span class="p">(</span><span class="n">generated_y</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">cpu</span><span class="p">())</span>
-<span class="lineno">772</span>
+            <div class="highlight"><pre><span class="lineno">772</span>        <span class="n">plot_image</span><span class="p">(</span><span class="n">generated_y</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">cpu</span><span class="p">())</span>
 <span class="lineno">773</span>
-<span class="lineno">774</span><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
-<span class="lineno">775</span>    <span class="n">train</span><span class="p">()</span></pre></div>
+<span class="lineno">774</span>
+<span class="lineno">775</span><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
+<span class="lineno">776</span>    <span class="n">train</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='section' id='section-135'>
@@ -1940,7 +1941,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/cycle_gan/readme.html b/docs/gan/cycle_gan/readme.html
index 3df80dce..091fae09 100644
--- a/docs/gan/cycle_gan/readme.html
+++ b/docs/gan/cycle_gan/readme.html
@@ -87,7 +87,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/dcgan/index.html b/docs/gan/dcgan/index.html
index 303dc7b4..9f879491 100644
--- a/docs/gan/dcgan/index.html
+++ b/docs/gan/dcgan/index.html
@@ -373,7 +373,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/dcgan/readme.html b/docs/gan/dcgan/readme.html
index 8225e5c6..e70f429a 100644
--- a/docs/gan/dcgan/readme.html
+++ b/docs/gan/dcgan/readme.html
@@ -87,7 +87,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/index.html b/docs/gan/index.html
index 1a03ee48..5b725ba2 100644
--- a/docs/gan/index.html
+++ b/docs/gan/index.html
@@ -91,7 +91,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/original/experiment.html b/docs/gan/original/experiment.html
index 41b834c8..adbe534a 100644
--- a/docs/gan/original/experiment.html
+++ b/docs/gan/original/experiment.html
@@ -606,7 +606,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/original/index.html b/docs/gan/original/index.html
index 0483aa66..74565952 100644
--- a/docs/gan/original/index.html
+++ b/docs/gan/original/index.html
@@ -277,7 +277,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/original/readme.html b/docs/gan/original/readme.html
index 324166c4..b56c1834 100644
--- a/docs/gan/original/readme.html
+++ b/docs/gan/original/readme.html
@@ -87,7 +87,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/stylegan/experiment.html b/docs/gan/stylegan/experiment.html
index 60a57860..ba74ec74 100644
--- a/docs/gan/stylegan/experiment.html
+++ b/docs/gan/stylegan/experiment.html
@@ -647,7 +647,7 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">184</span>        <span class="n">dataloader</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">DataLoader</span><span class="p">(</span><span class="n">dataset</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">num_workers</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span>
+            <div class="highlight"><pre><span class="lineno">184</span>        <span class="n">dataloader</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">DataLoader</span><span class="p">(</span><span class="n">dataset</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">num_workers</span><span class="o">=</span><span class="mi">8</span><span class="p">,</span>
 <span class="lineno">185</span>                                                 <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">drop_last</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">pin_memory</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span></pre></div>
         </div>
     </div>
@@ -1709,8 +1709,8 @@
 
         </div>
         <div class='code'>
-            <div class="highlight"><pre><span class="lineno">466</span><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
-<span class="lineno">467</span>    <span class="n">main</span><span class="p">()</span></pre></div>
+            <div class="highlight"><pre><span class="lineno">467</span><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
+<span class="lineno">468</span>    <span class="n">main</span><span class="p">()</span></pre></div>
         </div>
     </div>
     <div class='footer'>
@@ -1723,7 +1723,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/stylegan/index.html b/docs/gan/stylegan/index.html
index 1f6952d8..14ea9077 100644
--- a/docs/gan/stylegan/index.html
+++ b/docs/gan/stylegan/index.html
@@ -2752,7 +2752,6 @@ s76,-153,76,-153s77,-151,77,-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,1
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/stylegan/readme.html b/docs/gan/stylegan/readme.html
index de35a85b..e7aca5ce 100644
--- a/docs/gan/stylegan/readme.html
+++ b/docs/gan/stylegan/readme.html
@@ -87,7 +87,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/wasserstein/experiment.html b/docs/gan/wasserstein/experiment.html
index 4b559fe5..ebd114f7 100644
--- a/docs/gan/wasserstein/experiment.html
+++ b/docs/gan/wasserstein/experiment.html
@@ -196,7 +196,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/wasserstein/gradient_penalty/experiment.html b/docs/gan/wasserstein/gradient_penalty/experiment.html
index 0ba53840..10217f83 100644
--- a/docs/gan/wasserstein/gradient_penalty/experiment.html
+++ b/docs/gan/wasserstein/gradient_penalty/experiment.html
@@ -338,7 +338,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/wasserstein/gradient_penalty/index.html b/docs/gan/wasserstein/gradient_penalty/index.html
index 34ddbb3b..f3f1a576 100644
--- a/docs/gan/wasserstein/gradient_penalty/index.html
+++ b/docs/gan/wasserstein/gradient_penalty/index.html
@@ -194,7 +194,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/wasserstein/gradient_penalty/readme.html b/docs/gan/wasserstein/gradient_penalty/readme.html
index 7851bb6f..f37bea83 100644
--- a/docs/gan/wasserstein/gradient_penalty/readme.html
+++ b/docs/gan/wasserstein/gradient_penalty/readme.html
@@ -91,7 +91,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/wasserstein/index.html b/docs/gan/wasserstein/index.html
index 5d6bd59b..5d85de48 100644
--- a/docs/gan/wasserstein/index.html
+++ b/docs/gan/wasserstein/index.html
@@ -186,7 +186,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/gan/wasserstein/readme.html b/docs/gan/wasserstein/readme.html
index 621a0df3..67154e2d 100644
--- a/docs/gan/wasserstein/readme.html
+++ b/docs/gan/wasserstein/readme.html
@@ -87,7 +87,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/graphs/gat/experiment.html b/docs/graphs/gat/experiment.html
index 1c17e9f4..55ff46e5 100644
--- a/docs/graphs/gat/experiment.html
+++ b/docs/graphs/gat/experiment.html
@@ -1226,7 +1226,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/graphs/gat/index.html b/docs/graphs/gat/index.html
index 1a01b414..7399bcf6 100644
--- a/docs/graphs/gat/index.html
+++ b/docs/graphs/gat/index.html
@@ -836,7 +836,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/graphs/gat/readme.html b/docs/graphs/gat/readme.html
index 38f2bc22..f376f81c 100644
--- a/docs/graphs/gat/readme.html
+++ b/docs/graphs/gat/readme.html
@@ -91,7 +91,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/graphs/gatv2/experiment.html b/docs/graphs/gatv2/experiment.html
index 206f473b..989c728c 100644
--- a/docs/graphs/gatv2/experiment.html
+++ b/docs/graphs/gatv2/experiment.html
@@ -432,7 +432,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/graphs/gatv2/index.html b/docs/graphs/gatv2/index.html
index 57c3f444..c24edf4e 100644
--- a/docs/graphs/gatv2/index.html
+++ b/docs/graphs/gatv2/index.html
@@ -931,7 +931,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/graphs/gatv2/readme.html b/docs/graphs/gatv2/readme.html
index b05176ad..c37c0d55 100644
--- a/docs/graphs/gatv2/readme.html
+++ b/docs/graphs/gatv2/readme.html
@@ -91,7 +91,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/graphs/index.html b/docs/graphs/index.html
index 999c5284..445464ad 100644
--- a/docs/graphs/index.html
+++ b/docs/graphs/index.html
@@ -87,7 +87,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/hypernetworks/experiment.html b/docs/hypernetworks/experiment.html
index 4f5d463f..3c6844a5 100644
--- a/docs/hypernetworks/experiment.html
+++ b/docs/hypernetworks/experiment.html
@@ -347,7 +347,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/hypernetworks/hyper_lstm.html b/docs/hypernetworks/hyper_lstm.html
index defc6c3f..c6835cf4 100644
--- a/docs/hypernetworks/hyper_lstm.html
+++ b/docs/hypernetworks/hyper_lstm.html
@@ -676,7 +676,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/hypernetworks/index.html b/docs/hypernetworks/index.html
index ef2cad43..7ff3d41d 100644
--- a/docs/hypernetworks/index.html
+++ b/docs/hypernetworks/index.html
@@ -85,7 +85,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/index.html b/docs/index.html
index e438b148..1c500ed6 100644
--- a/docs/index.html
+++ b/docs/index.html
@@ -161,7 +161,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/lstm/index.html b/docs/lstm/index.html
index c63bb57c..acc42cc5 100644
--- a/docs/lstm/index.html
+++ b/docs/lstm/index.html
@@ -460,7 +460,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/batch_channel_norm/index.html b/docs/normalization/batch_channel_norm/index.html
index 39d35679..e309cab9 100644
--- a/docs/normalization/batch_channel_norm/index.html
+++ b/docs/normalization/batch_channel_norm/index.html
@@ -678,7 +678,6 @@ M1001 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/batch_norm/cifar10.html b/docs/normalization/batch_norm/cifar10.html
index 6fecb06e..5a845942 100644
--- a/docs/normalization/batch_norm/cifar10.html
+++ b/docs/normalization/batch_norm/cifar10.html
@@ -233,7 +233,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/batch_norm/index.html b/docs/normalization/batch_norm/index.html
index e06f589d..8451c8f8 100644
--- a/docs/normalization/batch_norm/index.html
+++ b/docs/normalization/batch_norm/index.html
@@ -476,7 +476,6 @@ M1001 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/batch_norm/mnist.html b/docs/normalization/batch_norm/mnist.html
index 2fe324b8..997a58cd 100644
--- a/docs/normalization/batch_norm/mnist.html
+++ b/docs/normalization/batch_norm/mnist.html
@@ -325,7 +325,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/batch_norm/readme.html b/docs/normalization/batch_norm/readme.html
index c060f740..076004d4 100644
--- a/docs/normalization/batch_norm/readme.html
+++ b/docs/normalization/batch_norm/readme.html
@@ -117,7 +117,6 @@ M1001 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/group_norm/experiment.html b/docs/normalization/group_norm/experiment.html
index 5fb2788c..684fba47 100644
--- a/docs/normalization/group_norm/experiment.html
+++ b/docs/normalization/group_norm/experiment.html
@@ -363,7 +363,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/group_norm/index.html b/docs/normalization/group_norm/index.html
index 9a86e4b9..c16d0e6e 100644
--- a/docs/normalization/group_norm/index.html
+++ b/docs/normalization/group_norm/index.html
@@ -386,7 +386,6 @@ M1001 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/group_norm/readme.html b/docs/normalization/group_norm/readme.html
index fa462a29..d021cc27 100644
--- a/docs/normalization/group_norm/readme.html
+++ b/docs/normalization/group_norm/readme.html
@@ -91,7 +91,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/index.html b/docs/normalization/index.html
index 6034b0cc..a0d3c495 100644
--- a/docs/normalization/index.html
+++ b/docs/normalization/index.html
@@ -91,7 +91,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/instance_norm/experiment.html b/docs/normalization/instance_norm/experiment.html
index 809c9aa9..75f09cb5 100644
--- a/docs/normalization/instance_norm/experiment.html
+++ b/docs/normalization/instance_norm/experiment.html
@@ -233,7 +233,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/instance_norm/index.html b/docs/normalization/instance_norm/index.html
index f5a484b9..f0944708 100644
--- a/docs/normalization/instance_norm/index.html
+++ b/docs/normalization/instance_norm/index.html
@@ -369,7 +369,6 @@ M1001 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/instance_norm/readme.html b/docs/normalization/instance_norm/readme.html
index 1c7d4dda..f127dc99 100644
--- a/docs/normalization/instance_norm/readme.html
+++ b/docs/normalization/instance_norm/readme.html
@@ -88,7 +88,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/layer_norm/index.html b/docs/normalization/layer_norm/index.html
index b27f864b..4806c60e 100644
--- a/docs/normalization/layer_norm/index.html
+++ b/docs/normalization/layer_norm/index.html
@@ -371,7 +371,6 @@ M1001 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/layer_norm/readme.html b/docs/normalization/layer_norm/readme.html
index d0485867..a283e43d 100644
--- a/docs/normalization/layer_norm/readme.html
+++ b/docs/normalization/layer_norm/readme.html
@@ -96,7 +96,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/weight_standardization/conv2d.html b/docs/normalization/weight_standardization/conv2d.html
index 3cd8968f..36030264 100644
--- a/docs/normalization/weight_standardization/conv2d.html
+++ b/docs/normalization/weight_standardization/conv2d.html
@@ -174,7 +174,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/weight_standardization/experiment.html b/docs/normalization/weight_standardization/experiment.html
index 8ef4a840..a1366d91 100644
--- a/docs/normalization/weight_standardization/experiment.html
+++ b/docs/normalization/weight_standardization/experiment.html
@@ -234,7 +234,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/weight_standardization/index.html b/docs/normalization/weight_standardization/index.html
index 2078a2d9..ac79d272 100644
--- a/docs/normalization/weight_standardization/index.html
+++ b/docs/normalization/weight_standardization/index.html
@@ -175,7 +175,6 @@ c-4-3.333-8.333-7.667-13 -13l-13-13l77-155 77-156c66 199.333 139 419.667
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/normalization/weight_standardization/readme.html b/docs/normalization/weight_standardization/readme.html
index 4cd7a61b..7668db9f 100644
--- a/docs/normalization/weight_standardization/readme.html
+++ b/docs/normalization/weight_standardization/readme.html
@@ -87,7 +87,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/ada_belief.html b/docs/optimizers/ada_belief.html
index 7bd5f00f..6ae3e683 100644
--- a/docs/optimizers/ada_belief.html
+++ b/docs/optimizers/ada_belief.html
@@ -466,7 +466,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/adam.html b/docs/optimizers/adam.html
index 061cbcfc..77be8fc9 100644
--- a/docs/optimizers/adam.html
+++ b/docs/optimizers/adam.html
@@ -707,7 +707,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/adam_warmup.html b/docs/optimizers/adam_warmup.html
index 0a1aa1cb..1b8d6f5f 100644
--- a/docs/optimizers/adam_warmup.html
+++ b/docs/optimizers/adam_warmup.html
@@ -202,7 +202,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/adam_warmup_cosine_decay.html b/docs/optimizers/adam_warmup_cosine_decay.html
index ae81b9d0..44d92b6a 100644
--- a/docs/optimizers/adam_warmup_cosine_decay.html
+++ b/docs/optimizers/adam_warmup_cosine_decay.html
@@ -253,7 +253,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/amsgrad.html b/docs/optimizers/amsgrad.html
index 1e564856..beb4c6ac 100644
--- a/docs/optimizers/amsgrad.html
+++ b/docs/optimizers/amsgrad.html
@@ -515,7 +515,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/configs.html b/docs/optimizers/configs.html
index 719ec9e9..9629e9ae 100644
--- a/docs/optimizers/configs.html
+++ b/docs/optimizers/configs.html
@@ -402,7 +402,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/index.html b/docs/optimizers/index.html
index 88ed95e1..5449f34a 100644
--- a/docs/optimizers/index.html
+++ b/docs/optimizers/index.html
@@ -542,7 +542,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/mnist_experiment.html b/docs/optimizers/mnist_experiment.html
index 9122e531..f6a328d5 100644
--- a/docs/optimizers/mnist_experiment.html
+++ b/docs/optimizers/mnist_experiment.html
@@ -419,7 +419,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/noam.html b/docs/optimizers/noam.html
index 8b40a090..c0beb82e 100644
--- a/docs/optimizers/noam.html
+++ b/docs/optimizers/noam.html
@@ -287,7 +287,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/performance_test.html b/docs/optimizers/performance_test.html
index 4a5e96b8..e719af12 100644
--- a/docs/optimizers/performance_test.html
+++ b/docs/optimizers/performance_test.html
@@ -134,7 +134,6 @@ MyAdam...[DONE]	1,192.89ms</code></pre>
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/radam.html b/docs/optimizers/radam.html
index c7e31857..d5b497b7 100644
--- a/docs/optimizers/radam.html
+++ b/docs/optimizers/radam.html
@@ -741,7 +741,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/optimizers/readme.html b/docs/optimizers/readme.html
index faea855e..56b203e0 100644
--- a/docs/optimizers/readme.html
+++ b/docs/optimizers/readme.html
@@ -92,7 +92,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/recurrent_highway_networks/index.html b/docs/recurrent_highway_networks/index.html
index f52ac6ae..331a4ae9 100644
--- a/docs/recurrent_highway_networks/index.html
+++ b/docs/recurrent_highway_networks/index.html
@@ -456,7 +456,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/resnet/experiment.html b/docs/resnet/experiment.html
index 62f451e0..619d4c0a 100644
--- a/docs/resnet/experiment.html
+++ b/docs/resnet/experiment.html
@@ -313,7 +313,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/resnet/index.html b/docs/resnet/index.html
index edacab8f..2bb0a7bd 100644
--- a/docs/resnet/index.html
+++ b/docs/resnet/index.html
@@ -1007,7 +1007,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/resnet/readme.html b/docs/resnet/readme.html
index 4e823f57..2a07c4e1 100644
--- a/docs/resnet/readme.html
+++ b/docs/resnet/readme.html
@@ -87,7 +87,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/dqn/experiment.html b/docs/rl/dqn/experiment.html
index 0a6be195..e67fc91f 100644
--- a/docs/rl/dqn/experiment.html
+++ b/docs/rl/dqn/experiment.html
@@ -1135,7 +1135,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/dqn/index.html b/docs/rl/dqn/index.html
index cf1015d3..9e683eb4 100644
--- a/docs/rl/dqn/index.html
+++ b/docs/rl/dqn/index.html
@@ -260,7 +260,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/dqn/model.html b/docs/rl/dqn/model.html
index 9cbef2ad..6826abb6 100644
--- a/docs/rl/dqn/model.html
+++ b/docs/rl/dqn/model.html
@@ -299,7 +299,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/dqn/readme.html b/docs/rl/dqn/readme.html
index b1e24dee..918c8e89 100644
--- a/docs/rl/dqn/readme.html
+++ b/docs/rl/dqn/readme.html
@@ -89,7 +89,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/dqn/replay_buffer.html b/docs/rl/dqn/replay_buffer.html
index 3173699a..3075565a 100644
--- a/docs/rl/dqn/replay_buffer.html
+++ b/docs/rl/dqn/replay_buffer.html
@@ -768,7 +768,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/game.html b/docs/rl/game.html
index 3678ccae..0a698207 100644
--- a/docs/rl/game.html
+++ b/docs/rl/game.html
@@ -468,7 +468,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/index.html b/docs/rl/index.html
index cc234d04..c108d480 100644
--- a/docs/rl/index.html
+++ b/docs/rl/index.html
@@ -94,7 +94,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/ppo/experiment.html b/docs/rl/ppo/experiment.html
index bc49ef19..3327bbc1 100644
--- a/docs/rl/ppo/experiment.html
+++ b/docs/rl/ppo/experiment.html
@@ -1325,7 +1325,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/ppo/gae.html b/docs/rl/ppo/gae.html
index 718139b0..516fec76 100644
--- a/docs/rl/ppo/gae.html
+++ b/docs/rl/ppo/gae.html
@@ -209,7 +209,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/ppo/index.html b/docs/rl/ppo/index.html
index 11dc497f..16c6aa33 100644
--- a/docs/rl/ppo/index.html
+++ b/docs/rl/ppo/index.html
@@ -197,7 +197,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/rl/ppo/readme.html b/docs/rl/ppo/readme.html
index 6204e107..7deeb0cc 100644
--- a/docs/rl/ppo/readme.html
+++ b/docs/rl/ppo/readme.html
@@ -90,7 +90,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/sitemap.xml b/docs/sitemap.xml
index d9a4c234..054e709f 100644
--- a/docs/sitemap.xml
+++ b/docs/sitemap.xml
@@ -64,14 +64,14 @@
 
     <url>
       <loc>https://nn.labml.ai/gan/stylegan/experiment.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-29T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
 
     <url>
       <loc>https://nn.labml.ai/gan/cycle_gan/index.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-29T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -113,7 +113,7 @@
 
     <url>
       <loc>https://nn.labml.ai/hypernetworks/hyper_lstm.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -169,7 +169,7 @@
 
     <url>
       <loc>https://nn.labml.ai/normalization/batch_channel_norm/index.html</loc>
-      <lastmod>2021-08-19T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -225,7 +225,7 @@
 
     <url>
       <loc>https://nn.labml.ai/experiments/nlp_classification.html</loc>
-      <lastmod>2021-10-22T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-29T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -316,7 +316,7 @@
 
     <url>
       <loc>https://nn.labml.ai/cfr/index.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -337,7 +337,7 @@
 
     <url>
       <loc>https://nn.labml.ai/diffusion/ddpm/unet.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -365,7 +365,7 @@
 
     <url>
       <loc>https://nn.labml.ai/diffusion/ddpm/evaluate.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -428,7 +428,7 @@
 
     <url>
       <loc>https://nn.labml.ai/optimizers/radam.html</loc>
-      <lastmod>2021-10-19T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -442,7 +442,7 @@
 
     <url>
       <loc>https://nn.labml.ai/optimizers/amsgrad.html</loc>
-      <lastmod>2021-08-17T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -463,7 +463,7 @@
 
     <url>
       <loc>https://nn.labml.ai/transformers/gmlp/index.html</loc>
-      <lastmod>2021-06-07T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-23T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -582,7 +582,7 @@
 
     <url>
       <loc>https://nn.labml.ai/transformers/fast_weights/index.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -715,7 +715,7 @@
 
     <url>
       <loc>https://nn.labml.ai/transformers/aft/index.html</loc>
-      <lastmod>2021-10-19T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -806,7 +806,7 @@
 
     <url>
       <loc>https://nn.labml.ai/recurrent_highway_networks/index.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -862,7 +862,7 @@
 
     <url>
       <loc>https://nn.labml.ai/adaptive_computation/ponder_net/index.html</loc>
-      <lastmod>2021-08-19T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -897,7 +897,7 @@
 
     <url>
       <loc>https://nn.labml.ai/uncertainty/evidence/index.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -932,7 +932,7 @@
 
     <url>
       <loc>https://nn.labml.ai/rl/dqn/index.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -960,14 +960,14 @@
 
     <url>
       <loc>https://nn.labml.ai/rl/ppo/index.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
 
     <url>
       <loc>https://nn.labml.ai/rl/ppo/gae.html</loc>
-      <lastmod>2021-10-19T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
@@ -981,7 +981,7 @@
 
     <url>
       <loc>https://nn.labml.ai/lstm/index.html</loc>
-      <lastmod>2021-10-21T16:30:00+00:00</lastmod>
+      <lastmod>2021-10-24T16:30:00+00:00</lastmod>
       <priority>1.00</priority>
     </url>
     
diff --git a/docs/sketch_rnn/index.html b/docs/sketch_rnn/index.html
index 788370da..7775da34 100644
--- a/docs/sketch_rnn/index.html
+++ b/docs/sketch_rnn/index.html
@@ -2194,7 +2194,6 @@ M1001 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/aft/experiment.html b/docs/transformers/aft/experiment.html
index 43e0c21f..dbb89c65 100644
--- a/docs/transformers/aft/experiment.html
+++ b/docs/transformers/aft/experiment.html
@@ -608,7 +608,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/aft/index.html b/docs/transformers/aft/index.html
index 7e03b0c9..1892aadf 100644
--- a/docs/transformers/aft/index.html
+++ b/docs/transformers/aft/index.html
@@ -516,7 +516,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/aft/readme.html b/docs/transformers/aft/readme.html
index 1bb1229f..87dc2772 100644
--- a/docs/transformers/aft/readme.html
+++ b/docs/transformers/aft/readme.html
@@ -90,7 +90,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/alibi/experiment.html b/docs/transformers/alibi/experiment.html
index c1013f60..362a43c1 100644
--- a/docs/transformers/alibi/experiment.html
+++ b/docs/transformers/alibi/experiment.html
@@ -585,7 +585,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/alibi/index.html b/docs/transformers/alibi/index.html
index d716af67..c53efabf 100644
--- a/docs/transformers/alibi/index.html
+++ b/docs/transformers/alibi/index.html
@@ -320,7 +320,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/basic/autoregressive_experiment.html b/docs/transformers/basic/autoregressive_experiment.html
index 9ad09e35..e444be92 100644
--- a/docs/transformers/basic/autoregressive_experiment.html
+++ b/docs/transformers/basic/autoregressive_experiment.html
@@ -580,7 +580,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/basic/index.html b/docs/transformers/basic/index.html
index 368c0e1d..4f3ca35d 100644
--- a/docs/transformers/basic/index.html
+++ b/docs/transformers/basic/index.html
@@ -74,7 +74,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/compressive/experiment.html b/docs/transformers/compressive/experiment.html
index b6d5a939..99db6567 100644
--- a/docs/transformers/compressive/experiment.html
+++ b/docs/transformers/compressive/experiment.html
@@ -1396,7 +1396,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/compressive/index.html b/docs/transformers/compressive/index.html
index 4ead7971..8d1d48d8 100644
--- a/docs/transformers/compressive/index.html
+++ b/docs/transformers/compressive/index.html
@@ -995,7 +995,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/compressive/readme.html b/docs/transformers/compressive/readme.html
index e84bd1f1..369faf38 100644
--- a/docs/transformers/compressive/readme.html
+++ b/docs/transformers/compressive/readme.html
@@ -95,7 +95,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/configs.html b/docs/transformers/configs.html
index 9befa8b1..f387e5df 100644
--- a/docs/transformers/configs.html
+++ b/docs/transformers/configs.html
@@ -972,7 +972,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/fast_weights/experiment.html b/docs/transformers/fast_weights/experiment.html
index 097aa8f2..9d8cbc3d 100644
--- a/docs/transformers/fast_weights/experiment.html
+++ b/docs/transformers/fast_weights/experiment.html
@@ -359,7 +359,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/fast_weights/index.html b/docs/transformers/fast_weights/index.html
index 345dc81d..eb7243a6 100644
--- a/docs/transformers/fast_weights/index.html
+++ b/docs/transformers/fast_weights/index.html
@@ -820,7 +820,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/fast_weights/readme.html b/docs/transformers/fast_weights/readme.html
index 0cc36e30..d53251f1 100644
--- a/docs/transformers/fast_weights/readme.html
+++ b/docs/transformers/fast_weights/readme.html
@@ -89,7 +89,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/fast_weights/token_wise.html b/docs/transformers/fast_weights/token_wise.html
index 5135828c..47111345 100644
--- a/docs/transformers/fast_weights/token_wise.html
+++ b/docs/transformers/fast_weights/token_wise.html
@@ -531,7 +531,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/feed_forward.html b/docs/transformers/feed_forward.html
index db070717..ce9aeb0d 100644
--- a/docs/transformers/feed_forward.html
+++ b/docs/transformers/feed_forward.html
@@ -298,7 +298,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/feedback/experiment.html b/docs/transformers/feedback/experiment.html
index 6892ca4e..c567b0fd 100644
--- a/docs/transformers/feedback/experiment.html
+++ b/docs/transformers/feedback/experiment.html
@@ -408,7 +408,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/feedback/index.html b/docs/transformers/feedback/index.html
index 04d3ce3f..7c57e62b 100644
--- a/docs/transformers/feedback/index.html
+++ b/docs/transformers/feedback/index.html
@@ -1809,7 +1809,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/feedback/readme.html b/docs/transformers/feedback/readme.html
index 2fe29a80..4df1c57d 100644
--- a/docs/transformers/feedback/readme.html
+++ b/docs/transformers/feedback/readme.html
@@ -94,7 +94,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/fnet/experiment.html b/docs/transformers/fnet/experiment.html
index f8fa0e8b..c2ab24c2 100644
--- a/docs/transformers/fnet/experiment.html
+++ b/docs/transformers/fnet/experiment.html
@@ -518,7 +518,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/fnet/index.html b/docs/transformers/fnet/index.html
index facb532e..702c3154 100644
--- a/docs/transformers/fnet/index.html
+++ b/docs/transformers/fnet/index.html
@@ -203,7 +203,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/fnet/readme.html b/docs/transformers/fnet/readme.html
index e94b4927..55ca01a9 100644
--- a/docs/transformers/fnet/readme.html
+++ b/docs/transformers/fnet/readme.html
@@ -88,7 +88,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/glu_variants/experiment.html b/docs/transformers/glu_variants/experiment.html
index 378128ce..b8c89e66 100644
--- a/docs/transformers/glu_variants/experiment.html
+++ b/docs/transformers/glu_variants/experiment.html
@@ -447,7 +447,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/glu_variants/index.html b/docs/transformers/glu_variants/index.html
index da7686bf..01072183 100644
--- a/docs/transformers/glu_variants/index.html
+++ b/docs/transformers/glu_variants/index.html
@@ -89,7 +89,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/glu_variants/simple.html b/docs/transformers/glu_variants/simple.html
index 273c0a4d..7cf518c4 100644
--- a/docs/transformers/glu_variants/simple.html
+++ b/docs/transformers/glu_variants/simple.html
@@ -1160,7 +1160,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/gmlp/experiment.html b/docs/transformers/gmlp/experiment.html
index 3020dd60..3bef8e2a 100644
--- a/docs/transformers/gmlp/experiment.html
+++ b/docs/transformers/gmlp/experiment.html
@@ -450,7 +450,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/gmlp/index.html b/docs/transformers/gmlp/index.html
index 02dfdcba..b539cd76 100644
--- a/docs/transformers/gmlp/index.html
+++ b/docs/transformers/gmlp/index.html
@@ -531,7 +531,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/gmlp/readme.html b/docs/transformers/gmlp/readme.html
index 1f603b4b..03474b45 100644
--- a/docs/transformers/gmlp/readme.html
+++ b/docs/transformers/gmlp/readme.html
@@ -90,7 +90,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/gpt/index.html b/docs/transformers/gpt/index.html
index 96b39f49..7b4233c8 100644
--- a/docs/transformers/gpt/index.html
+++ b/docs/transformers/gpt/index.html
@@ -868,7 +868,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/index.html b/docs/transformers/index.html
index 48e64479..dce7dcc4 100644
--- a/docs/transformers/index.html
+++ b/docs/transformers/index.html
@@ -123,7 +123,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/knn/build_index.html b/docs/transformers/knn/build_index.html
index dc260df6..1ab637c9 100644
--- a/docs/transformers/knn/build_index.html
+++ b/docs/transformers/knn/build_index.html
@@ -614,7 +614,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/knn/eval_knn.html b/docs/transformers/knn/eval_knn.html
index 09b4140f..3fa6867e 100644
--- a/docs/transformers/knn/eval_knn.html
+++ b/docs/transformers/knn/eval_knn.html
@@ -582,7 +582,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/knn/index.html b/docs/transformers/knn/index.html
index 9fdaceae..590c9010 100644
--- a/docs/transformers/knn/index.html
+++ b/docs/transformers/knn/index.html
@@ -97,7 +97,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/knn/train_model.html b/docs/transformers/knn/train_model.html
index 2eb53cfe..96bf33a0 100644
--- a/docs/transformers/knn/train_model.html
+++ b/docs/transformers/knn/train_model.html
@@ -498,7 +498,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/label_smoothing_loss.html b/docs/transformers/label_smoothing_loss.html
index 54a50b41..36f63156 100644
--- a/docs/transformers/label_smoothing_loss.html
+++ b/docs/transformers/label_smoothing_loss.html
@@ -206,7 +206,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/mha.html b/docs/transformers/mha.html
index 40f89ff2..84d68895 100644
--- a/docs/transformers/mha.html
+++ b/docs/transformers/mha.html
@@ -689,7 +689,6 @@ M834 80h400000v40h-400000z'/></svg></span></span></span><span class="vlist-s">
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/mlm/experiment.html b/docs/transformers/mlm/experiment.html
index bb407e50..bfe1216e 100644
--- a/docs/transformers/mlm/experiment.html
+++ b/docs/transformers/mlm/experiment.html
@@ -1167,7 +1167,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/mlm/index.html b/docs/transformers/mlm/index.html
index c17b1a99..6f4c859c 100644
--- a/docs/transformers/mlm/index.html
+++ b/docs/transformers/mlm/index.html
@@ -343,7 +343,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/mlm/readme.html b/docs/transformers/mlm/readme.html
index bfbcc20d..7657d47d 100644
--- a/docs/transformers/mlm/readme.html
+++ b/docs/transformers/mlm/readme.html
@@ -114,7 +114,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/mlp_mixer/experiment.html b/docs/transformers/mlp_mixer/experiment.html
index b66cb51b..73d65b0b 100644
--- a/docs/transformers/mlp_mixer/experiment.html
+++ b/docs/transformers/mlp_mixer/experiment.html
@@ -438,7 +438,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/mlp_mixer/index.html b/docs/transformers/mlp_mixer/index.html
index 33ae767f..3b7cfbf1 100644
--- a/docs/transformers/mlp_mixer/index.html
+++ b/docs/transformers/mlp_mixer/index.html
@@ -236,7 +236,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/mlp_mixer/readme.html b/docs/transformers/mlp_mixer/readme.html
index 7666bdcd..cc55438b 100644
--- a/docs/transformers/mlp_mixer/readme.html
+++ b/docs/transformers/mlp_mixer/readme.html
@@ -91,7 +91,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/models.html b/docs/transformers/models.html
index 7546e1ed..79f0d1c1 100644
--- a/docs/transformers/models.html
+++ b/docs/transformers/models.html
@@ -712,7 +712,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/positional_encoding.html b/docs/transformers/positional_encoding.html
index 45f6b288..0c8e5ddf 100644
--- a/docs/transformers/positional_encoding.html
+++ b/docs/transformers/positional_encoding.html
@@ -255,7 +255,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/primer_ez/efficient.html b/docs/transformers/primer_ez/efficient.html
index 30f387ec..a1f7f7ec 100644
--- a/docs/transformers/primer_ez/efficient.html
+++ b/docs/transformers/primer_ez/efficient.html
@@ -220,7 +220,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/primer_ez/experiment.html b/docs/transformers/primer_ez/experiment.html
index 1e85c8c2..c1d77e86 100644
--- a/docs/transformers/primer_ez/experiment.html
+++ b/docs/transformers/primer_ez/experiment.html
@@ -441,7 +441,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/primer_ez/index.html b/docs/transformers/primer_ez/index.html
index c1bd582a..5f3b6363 100644
--- a/docs/transformers/primer_ez/index.html
+++ b/docs/transformers/primer_ez/index.html
@@ -376,7 +376,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/primer_ez/readme.html b/docs/transformers/primer_ez/readme.html
index 87fbf3e7..16813a8b 100644
--- a/docs/transformers/primer_ez/readme.html
+++ b/docs/transformers/primer_ez/readme.html
@@ -94,7 +94,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/primer_ez/variations.html b/docs/transformers/primer_ez/variations.html
index efcdc6bf..f4472060 100644
--- a/docs/transformers/primer_ez/variations.html
+++ b/docs/transformers/primer_ez/variations.html
@@ -509,7 +509,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/relative_mha.html b/docs/transformers/relative_mha.html
index 5df9500e..03e132b3 100644
--- a/docs/transformers/relative_mha.html
+++ b/docs/transformers/relative_mha.html
@@ -74,7 +74,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/switch/experiment.html b/docs/transformers/switch/experiment.html
index 9ef45cf1..da4df2eb 100644
--- a/docs/transformers/switch/experiment.html
+++ b/docs/transformers/switch/experiment.html
@@ -844,7 +844,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/switch/index.html b/docs/transformers/switch/index.html
index 2cd06060..51200a12 100644
--- a/docs/transformers/switch/index.html
+++ b/docs/transformers/switch/index.html
@@ -720,7 +720,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/switch/readme.html b/docs/transformers/switch/readme.html
index 79f05db8..599cc810 100644
--- a/docs/transformers/switch/readme.html
+++ b/docs/transformers/switch/readme.html
@@ -92,7 +92,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/utils.html b/docs/transformers/utils.html
index 1fc2d31d..06176c6e 100644
--- a/docs/transformers/utils.html
+++ b/docs/transformers/utils.html
@@ -126,7 +126,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/vit/experiment.html b/docs/transformers/vit/experiment.html
index 25974aed..059f9a40 100644
--- a/docs/transformers/vit/experiment.html
+++ b/docs/transformers/vit/experiment.html
@@ -376,7 +376,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/vit/index.html b/docs/transformers/vit/index.html
index a7be1928..bb25e3aa 100644
--- a/docs/transformers/vit/index.html
+++ b/docs/transformers/vit/index.html
@@ -662,7 +662,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/vit/readme.html b/docs/transformers/vit/readme.html
index 73659b55..ca036f85 100644
--- a/docs/transformers/vit/readme.html
+++ b/docs/transformers/vit/readme.html
@@ -93,7 +93,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/xl/experiment.html b/docs/transformers/xl/experiment.html
index 582e1cdf..981b2737 100644
--- a/docs/transformers/xl/experiment.html
+++ b/docs/transformers/xl/experiment.html
@@ -1050,7 +1050,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/xl/index.html b/docs/transformers/xl/index.html
index 73fd751b..896d33ba 100644
--- a/docs/transformers/xl/index.html
+++ b/docs/transformers/xl/index.html
@@ -454,7 +454,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/xl/readme.html b/docs/transformers/xl/readme.html
index a77cab44..e3d9b504 100644
--- a/docs/transformers/xl/readme.html
+++ b/docs/transformers/xl/readme.html
@@ -92,7 +92,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/transformers/xl/relative_mha.html b/docs/transformers/xl/relative_mha.html
index 48e0be81..466948a0 100644
--- a/docs/transformers/xl/relative_mha.html
+++ b/docs/transformers/xl/relative_mha.html
@@ -380,7 +380,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/uncertainty/evidence/experiment.html b/docs/uncertainty/evidence/experiment.html
index ef56f038..c7ee8bbc 100644
--- a/docs/uncertainty/evidence/experiment.html
+++ b/docs/uncertainty/evidence/experiment.html
@@ -870,7 +870,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/uncertainty/evidence/index.html b/docs/uncertainty/evidence/index.html
index 148e042d..93cd3d6b 100644
--- a/docs/uncertainty/evidence/index.html
+++ b/docs/uncertainty/evidence/index.html
@@ -687,7 +687,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/uncertainty/evidence/readme.html b/docs/uncertainty/evidence/readme.html
index 849aabb4..6b6a733c 100644
--- a/docs/uncertainty/evidence/readme.html
+++ b/docs/uncertainty/evidence/readme.html
@@ -90,7 +90,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/uncertainty/index.html b/docs/uncertainty/index.html
index 690e0456..1176ff9a 100644
--- a/docs/uncertainty/index.html
+++ b/docs/uncertainty/index.html
@@ -87,7 +87,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/uncertainty/readme.html b/docs/uncertainty/readme.html
index 3789f631..68acf6ca 100644
--- a/docs/uncertainty/readme.html
+++ b/docs/uncertainty/readme.html
@@ -87,7 +87,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/utils/index.html b/docs/utils/index.html
index d0f39598..260fd9cc 100644
--- a/docs/utils/index.html
+++ b/docs/utils/index.html
@@ -249,7 +249,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }
diff --git a/docs/utils/tokenizer.html b/docs/utils/tokenizer.html
index ae20d11c..51df360e 100644
--- a/docs/utils/tokenizer.html
+++ b/docs/utils/tokenizer.html
@@ -197,7 +197,6 @@
     function handleImages() {
         var images = document.querySelectorAll('p>img')
 
-        console.log(images);
         for (var i = 0; i < images.length; ++i) {
             handleImage(images[i])
         }