From 568adeab08d2cfe8364475fbd1742ea28d36b360 Mon Sep 17 00:00:00 2001
From: Jim Martens <github@2martens.de>
Date: Fri, 12 Apr 2019 13:45:27 +0200
Subject: [PATCH] Implemented auto-encoder model from OliverEdholm

Source: https://github.com/OliverEdholm/Convolutional-Autoencoder/
Signed-off-by: Jim Martens <github@2martens.de>
---
 src/twomartens/masterthesis/aae/model.py | 68 ++++++++++--------------
 1 file changed, 28 insertions(+), 40 deletions(-)

diff --git a/src/twomartens/masterthesis/aae/model.py b/src/twomartens/masterthesis/aae/model.py
index 976b119..24877c6 100644
--- a/src/twomartens/masterthesis/aae/model.py
+++ b/src/twomartens/masterthesis/aae/model.py
@@ -46,45 +46,39 @@ class Encoder(keras.Model):
     def __init__(self, zsize: int) -> None:
         super().__init__(name='encoder')
         weight_init = keras.initializers.RandomNormal(mean=0, stddev=0.02)
-        # self.x_padded = keras.layers.ZeroPadding2D(padding=1)
-        self.conv1 = keras.layers.Conv2D(filters=zsize * 2, kernel_size=3, strides=1, name='conv1',
+        self.conv1 = keras.layers.Conv2D(filters=zsize * 2, kernel_size=7, strides=1, name='conv1',
                                          padding='same', kernel_initializer=weight_init)
         self.conv1_a = keras.layers.ReLU()
-        # self.conv1_a_padded = keras.layers.ZeroPadding2D(padding=1)
+        self.dropout = keras.layers.Dropout(rate=0.25)
         self.pool1 = keras.layers.MaxPool2D(pool_size=(2, 2), padding='same', name='pool1')
-        self.conv2 = keras.layers.Conv2D(filters=zsize, kernel_size=3, strides=1, name='conv2',
+        self.conv2 = keras.layers.Conv2D(filters=zsize * 2, kernel_size=7, strides=1, name='conv2',
                                          padding='same', kernel_initializer=weight_init)
-        self.conv2_bn = keras.layers.BatchNormalization()
         self.conv2_a = keras.layers.ReLU()
         self.pool2 = keras.layers.MaxPool2D(pool_size=(2, 2), padding='same', name='pool2')
-        # self.conv2_a_padded = keras.layers.ZeroPadding2D(padding=1)
-        self.conv3 = keras.layers.Conv2D(filters=zsize, kernel_size=3, strides=1, name='conv3',
+        self.conv3 = keras.layers.Conv2D(filters=zsize * 2, kernel_size=7, strides=1, name='conv3',
                                          padding='same', kernel_initializer=weight_init)
-        self.conv3_bn = keras.layers.BatchNormalization()
         self.conv3_a = keras.layers.ReLU()
         self.pool3 = keras.layers.MaxPool2D(pool_size=(2, 2), padding='same', name='pool3')
-        # self.conv4 = keras.layers.Conv2D(filters=zsize, kernel_size=4, strides=1, name='conv4',
-        #                                  padding='same', kernel_initializer=weight_init)
-        # self.pool4 = keras.layers.MaxPool2D(pool_size=(2, 2), padding='same', name='pool4')
+        self.conv4 = keras.layers.Conv2D(filters=zsize, kernel_size=7, strides=1, name='conv4',
+                                         padding='same', kernel_initializer=weight_init)
+        self.conv4_a = keras.layers.ReLU()
+        self.pool4 = keras.layers.MaxPool2D(pool_size=(2, 2), padding='same', name='pool4')
     
     def call(self, inputs: tf.Tensor, **kwargs) -> tf.Tensor:
         """See base class."""
-        # result = self.x_padded(inputs)
         result = self.conv1(inputs)
         result = self.conv1_a(result)
-        # result = self.conv1_a_padded(result)
+        result = self.dropout(result)
         result = self.pool1(result)
-        result = self.conv2(result)
-        result = self.conv2_bn(result)
-        result = self.conv2_a(result)
-        result = self.pool2(result)
-        # result = self.conv2_a_padded(result)
+        # result = self.conv2(result)
+        # result = self.conv2_a(result)
+        # result = self.pool2(result)
         result = self.conv3(result)
-        result = self.conv3_bn(result)
         result = self.conv3_a(result)
         result = self.pool3(result)
-        # result = self.conv4(result)
-        # result = self.pool4(result)
+        result = self.conv4(result)
+        result = self.conv4_a(result)
+        result = self.pool4(result)
         
         return result
 
@@ -101,46 +95,40 @@ class Decoder(keras.Model):
     def __init__(self, channels: int, zsize: int) -> None:
         super().__init__(name='decoder')
         weight_init = keras.initializers.RandomNormal(mean=0, stddev=0.02)
-        self.deconv1 = keras.layers.Conv2D(filters=zsize, kernel_size=3, strides=1, name='deconv1',
+        self.deconv1 = keras.layers.Conv2D(filters=zsize, kernel_size=7, strides=1, name='deconv1',
                                            padding='same', kernel_initializer=weight_init)
-        self.deconv1_bn = keras.layers.BatchNormalization()
         self.deconv1_a = keras.layers.ReLU()
         self.upsample1 = keras.layers.UpSampling2D(size=(2, 2), name='upsample1')
-        self.deconv2 = keras.layers.Conv2D(filters=zsize, kernel_size=3, strides=1, name='deconv2',
+        self.deconv2 = keras.layers.Conv2D(filters=zsize * 2, kernel_size=7, strides=1, name='deconv2',
                                            padding='same', kernel_initializer=weight_init)
-        # self.deconv2_cropped = keras.layers.Cropping2D(cropping=1)
-        self.deconv2_bn = keras.layers.BatchNormalization()
         self.deconv2_a = keras.layers.ReLU()
         self.upsample2 = keras.layers.UpSampling2D(size=(2, 2), name='upsample2')
-        self.deconv3 = keras.layers.Conv2D(filters=zsize * 2, kernel_size=3, strides=1, name='deconv3',
-                                           padding='valid', kernel_initializer=weight_init)
-        # self.deconv3_cropped = keras.layers.Cropping2D(cropping=1)
-        self.deconv3_bn = keras.layers.BatchNormalization()
+        self.deconv3 = keras.layers.Conv2D(filters=zsize * 2, kernel_size=7, strides=1, name='deconv3',
+                                           padding='same', kernel_initializer=weight_init)
         self.deconv3_a = keras.layers.ReLU()
         self.upsample3 = keras.layers.UpSampling2D(size=(2, 2), name='upsample3')
-        self.deconv4 = keras.layers.Conv2D(filters=channels, kernel_size=4, strides=1, name='deconv4',
+        self.deconv4 = keras.layers.Conv2D(filters=zsize * 3, kernel_size=7, strides=1, name='deconv4',
+                                           padding='same', kernel_initializer=weight_init)
+        self.deconv4_a = keras.layers.ReLU()
+        self.upsample4 = keras.layers.UpSampling2D(size=(2, 2), name='upsample4')
+        self.deconv5 = keras.layers.Conv2D(filters=channels, kernel_size=7, strides=1, name='deconv5',
                                            padding='same', kernel_initializer=weight_init)
-        # self.deconv4_cropped = keras.layers.Cropping2D(cropping=1)
     
     def call(self, inputs: tf.Tensor, **kwargs) -> tf.Tensor:
         """See base class."""
         result = self.deconv1(inputs)
-        result = self.deconv1_bn(result)
         result = self.deconv1_a(result)
         result = self.upsample1(result)
         result = self.deconv2(result)
-        # result = self.deconv2_cropped(result)
-        result = self.deconv2_bn(result)
         result = self.deconv2_a(result)
         result = self.upsample2(result)
         result = self.deconv3(result)
-        # result = self.deconv3_cropped(result)
-        result = self.deconv3_bn(result)
         result = self.deconv3_a(result)
         result = self.upsample3(result)
-        result = self.deconv4(result)
-        # result = self.deconv4_cropped(result)
-        # result = k.tanh(result) * 0.5 + 0.5
+        # result = self.deconv4(result)
+        # result = self.deconv4_a(result)
+        # result = self.upsample4(result)
+        result = self.deconv5(result)
         result = k.sigmoid(result)
         
         return result