AutoEncoderT1.py

from IPython import display

import matplotlib.pyplot as plt
import tensorflow_probability as tfp
import numpy as np
import PIL
import tensorflow as tf
import time

(train_images, _), (test_images, _) = tf.keras.datasets.mnist.load_data()


def preprocess_images(images):
  images = images.reshape((images.shape[0], 28, 28, 1)) / 255.
  return np.where(images > .5, 1.0, 0.0).astype('float32')


train_images = preprocess_images(train_images)
test_images = preprocess_images(test_images)

train_size = 60000
batch_size = 32
test_size = 10000

train_dataset = (tf.data.Dataset.from_tensor_slices(train_images)
                 .shuffle(train_size).batch(batch_size))
test_dataset = (tf.data.Dataset.from_tensor_slices(test_images)
                .shuffle(test_size).batch(batch_size))

total_loss_tracker = tf.keras.metrics.Mean(name="total_loss")
reconstruction_loss_tracker = tf.keras.metrics.Mean(name="reconstruction_loss")
kl_loss_tracker = tf.keras.metrics.Mean(name="kl_loss")


class CVAE(tf.keras.Model):
  """Convolutional variational autoencoder."""

  def __init__(self, latent_dim):
    super(CVAE, self).__init__()
    self.latent_dim = latent_dim
    self.encoder = tf.keras.Sequential(
        [
            tf.keras.layers.InputLayer(input_shape=(28, 28, 1)),
            tf.keras.layers.Conv2D(
                filters=32, kernel_size=3, strides=(2, 2), activation='relu'),
            tf.keras.layers.Conv2D(
                filters=64, kernel_size=3, strides=(2, 2), activation='relu'),
            tf.keras.layers.Flatten(),
            # No activation
            tf.keras.layers.Dense(latent_dim + latent_dim),
        ]
    )

    self.decoder = tf.keras.Sequential(
        [
            tf.keras.layers.InputLayer(input_shape=(latent_dim,)),
            tf.keras.layers.Dense(units=7*7*32, activation=tf.nn.relu),
            tf.keras.layers.Reshape(target_shape=(7, 7, 32)),
            tf.keras.layers.Conv2DTranspose(
                filters=64, kernel_size=3, strides=2, padding='same',
                activation='relu'),
            tf.keras.layers.Conv2DTranspose(
                filters=32, kernel_size=3, strides=2, padding='same',
                activation='relu'),
            # No activation
            tf.keras.layers.Conv2DTranspose(
                filters=1, kernel_size=3, strides=1, padding='same'),
        ]
    )


  @tf.function
  def sample(self, eps=None):
    if eps is None:
      eps = tf.random.normal(shape=(100, self.latent_dim))
    return self.decode(eps, apply_sigmoid=True)

  def encode(self, x):
    mean, logvar = tf.split(self.encoder(x), num_or_size_splits=2, axis=1)
    return mean, logvar

  def reparameterize(self, mu, sigma):
    eps = tf.random.normal(tf.shape(mu), 0, 1)
    return eps * tf.exp(0.5 * sigma) + mu

  def decode(self, z, apply_sigmoid=False):
    logits = self.decoder(z)
    if apply_sigmoid:
      probs = tf.sigmoid(logits)
      return probs
    return logits


optimizer = tf.keras.optimizers.Adam(1e-4)
beta = 4


def log_normal_pdf(sample, mean, logvar, raxis=1):
  log2pi = tf.math.log(2. * np.pi)
  return tf.reduce_sum(
      -.5 * beta * ((sample - mean) ** 2. * tf.exp(-logvar) + logvar + log2pi),
      axis=raxis)


def compute_loss(model, x):
  mu, sigma = model.encode(x)

  z = model.reparameterize(mu, sigma)
  x_logit = model.decode(z)

  cross_ent = tf.nn.sigmoid_cross_entropy_with_logits(logits=x_logit, labels=x)
  logpx_z = -tf.reduce_sum(cross_ent, axis=[1, 2, 3])
  logpz = log_normal_pdf(z, 0., 0.)
  logqz_x = log_normal_pdf(z, mu, sigma)
  total_loss = -tf.reduce_mean(logpx_z + logpz - logqz_x)

  return total_loss, logpx_z, logpz - logqz_x
  # Try 2 for another tutorial
  # marginal_likelihood = tf.reduce_sum(tf.keras.losses.binary_crossentropy(x, x_logit), axis=(1, 2))
  # KL_divergence = tf.reduce_sum(-0.5 * (1 + sigma - tf.square(mu) - tf.exp(sigma)), 1)
  # return tf.reduce_mean(marginal_likelihood) + beta * tf.reduce_mean(KL_divergence)


@tf.function
def train_step(model, x, optimizer):
  """Executes one training step and returns the loss.

  This function computes the loss and gradients, and uses the latter to
  update the model's parameters.
  """
  with tf.GradientTape() as tape:
    loss, recon_loss, kl_loss = compute_loss(model, x)
  gradients = tape.gradient(loss, model.trainable_variables)
  optimizer.apply_gradients(zip(gradients, model.trainable_variables))
  total_loss_tracker.update_state(loss)
  reconstruction_loss_tracker.update_state(recon_loss)
  kl_loss_tracker(kl_loss)


epochs = 10
# set the dimensionality of the latent space to a plane for visualization later
latent_dim = 20
num_examples_to_generate = 16

# keeping the random vector constant for generation (prediction) so
# it will be easier to see the improvement.
random_vector_for_generation = tf.random.normal(
    shape=[num_examples_to_generate, latent_dim])
model = CVAE(latent_dim)


def generate_and_save_images(model, epoch, test_sample):
  mean, logvar = model.encode(test_sample)
  z = model.reparameterize(mean, logvar)
  predictions = model.sample(z)
  fig = plt.figure(figsize=(4, 4))

  for i in range(predictions.shape[0]):
    plt.subplot(4, 4, i + 1)
    plt.imshow(predictions[i, :, :, 0], cmap='gray')
    plt.axis('off')

  # tight_layout minimizes the overlap between 2 sub-plots
  plt.savefig('Pictures/MNIST/image_at_epoch_{:04d}.png'.format(epoch))
  plt.show()


# Pick a sample of the test set for generating output images
assert batch_size >= num_examples_to_generate
for test_batch in test_dataset.take(1):
  test_sample = test_batch[0:num_examples_to_generate, :, :, :]

generate_and_save_images(model, 0, test_sample)

for epoch in range(1, epochs + 1):
  start_time = time.time()
  for train_x in train_dataset:
    train_step(model, train_x, optimizer)
  end_time = time.time()

  loss = tf.keras.metrics.Mean()
  for test_x in test_dataset:
      loss, _, _ = compute_loss(model, test_x)
  display.clear_output(wait=True)
  print('Epoch: {}, Test set ELBO: {}, time elapse for current epoch: {}'
        .format(epoch, loss, end_time - start_time))
  print('Total loss: {}, Reconstruction loss: {}, KL Divergence: {}'
        .format(total_loss_tracker.result(), reconstruction_loss_tracker.result(), kl_loss_tracker.result()))
  generate_and_save_images(model, epoch, test_sample)


def display_image(epoch_no):
  return PIL.Image.open('Pictures/MNIST/image_at_epoch_{:04d}.png'.format(epoch_no))


plt.imshow(display_image(epoch))
plt.axis('off')  # Display images

# import tensorflow_docs.vis.embed as embed
# embed.embed_file(anim_file)