SQ-GAN: Semantic Image Communication Using Masked Vector Quantization

📜 Paper

Authors: Francesco Pezone, Sergio Barbarossa, Giuseppe Caire

📌 Overview

SQ-GAN (Semantic Masked VQ-GAN) is a novel approach that leverages generative models for optimizing image compression in task-oriented communications. Our model selectively encodes semantically significant features using:

Semantic segmentation for identifying key regions.
Semantic-Conditioned Adaptive Mask Module (SAMM) for adaptive feature encoding.
Advanced semantic-based compression approach outperforming JPEG2000 and BPG, particularly at extreme low bit rates.

SQ-GAN framework

Main Results

🚀 Installation & Setup

Run the following code

conda env create -f environment.yml
conda activate sqgan_env

📂 Dataset Preparation

SQ-GAN is trained on the Cityscapes dataset. To prepare the dataset:

Follow the dataset setup instructions from SPADE.
Update DefaultDataPath.Cityscapes.root in data/default.py with the correct dataset path.

🔧 Training SQ-GAN

SQ-GAN follows a 3-step training approach, training individual subnetworks before final joint training.

Step 1: Train Semantic Subnetwork (G_s)

python3 train.py --mode ssm \
                 --gpus -1 \
                 --base config/sqgan_cityscapes.yml \
                 --max_epochs 150

Step 2: Train Image Subnetwork (G_x)

python3 train.py --mode img \
                 --gpus -1 \
                 --base config/sqgan_cityscapes.yml \
                 --max_epochs 150

Step 3: Train Final Model (G)

Before final training, the model must be split into components to allow different parts to load simultaneously without issues:

Splitting Checkpoints

Split G_s

python3 train.py --mode ssm \
                 --gpus -1 \
                 --base config/sqgan_cityscapes.yml \
                 --max_epochs 150 \
                 --resume_from_checkpoint /path/to/G_s_checkpoint.ckpt \
                 --split_path Final_ckpt_parts/

Split G_x

python3 train.py --mode img \
                 --gpus -1 \
                 --base config/sqgan_cityscapes.yml \
                 --max_epochs 150 \
                 --resume_from_checkpoint /path/to/G_x_checkpoint.ckpt \
                 --split_path Final_ckpt_parts/

Final Training

python3 train.py --mode all \
                 --gpus -1 \
                 --base config/sqgan_cityscapes.yml \
                 --max_epochs 150 \
                 --ckpt_path_parts Final_ckpt_parts/

🎯 Pre-Trained Models

Pre-trained models for the Cityscapes dataset are available for download:

Dataset	Checkpoint Link
Cityscapes	📥 Download

📊 Model Evaluation

Pre-requisites

Batchsize: in config/sqgan_cityscapes.yml set the dataset batchsize to 1
Semantic Segmentation Model: SQ-GAN uses InternImage for generating segmentation maps.
Modify Paths: In sample.py, update internimage_path with the correct InternImage path. If using another segmentation model, modify lines 185-186 accordingly.

Evaluation Methods

Option 1: Evaluate from split submodels

python3 sample.py --mode all \
                  --base config/sqgan_cityscapes.yml \
                  --ckpt_path_parts Final_ckpt_parts/ \
                  --gpus -1

Option 2: Evaluate from a single checkpoint

python3 sample.py --mode all \
                  --base config/sqgan_cityscapes.yml \
                  --resume_from_checkpoint /path/to/merged_checkpoint.ckpt \
                  --gpus -1

Results are stored in the Result/ folder. Multiple subfolders are crated for the desired combination of masking fractions and the performances are saved in metrics.csv.

Acknowledgment

The code is based on MQ-VAE

🔗 Citation

If you find this work useful, please cite our paper:

@article{SQ-GAN,
  title={SQ-GAN: Semantic Image Communication Using Masked Vector Quantization},
  author={Francesco Pezone, Sergio Barbarossa, Giuseppe Caire},
  journal={arXiv preprint arXiv:2502.09520},
  year={2025}
}

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
assets		assets
config		config
data		data
evaluate		evaluate
models		models
modules		modules
utils		utils
.gitignore		.gitignore
README.md		README.md
environment.yml		environment.yml
sample.py		sample.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SQ-GAN: Semantic Image Communication Using Masked Vector Quantization

📜 Paper

📌 Overview

SQ-GAN framework

Main Results

🚀 Installation & Setup

📂 Dataset Preparation

🔧 Training SQ-GAN

Step 1: Train Semantic Subnetwork (G_s)

Step 2: Train Image Subnetwork (G_x)

Step 3: Train Final Model (G)

Splitting Checkpoints

Split G_s

Split G_x

Final Training

🎯 Pre-Trained Models

📊 Model Evaluation

Pre-requisites

Evaluation Methods

Acknowledgment

🔗 Citation

About

Releases

Packages

Languages

frapez1/SQ-GAN

Folders and files

Latest commit

History

Repository files navigation

SQ-GAN: Semantic Image Communication Using Masked Vector Quantization

📜 Paper

📌 Overview

SQ-GAN framework

Main Results

🚀 Installation & Setup

📂 Dataset Preparation

🔧 Training SQ-GAN

Step 1: Train Semantic Subnetwork (G_s)

Step 2: Train Image Subnetwork (G_x)

Step 3: Train Final Model (G)

Splitting Checkpoints

Split G_s

Split G_x

Final Training

🎯 Pre-Trained Models

📊 Model Evaluation

Pre-requisites

Evaluation Methods

Acknowledgment

🔗 Citation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages