MIC_team(2022.08 ~)

Workspace

Captioning : Medical Image Captioning
Dataset : Chexpert 등 (공용)
- 참고 : Github, Paper
SSL : Self-Supervised Learning (혁종)
SL : Supervised pre-training (진수)
FeatureEval : Linear Evaluation / K-NN Evaluation(?) (유진)
- Evaluation 방법, Label 등 참고 : Github, Paper
Visualization : NLP 관련 시각화 / 그 외 시각화 샘플들 (승용)
- 샘플은 여유 되는대로 쭉 추가 할게용
ETC : 진짜 잡폴더

CheXpert 관련 내용

Official Paper : https://arxiv.org/pdf/1901.07031.pdf
Official Site : https://stanfordmlgroup.github.io/competitions/chexpert/
Other Github : https://github.com/gaetandi/cheXpert
- Dataset, Pre-Training, Evaluation 다 있어요 !

End-to-End Medical Image Captioning(DeXTr)(2021.12~2022.02)

Many research use only language model in image captioning.
In other words, model's input is image feature from pre-trained CNN networks

In contrast, my model take image as input, so that CNN networks can also learn information about image captioning task.
Maybe CNN networks(visual encoder) will have potential to work better than (practically frozen)pre-trained CNN on X-ray datasets(e.g. CheXpert), in this way.

Besides, my DeXTr also use several normal images as input(visual encoder part), extract mutual information between input and normal images (feature difference part), pass this information(feature) to X-Transformer (language model part).

See below for details.

Report(Written in Korean)

Model

Architecture

Way to use normal image

see the function __getitem__ in Dextr/coco_dataset.py

CA(Contrastive Attention)

Wrote the code of contrastive attention based on theory of Liu et al.(2022)

Evaluation

Quantitative

Qualitative

Other results

Stability according to 'visual encoder & pre-training dataset'

2d representation

About Code

DeXTr(Full architecture) : DeXTr/models/Detr.py

Visual Encoder : DeXTr/models/visual_extractor.py
Feature Difference : CA in DeXTr/models/contra_att.py & Others in DeXTr/models/Detr.py
Language Model+Report Generation : Code by Pan(Author of X-LAN)

Training : DeXTr/main_mimic.py

$ CUDA_VISIBLE_DEVICES=1 python3 main_mimic.py --folder ./experiments/name

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MIC_team(2022.08 ~)

Workspace

CheXpert 관련 내용

End-to-End Medical Image Captioning(DeXTr)(2021.12~2022.02)

Model

Architecture

Way to use normal image

CA(Contrastive Attention)

Evaluation

Quantitative

Qualitative

Other results

Stability according to 'visual encoder & pre-training dataset'

2d representation

About Code

About

Releases

Packages

Contributors 4

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
Captioning		Captioning
Dataset		Dataset
ETC.		ETC.
FeatureEval		FeatureEval
SL		SL
SSL		SSL
Visualization		Visualization
README.md		README.md
requirements.txt		requirements.txt

sjinu96/MIC

Folders and files

Latest commit

History

Repository files navigation

MIC_team(2022.08 ~)

Workspace

CheXpert 관련 내용

End-to-End Medical Image Captioning(DeXTr)(2021.12~2022.02)

Model

Architecture

Way to use normal image

CA(Contrastive Attention)

Evaluation

Quantitative

Qualitative

Other results

Stability according to 'visual encoder & pre-training dataset'

2d representation

About Code

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Languages

Packages