ChiQA

关于ChiQA

随着互联网的发展，用户在搜索引擎中越来越不满足于简单的文本结果，以图片、视频等为载体的“新问答”越来越受到关注。事实上，在问答系统中，很多答案的结果都可以用一个图片来简单的回答。如下图：

图片问答越来越重要，但是传统的VQA（visual question answering）数据很难应用在实际场景中。原因有三：

针对上面问题，我们提出了一个ChiQA数据集，包含有20万中文query-image对。我们人工标注了每条数据的相关性。

安装运行依赖命令
pip install -r requirement.txt

训练并测试bert-detr模型
sh run_bert_detr.sh -e 5 -p 10 -t 800 -s 200 -l 2e-5 -w 0.1 -n 4
参数说明：

训练并测试bert-vit模型
sh run_bert_vit.sh -e 5 -p 10 -t 800 -s 200 -l 2e-5 -w 0.1 -n 4
训练参数说明同上。

训练并测试albef模型
sh run_albef.sh -e 5 -p 10 -t 800 -s 200 -l 2e-5 -w 0.1 -n 4
训练参数说明同上。