JapaneseEmbeddingEval

JSTS/JSICK: Spearman's rank correlation coefficient
- Cosine similarity was used to calculate the similarity of sentence pairs.
MIRACL: top30 recall

Model	JSTS valid-v1.1	JSICK test	MIRACL dev	Average
MU-Kindai/SBERT-JSNLI-base	0.766	0.652	0.326	0.581
MU-Kindai/SBERT-JSNLI-large	0.774	0.677	0.278	0.576
cl-nagoya/sup-simcse-ja-base	0.809	0.827	0.527	0.721
cl-nagoya/sup-simcse-ja-large	0.831	0.831	0.507	0.723
cl-nagoya/unsup-simcse-ja-base	0.789	0.790	0.487	0.689
cl-nagoya/unsup-simcse-ja-large	0.814	0.796	0.485	0.699
colorfulscoop/sbert-base-ja	0.742	0.657	0.254	0.551
intfloat/multilingual-e5-base	0.796	0.806	0.845	0.816
intfloat/multilingual-e5-large	0.819	0.794	0.883	0.832
intfloat/multilingual-e5-small	0.789	0.814	0.847	0.817
pkshatech/GLuCoSE-base-ja	0.818	0.757	0.692	0.755
pkshatech/simcse-ja-bert-base-clcmlp	0.801	0.735	0.544	0.693
oshizo/sbert-jsnli-luke-japanese-base-lite	0.811	0.726	0.497	0.678
sonoisa/sentence-bert-base-ja-mean-tokens-v2	0.809	0.768
text-embedding-ada-002	0.790	0.789	0.723¹	0.768
universal-sentence-encoder-multilingual-3	0.790	0.800
universal-sentence-encoder-multilingual-large-3	0.801	0.823

Datasets

JSTS valid-v1.1
- https://github.com/yahoojapan/JGLUE
- 1,457 sentence pairs
JSICK test
- https://github.com/verypluming/JSICK
- 4,927 sentence pairs
MIRACL dev
- https://huggingface.co/datasets/miracl/miracl
- 860 japanese queries
- From the 6,953,614 japanese data in miracl/miracl-corpus, the sentences to be searched were selected as follows to reduce computation time.
  1. positive passage for each query
  2. 300 hard negatives for each query
  - Hard negative mining was performed using intfloat/multilingual-e5-base
  - Scores for models other than intfloat/multilingual-e5-base are calculated higher only in the following case, but we believe that they are almost unaffected.
    - A negative that is ranked lower than the top 300 by intfloat/multilingual-e5-base is ranked within the top 30 by that model, which pushes the positive into the top 30 or lower.

Evaluate only the first 100 queries out of 860 queries ↩

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

JapaneseEmbeddingEval

Datasets

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
scores		scores
.gitignore		.gitignore
10_intfloat_multilingual-e5-base.ipynb		10_intfloat_multilingual-e5-base.ipynb
11_intfloat_multilingual-e5-large.ipynb		11_intfloat_multilingual-e5-large.ipynb
12_pkshatech_GLuCoSE-base-ja.ipynb		12_pkshatech_GLuCoSE-base-ja.ipynb
13_cl-nagoya_unsup-simcse-ja-base.ipynb		13_cl-nagoya_unsup-simcse-ja-base.ipynb
14_cl-nagoya_unsup-simcse-ja-large.ipynb		14_cl-nagoya_unsup-simcse-ja-large.ipynb
15_cl-nagoya_sup-simcse-ja-base.ipynb		15_cl-nagoya_sup-simcse-ja-base.ipynb
16_cl-nagoya_sup-simcse-ja-large.ipynb		16_cl-nagoya_sup-simcse-ja-large.ipynb
17_intfloat_multilingual-e5-small.ipynb		17_intfloat_multilingual-e5-small.ipynb
1_colorfulscoop_sbert-base-ja.ipynb		1_colorfulscoop_sbert-base-ja.ipynb
2_MU-Kindai_SBERT-JSNLI-base.ipynb		2_MU-Kindai_SBERT-JSNLI-base.ipynb
3_MU-Kindai_SBERT-JSNLI-large.ipynb		3_MU-Kindai_SBERT-JSNLI-large.ipynb
4_sonoisa_sentence-bert-base-ja-mean-tokens-v2.ipynb		4_sonoisa_sentence-bert-base-ja-mean-tokens-v2.ipynb
5_oshizo_sbert-jsnli-luke-japanese-base-lite.ipynb		5_oshizo_sbert-jsnli-luke-japanese-base-lite.ipynb
6_pkshatech_simcse-ja-bert-base-clcmlp.ipynb		6_pkshatech_simcse-ja-bert-base-clcmlp.ipynb
7_universal-sentence-encoder-multilingual-large-3.ipynb		7_universal-sentence-encoder-multilingual-large-3.ipynb
8_universal-sentence-encoder-multilingual-3.ipynb		8_universal-sentence-encoder-multilingual-3.ipynb
9_text-embedding-ada-002.ipynb		9_text-embedding-ada-002.ipynb
Ollama_gemma_2_2b_jpn_it_RAG_for_web_url_embedding_model_is_bad_for_JP.ipynb		Ollama_gemma_2_2b_jpn_it_RAG_for_web_url_embedding_model_is_bad_for_JP.ipynb
README.md		README.md
huggingface_access_token		huggingface_access_token
miracl_hard_negs_1000.json		miracl_hard_negs_1000.json
requirements.txt		requirements.txt
runner.ipynb		runner.ipynb
template_sentence-transformers.ipynb		template_sentence-transformers.ipynb

ryogrid-watch/JapaneseEmbeddingEval

Folders and files

Latest commit

History

Repository files navigation

JapaneseEmbeddingEval

Datasets

Footnotes

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages