set seed in sft/dpo/reward_modeling to make result reproducable #1357

sywangyi · 2024-02-23T10:05:47Z

No description provided.

Signed-off-by: Wang, Yi A <[email protected]>

sywangyi · 2024-02-23T10:05:53Z

younesbelkada

Thanks a lot for this work @sywangyi !

HuggingFaceDocBuilderDev · 2024-02-23T10:10:54Z

The docs for this PR live here. All of your documentation changes will be reflected on that endpoint. The docs are available until 30 days after the last update.

…ingface#1357) Signed-off-by: Wang, Yi A <[email protected]>

set seed in sft/dpo/reward_modeling to make result reproducable

bd77b56

Signed-off-by: Wang, Yi A <[email protected]>

younesbelkada approved these changes Feb 23, 2024

View reviewed changes

younesbelkada merged commit 2a2676e into huggingface:main Feb 23, 2024
9 checks passed

lapp0 pushed a commit to lapp0/trl that referenced this pull request May 10, 2024

set seed in sft/dpo/reward_modeling to make result reproducable (hugg…

419f7f6

…ingface#1357) Signed-off-by: Wang, Yi A <[email protected]>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

set seed in sft/dpo/reward_modeling to make result reproducable #1357

set seed in sft/dpo/reward_modeling to make result reproducable #1357

sywangyi commented Feb 23, 2024

sywangyi commented Feb 23, 2024

younesbelkada left a comment

HuggingFaceDocBuilderDev commented Feb 23, 2024

set seed in sft/dpo/reward_modeling to make result reproducable #1357

set seed in sft/dpo/reward_modeling to make result reproducable #1357

Conversation

sywangyi commented Feb 23, 2024

sywangyi commented Feb 23, 2024

younesbelkada left a comment

Choose a reason for hiding this comment

HuggingFaceDocBuilderDev commented Feb 23, 2024