AI & ML interests
None defined yet.
Recent Activity
MultiRL/qwen3_1.7b_sft_one_act
2B
•
Updated
•
752
MultiRL/qwen3_1.7b_easy_rl_final
2B
•
Updated
•
1.19k
MultiRL/qwen3_4b_easy_rl_final
4B
•
Updated
•
629
MultiRL/qwen3_1.7b_sft_final
2B
•
Updated
•
5.24k
MultiRL/qwen3_4b_sft_final
4B
•
Updated
•
1.68k
MultiRL/qwen3_1.7b_easy_rl_new
2B
•
Updated
•
1
MultiRL/qwen3_4b_standard_medium_rl
4B
•
Updated
•
80
MultiRL/qwen3_4b_standard_easy_rl
4B
•
Updated
•
164
MultiRL/qwen3_4b_medium_rl_progress_C
4B
•
Updated
•
1
MultiRL/qwen3_4b_medium_rl
4B
•
Updated
•
77
4B
•
Updated
•
62
MultiRL/qwen3_4b_instruct_sft
4B
•
Updated
•
95
MultiRL/qwen3_1.7b_easy_rl_test_task_group
2B
•
Updated
•
1
MultiRL/qwen3_1.7b_easy_rl_test
2B
•
Updated
•
69
8B
•
Updated
•
53
MultiRL/qwen3_8b_sudoku_sft
8B
•
Updated
•
49
MultiRL/qwen3_1.7b_sudoku_sft
2B
•
Updated
•
137
MultiRL/qwen3_1.7b_easy_reinforce_batch_32_by_pass
2B
•
Updated
•
43
MultiRL/qwen3_1.7b_easy_reinforce_batch_64_by_pass
2B
•
Updated
•
1
MultiRL/qwen3_1.7b_easy_reinforce_test
2B
•
Updated
•
30
MultiRL/qwen3_1.7b_C_easy_gspo_test
2B
•
Updated
•
30
MultiRL/qwen3_1.7b_base_C_normal_short_sft_lr_1e_5_C_easy_grpo_step70
2B
•
Updated
•
21
MultiRL/qwen3_1.7b_C_short_sft_lr_1e_5_C_easy_reinforce_step80
2B
•
Updated
•
12
MultiRL/qwen3_1.7b_base_C_normal_concise_sft_lr_5e_6
2B
•
Updated
•
12
MultiRL/qwen3_1.7b_base_C_easy_short_sft_lr_1e_6
2B
•
Updated
•
11
MultiRL/qwen3_1.7b_format_rl
2B
•
Updated
•
12
MultiRL/qwen3_1.7b_base_C_normal_short_sft_lr_5e_6
2B
•
Updated
•
11
MultiRL/qwen3_1.7b_base_B_normal_short_sft_lr_1e_5
2B
•
Updated
•
13
MultiRL/qwen3_1.7b_base_A_normal_short_sft_lr_1e_5
2B
•
Updated
•
2
MultiRL/qwen3_1.7b_base_C_normal_short_sft_lr_1e_5
2B
•
Updated
•
39