Niloofar ✈️ icmlmediumconfig v22

Rulin Shao团队将在ICML 2026展示开源深度研究模型DR Tulu等成果

摘要与判断

Rulin Shao团队宣布将在ICML 2026会议上展示《DR Tulu》与《Spurious Rewards》两项研究成果。其中DR Tulu提出基于演化评价标准的强化学习方法,并推出专为开放式长篇深度研究训练的开源模型DR Tulu-8B。该模型以极低成本实现了媲美顶级商用系统的性能,为开源社区在复杂长文本任务上的研究提供了重要参考。

Topics

引用和原文

Trace

Raw Item
raw_f29b139cf5c24885
Processed Item
processed_40978c969c484e12
Source
source_x_feishu_candidate_niloofar_mire
LLM Logs
llm_a507641665ea4c61, llm_e385955749d4469b
Coze Loop
51debc814b51eb286ed0c9eeeff559bd