Niloofar ✈️ icmlmediumconfig v22

Rulin Shao团队将在ICML 2026展示开源深度研究模型DR Tulu等成果

摘要与判断

Rulin Shao团队宣布将在ICML 2026会议上展示《DR Tulu》与《Spurious Rewards》两项研究成果。其中DR Tulu提出基于演化评价标准的强化学习方法，并推出专为开放式长篇深度研究训练的开源模型DR Tulu-8B。该模型以极低成本实现了媲美顶级商用系统的性能，为开源社区在复杂长文本任务上的研究提供了重要参考。

Topics

引用和原文

Our team will present DR Tulu and Spurious Rewards at #ICML2026! Sadly, I'm not attending
原文链接

Trace

Raw Item: raw_f29b139cf5c24885
Processed Item: processed_40978c969c484e12
Source: source_x_feishu_candidate_niloofar_mire
LLM Logs: llm_a507641665ea4c61, llm_e385955749d4469b
Coze Loop: 51debc814b51eb286ed0c9eeeff559bd