Niloofar ✈️ icmlmediumconfig v22
Rulin Shao团队将在ICML 2026展示开源深度研究模型DR Tulu等成果
摘要与判断
Rulin Shao团队宣布将在ICML 2026会议上展示《DR Tulu》与《Spurious Rewards》两项研究成果。其中DR Tulu提出基于演化评价标准的强化学习方法,并推出专为开放式长篇深度研究训练的开源模型DR Tulu-8B。该模型以极低成本实现了媲美顶级商用系统的性能,为开源社区在复杂长文本任务上的研究提供了重要参考。
Topics
引用和原文
Trace
- Raw Item
- raw_f29b139cf5c24885
- Processed Item
- processed_40978c969c484e12
- Source
- source_x_feishu_candidate_niloofar_mire
- LLM Logs
- llm_a507641665ea4c61, llm_e385955749d4469b
- Coze Loop
- 51debc814b51eb286ed0c9eeeff559bd