lima - 搜索 News

李飞飞等斯坦福大学和华盛顿大学的研究人员，站在开源模型Qwen2.5的肩膀上，训练成本仅花了不到50美元，就成功训练出了s1的AI推理模型，性能媲美OpenAI！ s1模型论文的作者，斯坦福大学在读博士 Niklas ...

6 小时

李飞飞等斯坦福大学和华盛顿大学的研究人员，站在开源模型Qwen2.5的肩膀上，训练成本仅花了不到50美元，就成功训练出了s1的AI推理模型，性能媲美OpenAI！在现有的阿里巴巴Qwen2.5-32B-Instruct的基础开始，然后使用谷歌最新的Gemini 2.0 Flash Experimental进行微调。

15 小时

817样本激发7倍推理性能：上交大「少即是多」定律挑战RL Scaling范式

在追求人工智能极限的道路上，"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI 终极挑战的领域，业界普遍认为需要海量数据和复杂的强化学习才能获得突破。然而，来自上海交通大学的最新研究却给出了一个令人震惊的答案：仅需 817 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点