低成本复现 DeepSeek R1-Zero:仅用30美元,小型语言模型在倒计时游戏中展现惊人自验证与搜索能力刚刚,来自加州伯克利大学在读博士Jiayi Pan的研究团队成功地以极低的成本(低于30美元)复现了 DeepSeek R1-Zero ...