近日,美国开放人工智能研究中心(OpenAI)首席执行官萨姆·奥尔特曼在东京发言,针对中国杭州深度求索人工智能基础技术研究有限公司(DeepSeek)推出的新型人工智能模型,表达了既欣赏又警惕的态度。DeepSeek的这一新模型被认为性能相当于Cha ...
选自oxen.ai作者:Greg Schoeninger编译:陈陈、泽南RTX 3080 移动版能训练哪种大模型?本文为那些 GPU 资源有限时使用 GRPO 训练的开发者提供了宝贵的指导。自 DeepSeek-R1 ...
从算力市场的整体影响情况上来看,潞晨科技创始人尤洋告诉 AI 科技评论,“DeepSeek ...
新一代 Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey ...
去年春节,美国OpenAI开发的视频生成AI工具Sora横空出世,成为世界关注的焦点。今年春节前夕,一家低调的中国AI企业DeepSeek推出的开源大模型在全球引发了不啻Sora的震撼——它在模型算法和工程优化方面所进行的系统级创新,为在受限资源下探索通用人工智能开辟了新的道路,并为打破以“大模型、大数据和大算力”为核心的生成式AI“扩展定律”天花板带来了无限遐想。