math - 搜索 News

15 天

阿里云通义Qwen2.5-Math-PRM：7B模型超越GPT-4o，数学推理新突破

1月16日消息，阿里云通义团队发布了新一代数学推理过程奖励模型——Qwen2.5-Math-PRM。该模型引入了72B与7B两种尺寸，其在推理过程中的表现显著优于现有的开源模型，尤其在推理错误识别方面，7B版本的性能甚至超过了闭源的GPT-4o。这一创新不仅为智能推理提供了新的可能性，也为相关领域的技术进步注入了新的活力。 Qwen2.5-Math-PRM模型的设计旨在解决大型语言模型在处理推理时 ...

18 小时

科学家热议DeepSeek-R1：一款颠覆性的开源语言模型

近期，《Nature》杂志发表了一篇引人注目的文章，介绍了由中国初创公司DeepSeek研发的语言模型DeepSeek-R1。该模型的推出引发了科学界的广泛关注与热议，许多研究人员认为它将成为OpenAI的o1等推理模型在经济效益和开放性上的有力竞争 ...

15 天

阿里云通义推出Qwen2.5-Math-PRM模型与首个推理评估标准

在科技快速发展的今天，阿里云再一次为人工智能领域推陈出新。1月16日，钛媒体App报道了阿里云通义开源了全新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一模型的推出，标志着在72B与7B尺寸下，其性能远超同类开源过程奖励模型。

腾讯网2 天

当AI成本降低30倍：DeepSeek-R1如何重塑AI行业

自 DeepSeek-R1 发布以来，其出色的推理能力和相对低廉的训练成本在业界引发强烈反响。它让人们意识到，高性能 AI 模型的开发，也许不必依赖于昂贵的算力和海量的数据。R1 不仅在性能上接近 OpenAI 的 ...

13 小时

DeepSeek相关概念股

业务优势：A 股中较早参与 DeepSeek 天使轮投资的公司，可分享 DeepSeek 成长带来的红利，2023 年创投业务利润贡献占比较高。业务优势：珠海国资旗下投资平台，通过华金领越基金参与 DeepSeek 的 Pre - A 轮融资，借助资本力量与 DeepSeek 建立联系。业务优势：为 DeepSeek 北京亦庄智算中心提供 AI 服务器集群及英伟达 H800 芯片与自研 ...

IT之家20 天

微软 rStar-Math 技术登场：小语言 AI 模型数学推理从“不及格”一跃 ...

IT之家1 月 11 日消息，微软亚洲研究院旗下数学和人工智能研究团队昨日（1 月 10 日）发布博文，针对小语言模型，设计并开发了 rStar-Math 技术，专门用于解决数学问题。和微软之前推出的 Phi-4 不同，rStar-Math 采用蒙特卡洛树搜索（Monte Carlo Tree Search）进行推理 ...

腾讯网14 天

阿里云通义开源全新数学推理过程奖励模型Qwen2.5-Math-PRM

多知1月17日消息，通义千问Qwen宣布开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，包括72B和7B两个版本，将提升大型语言模型(LLMs)在数学推理过程中的可靠性和可信度，自动识别推理过程中的错误，如计算或逻辑错误，这些错误可能导致不正确的结论，即使最终答案正确，也可能削弱模型推理过程的可信度。在识别推理错误步 ...

雷锋网8 小时

硅谷巨头要学会接受：「DeepSeek 现象」只是开始

根据媒体报道，DeepSeek V3 与 R1 发布后，Meta 在内的多家硅谷企业受到极大震撼，并开始质疑以往 OpenAI「大力出奇迹」的成功方法论，引起硅谷多家科技巨头的暴跌，比如英伟达一夜之间被干掉 4.3 万亿市值，相当于腾讯与美团两家中国互联网巨头加起来的市值。对于 DeepSeek 带来的震撼，业界不难联想到「漂亮国将出台一系列制裁政策」等等往日常规反应。

来自MSN4 天

全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻

编辑：编辑部 HYZ 【新智元导读】就在刚刚，网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现，只用强化学习，没有监督微调，30美元就能见证「啊哈时刻」！全球AI大模型，或许正在进入下一分水岭。

来自MSN9 天

如何评价 Kimi 发布的多模态推理模型 k1.5？

临近年关，国产大模型们不约而同地放出大招，简直是模型春晚，被大家调侃是不是发完这版急着回家过年。继k0-math数学模型、k1视觉思考模型之后，Kimi 公布了最新的多模态推理模型 ...

4 天

DeepSeek概念股大涨，但已有上市公司辟谣：与DeepSeek无合作

DeepSeek此前发布的开源新模型DeepSeek-R1“火”到海外之后，A股今日多只概念股开盘大涨。截至午间休市，浙江东方、华金资本、每日互动涨停，卓创资讯涨19.9%，拓尔思涨17.31%，金山办公涨3.28%。

1 天

为什么说DeepSeek的R1-Zero比R1更值得关注？

他认为，R1-Zero 之所以比 R1 更值得分析，是因为它完全依赖强化学习（RL），而不使用人类专家标注的监督微调（SFT），这表明在某些任务中，人类标注并非必要，且未来可能通过纯 RL 方法实现更广泛的推理能力。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果