搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
15 天
阿里云通义Qwen2.5-Math-PRM:7B模型超越GPT-4o,数学推理新突破
1月16日消息,阿里云通义团队发布了新一代数学推理过程奖励模型——Qwen2.5-Math-PRM。该模型引入了72B与7B两种尺寸,其在推理过程中的表现显著优于现有的开源模型,尤其在推理错误识别方面,7B版本的性能甚至超过了闭源的GPT-4o。这一创新不仅为智能推理提供了新的可能性,也为相关领域的技术进步注入了新的活力。 Qwen2.5-Math-PRM模型的设计旨在解决大型语言模型在处理推理时 ...
18 小时
科学家热议DeepSeek-R1:一款颠覆性的开源语言模型
近期,《Nature》杂志发表了一篇引人注目的文章,介绍了由中国初创公司DeepSeek研发的语言模型DeepSeek-R1。该模型的推出引发了科学界的广泛关注与热议,许多研究人员认为它将成为OpenAI的o1等推理模型在经济效益和开放性上的有力竞争 ...
15 天
阿里云通义推出Qwen2.5-Math-PRM模型与首个推理评估标准
在科技快速发展的今天,阿里云再一次为人工智能领域推陈出新。1月16日,钛媒体App报道了阿里云通义开源了全新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一模型的推出,标志着在72B与7B尺寸下,其性能远超同类开源过程奖励模型。
腾讯网
2 天
当AI成本降低30倍:DeepSeek-R1如何重塑AI行业
自 DeepSeek-R1 发布以来,其出色的推理能力和相对低廉的训练成本在业界引发强烈反响。它让人们意识到,高性能 AI 模型的开发,也许不必依赖于昂贵的算力和海量的数据。R1 不仅在性能上接近 OpenAI 的 ...
13 小时
DeepSeek相关概念股
业务优势:A 股中较早参与 DeepSeek 天使轮投资的公司,可分享 DeepSeek 成长带来的红利,2023 年创投业务利润贡献占比较高。 业务优势:珠海国资旗下投资平台,通过华金领越基金参与 DeepSeek 的 Pre - A 轮融资,借助资本力量与 DeepSeek 建立联系。 业务优势:为 DeepSeek 北京亦庄智算中心提供 AI 服务器集群及英伟达 H800 芯片与自研 ...
IT之家
20 天
微软 rStar-Math 技术登场:小语言 AI 模型数学推理从“不及格”一跃 ...
IT之家1 月 11 日消息,微软亚洲研究院旗下数学和人工智能研究团队昨日(1 月 10 日)发布博文,针对小语言模型,设计并开发了 rStar-Math 技术,专门用于解决数学问题。 和微软之前推出的 Phi-4 不同,rStar-Math 采用蒙特卡洛树搜索(Monte Carlo Tree Search)进行推理 ...
腾讯网
14 天
阿里云通义开源全新数学推理过程奖励模型Qwen2.5-Math-PRM
多知1月17日消息,通义千问Qwen宣布开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,包括72B和7B两个版本,将提升大型语言模型(LLMs)在数学推理过程中的可靠性和可信度,自动识别推理过程中的错误,如计算或逻辑错误,这些错误可能导致不正确的结论,即使最终答案正确,也可能削弱模型推理过程的可信度。在识别推理错误步 ...
雷锋网
8 小时
硅谷巨头要学会接受:「DeepSeek 现象」只是开始
根据媒体报道,DeepSeek V3 与 R1 发布后,Meta 在内的多家硅谷企业受到极大震撼,并开始质疑以往 OpenAI「大力出奇迹」的成功方法论,引起硅谷多家科技巨头的暴跌,比如英伟达一夜之间被干掉 4.3 万亿市值,相当于腾讯与美团两家中国互联网巨头加起来的市值。 对于 DeepSeek 带来的震撼,业界不难联想到「漂亮国将出台一系列制裁政策」等等往日常规反应。
来自MSN
4 天
全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
编辑:编辑部 HYZ 【新智元导读】就在刚刚,网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现,只用强化学习,没有监督微调,30美元就能见证「啊哈时刻」!全球AI大模型,或许正在进入下一分水岭。
来自MSN
9 天
如何评价 Kimi 发布的多模态推理模型 k1.5?
临近年关,国产大模型们不约而同地放出大招,简直是模型春晚,被大家调侃是不是发完这版急着回家过年。 继k0-math数学模型、k1视觉思考模型之后,Kimi 公布了最新的多模态推理模型 ...
4 天
DeepSeek概念股大涨,但已有上市公司辟谣:与DeepSeek无合作
DeepSeek此前发布的开源新模型DeepSeek-R1“火”到海外之后,A股今日多只概念股开盘大涨。截至午间休市,浙江东方、华金资本、每日互动涨停,卓创资讯涨19.9%,拓尔思涨17.31%,金山办公涨3.28%。
1 天
为什么说DeepSeek的R1-Zero比R1更值得关注?
他认为,R1-Zero 之所以比 R1 更值得分析,是因为它完全依赖强化学习(RL),而不使用人类专家标注的监督微调(SFT),这表明在某些任务中,人类标注并非必要,且未来可能通过纯 RL 方法实现更广泛的推理能力。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈