据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力设计。特别是在需要输出8ktokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型研究的 ...
Longpre,一位研究员指出,AI模型能力的提升在于数据的多样性与规模。而虽然技术进步不断,但数据收集的规范化进程却显得滞后。根据DPI团队的报告,现有的AI训练数据集极大程度上依赖于互联网,而互联网数据的控制权在少数科技巨头手中,尤其是谷歌和其母公司Alphabet。GPT-3、Gemini等大型AI模型的训练,尤其是在图像和视频生成领域,令这一问题愈发突出。
报告显示,DeepSeek聊天机器人在回应新闻相关提示词(prompt)时,有30%的时间会重复虚假声明,有53%的时间会给出模煳或无用的答案,失效率高达83%。
【环球网科技综合报道】1月30日消息,据《福布斯》报道,近日海外知名博主马奎斯·布朗利在其社交平台上公开展示了三星的首款Android XR头戴设备,这也是首款Android XR设备,引发了业界广泛关注。据悉,这也是自三星在本月早些时候的 ...
DeepSeek最新AI模型“价廉物美”,引发科技界震荡。但OpenAI本周三称,有证据表明DeepSeek使用OpenAI专有模型来训练自己的模型,并暗示这可能违反了OpenAI服务条款。美商务部长提名人卢特尼克指责DeepSeek似乎盗用了美国的人工智能技术。新闻可靠性评级机构NewsGuard 称,Deepseek-V3识别假新闻只有17%的准确率。
1月17日,中科院物理所在江苏省溧阳市举办了“天目杯”理论物理竞赛。我们命题组完成了这份试卷的出题工作。七道题除一道外,都不是从现成的题库或考题中改编节选的,我们三个对这套试卷比较满意,觉得它既不像传统考试题一样盯着个别知识点考,也不像高中竞赛题一样需要很多技巧和熟练度,而更像实际科研中碰到的具体技术问题。竞赛前的某天,我们和几个朋友一起吃饭,其中一位AI的重度用户知道了我们出了这份题,就问有没有 ...
【文/观察者网 熊超然】连日来,来自中国的人工智能(AI)初创企业深度求索(DeepSeek)登上各大全球媒体头版,美国总统特朗普称“这应该为美国行业敲响警钟”。 据美国消费者新闻与商业频道(CNBC)当地时间1月29日报道,美国AI初创公司Anthropic首席执行官达里奥·阿莫迪(Dario Amodei)当天在一篇博客文章中表示,他并不认为中国的DeepSeek是“对手”,但他认为,在AI领 ...
加利福尼亚州圣克拉拉 - 全球加速计算领导者NVIDIA Corporation (NASDAQ: NVDA )宣布将于2月26日 (星期三)举行电话会议,讨论截至2025年1月26日的第四季度和2025财年财务业绩。根据 InvestingPro ...
鞭牛士报道,1月30日消息,据CNBC报道,Anthropic 首席执行官达里奥·阿莫迪 (Dario Amodei)周三在一篇博客文章中表示,他并不将中国的 DeepSeek“视为对手”,但他认为,在人工智能方面,出口管制比以往任何时候都更加重要。
北京时间1月29日凌晨1点半,阿里云通义千问旗舰版模型Qwen2.5-Max正式升级发布。据其介绍,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果,预训练数据超过20万亿tokens,展现出极强劲的综合性能,在多项公开主流模型评 ...
谷歌旗下自动驾驶公司Waymo将于2025年在10个新城市进行测试,首先是拉斯维加斯和圣地亚哥。