transformers - 搜索 News

2 天

AAAI 2025 | 大模型会组合关系推理吗？打开黑盒，窥探Transformer脑回路

这项研究首次明确指出了 LLMs 在组合关系推理任务中的核心缺陷，并通过实验揭示了模型内部的关键推理机制。这不仅加深了我们对 LLMs 工作原理的理解，也为模型改进提供了启发和洞见。例如： ...

on.cc東網2 天

铜锣湾变形金刚主题餐厅撤出香港去年传寻求顶租

座落铜锣湾罗素街复式地铺的变形金刚主题餐厅“Transformers The ARK”周三(5日)，在网上社交媒体发文公布，将于2月8日完成在本港的任务，将于今年5月搬至深圳罗湖区一个广场内，意味该公司将撤出香港市场。

来自MSN3 天

如何理解 Transformers 中 FFNs 的作用？

FFN在Transformer里面主要是对多头注意力矩阵升维，非线性过滤，然后再降回原来的维度。这个通常的比喻是：FFN就像个人的思考空间—— Attention Layer帮助模型正确的分配注意力，然后FFN 帮助模型仔细的思考，提取更加抽象的特征。这个比喻很好很形象，听到这儿往往会感觉恍然大悟，然后感慨模型设计精妙，唯一的问题是什么实质都没有解释。

腾讯网6 天

ICLR 2025 | 极性感知线性注意力！哈工深张正团队提出PolaFormer视觉基础 ...

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

51CTO14 天

Hugging Face 最小 AI 视觉语言模型登场：2.56 亿参数，内存低于 1GB PC 也 ...

Hugging Face 平台1 月 23 日发布博文，宣布推出 SmolVLM-256M-Instruct 和 SmolVLM-500M-Instruct 两款轻量级 AI 模型，在 AI 算力有限的设备上，最大限度发挥其算力性能。 1 月 24 ...

16 天

降本75%提效41%！清华千诀科技团队率先实现类脑大模型规模部署！

来自清华大学与千诀科技的研究团队基于在全球顶级AI会议ICLR2024上发布突破性成果，首次实现了多模态大模型的类脑化，率先实现了业界首个可规模部署的类脑计算框架！这一技术创新不仅大幅降低了AI大模型75%的部署成本和能耗，更令人瞩目的是其广泛的硬件兼容性 - 可同时支持NVIDIA GPU、华为昇腾、灵汐等各类主流计算平台，为企业快速低成本落地具身智能应用开辟了全新途径！

17 天

除了神经网络渲染、DLSS 4之外还有什么？再探再报NVIDIA Blackwell GPU

我们知道，在借助DLSS之后，玩家还需要利用NVIDIA Reflex来降低系统延迟，从而让玩家的实际操作更为连贯。而多帧生成技术可以在帧生成的基础之上对帧率再度进行大幅度提升，也势必会让系统延迟有所提升，因此NVIDIA推出Reflex 2技术，并首次采用了Frame Warp技术从而让系统延迟得以进一步降低，让玩家们的实际操作更为跟手。

24 天

山西云时代发布农业土地覆盖时空语义分割专利，开启智慧城市新篇章

2025年1月15日,金融界报道，令人瞩目的消息传来：山西云时代智慧城市技术发展有限公司成功获得了一项名为"一种基于Transformers-MulMLA的农业土地覆盖时空语义分割方法"的专利，授权公告号为CN114998361B，申请日期追溯至2022年6月。这项技术的出现，标志着在农业领域土壤资源管理和监测发挥着革命性作用。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果