慢感知团队 投稿量子位 | 公众号 QbitAI 视觉版o1的初步探索,阶跃星辰&北航团队推出“慢感知”。 研究人员认为:1)目前多模领域o1-like的模型,主要关注文本推理,对视觉感知的关注不够。2)精细/深度感知是一个复杂任务,且是未来做视觉推理的重要基础。 而思路之一是如何把感知做“慢”,即通过某种任务拆解(step-by-step)实现感知层面的inference time scalin ...