12月20日·谷歌大模型迎来颠覆性突破,长上下文与注意力机制创新在即
12月20日·周六 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
谷歌大模型迎来颠覆性突破,长上下文与注意力机制创新在即
谷歌大模型领域即将迎来重大变革。据Google DeepMind的Gemini预训练负责人Sebastian Borgeaud透露,未来一年内,大模型预训练技术将在长上下文处理效率和上下文长度扩展两大方向取得重大突破。同时,谷歌在注意力机制方面也有了惊人发现,可能重塑未来的研究方向。Sebastian强调,Scaling Law并未消亡,而是正在演变。此外,谷歌正从单纯构建模型转向构建完整的系统,通过无数细微改进聚合实现颠覆性进步。展望未来,长上下文、高效检索与成本优化将成为AI发展的关键方向。来源:微信公众号【机器之心】
谷歌遭遇“算力饥荒”,CEO亲自协调芯片分配
谷歌内部出现了严重的“算力饥荒”,尽管计划投入930亿美元用于资本支出,但算力短缺问题依然严峻。为了协调有限的算力资源,谷歌成立了专门的高管委员会,由谷歌CEO Sundar Pichai亲自参与决策。算力分配涉及谷歌云、搜索业务以及DeepMind等核心部门,各方为争夺资源争执不下。谷歌的算力困境反映了AI时代对算力的巨大需求,以及科技巨头在资源分配上的艰难抉择。来源:微信公众号【机器之心】
中山大学推出SpatialDreamer,复杂空间推理性能大幅提升
中山大学等机构推出了SpatialDreamer,这是一个基于强化学习的框架,通过主动心理想象和空间推理,显著提升了复杂空间任务的性能。SpatialDreamer模拟人类主动探索、想象和推理的过程,解决了现有模型在视角变换等任务中的局限。实验结果表明,SpatialDreamer在多个空间推理基准上取得了显著提升,平均准确率提升超过55%。这一研究为人工智能的空间智能发展开辟了新路径。来源:微信公众号【机器之心】
潞晨科技尤洋:三类企业需要私有模型,日常办公无需过度投入
潞晨科技创始人尤洋在MEET2026大会上指出,只有三类企业需要行业模型或私有模型:传统大型企业、有海量数据的中小型企业以及颠覆行业的新兴公司。对于日常办公或主要处理文本数据的企业,直接调用现成的大模型API即可满足需求,无需构建私有模型。尤洋强调,企业部署大模型成功的关键在于最大化算力效率和提供微调SDK及低代码模板。潞晨科技通过微调SDK帮助开发者专注于模型与算法创新,降低部署成本。来源:微信公众号【量子位】
首个文本到3D生成RL范式诞生,攻克几何与物理合理性难题
由西北工业大学、北京大学等高校合作开展的研究团队成功开发了首个文本到3D生成的强化学习(RL)范式。该研究系统性地探索了RL在3D生成中的应用,提出了层次化RL范式Hi-GRPO,并实现了首个RL加持的Text-to-3D自回归模型AR3D-R1。实验表明,RL训练显著提升了模型在空间几何、一致性和物理可行性等维度的表现,表现出隐式3D推理能力的增强。这一成果为文本到3D生成领域带来了新的突破。来源:微信公众号【量子位】