10月1日·OpenAI推出Sora 2,视频生成领域迎来新突破
10月1日·周三 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
OpenAI推出Sora 2,视频生成领域迎来新突破
OpenAI于2025年10月1日发布了Sora 2,并推出了基于该技术的iOS社交应用“Sora”。Sora 2在视频生成领域取得了显著进展,其物理准确性和真实感优于以往系统,能够实现复杂的动作和场景模拟,如奥运体操动作、在桨板上完成后空翻等。此外,Sora 2还具备同步对话和音效能力,支持将现实元素注入生成场景。OpenAI为该应用开发了新的推荐算法,注重用户身心健康,避免成瘾问题。Sora 2被认为是视频领域的GPT-3.5时刻,标志着视频生成技术的重大进步。来源:微信公众号【机器之心】

强化学习在大语言模型全周期的全面综述发布
复旦大学、同济大学、兰卡斯特大学及香港中文大学等机构的研究者联合发布了题为“Reinforcement Learning Meets Large Language Models: A Survey of Advancements and Applications Across the LLM Lifecycle”的综述论文。该论文系统性回顾了强化学习在大语言模型全生命周期中的应用,涵盖预训练、对齐微调与强化推理等阶段,整理了相关数据集、评估基准及开源工具。论文还重点探讨了基于可验证奖励的强化学习技术(RLVR),分析了其在提升模型推理稳定性与准确性方面的应用,并指出当前强化学习在大语言模型中应用面临的挑战,如系统规模可扩展性、训练稳定性、奖励设计等问题。来源:微信公众号【机器之心】

PromptCoT 2.0:任务合成推动大模型发展
蚂蚁通用人工智能中心自然语言组联合香港大学自然语言组推出了PromptCoT 2.0框架,旨在通过任务合成推动大模型发展。该框架采用期望最大化(EM)循环取代人工设计,生成更具挑战性和多样化的合成问题,大幅提升弱模型的数学与代码推理能力,甚至在强推理模型上也取得了新的SOTA结果。PromptCoT 2.0开源了4.77M个合成问题及教师监督,为社区提供了丰富的训练资源。未来,该团队计划将任务合成拓展到Agentic环境合成、多模态任务合成等领域,进一步探索大模型的发展方向。来源:微信公众号【量子位】

PXDesign:蛋白设计效率大幅提升
字节跳动Seed团队的Protenix项目组提出了一种名为PXDesign的可扩展蛋白设计方法。PXDesign采用“生成+过滤”的组合策略,在24小时内可生成数百个高质量候选蛋白,生成效率较主流方法提升约10倍,湿实验成功率在多个靶点上达到20%–73%,远超DeepMind的AlphaProteo。该方法基于Diffusion和Hallucination两种技术路线,其中PXDesign-d在生成质量、通量和结构多样性方面表现最佳。Protenix团队还推出了PXDesign Server网页服务和PXDesignBench评估工具箱,为蛋白设计提供了高效、便捷的解决方案,推动蛋白设计走向开放应用。来源:微信公众号【量子位】

EgoTwin:首次实现第一视角视频与人体动作同步生成
新加坡国立大学、南洋理工大学、香港科技大学与上海人工智能实验室联合发布了EgoTwin框架,首次实现了第一视角视频与人体动作的联合生成,攻克了视角-动作对齐与因果耦合两大技术难题。EgoTwin基于扩散Transformer架构,采用“文本-视频-动作”三模态联合生成框架,通过以头部为中心的动作表征、控制论启发的交互机制和异步扩散训练策略等创新设计,实现了视频与动作的精准对齐和因果连贯生成。该框架在实验中表现出色,为可穿戴计算、AR及具身智能等领域提供了新的技术支撑。来源:微信公众号【量子位】
