9月11日·百度文心X1.1能力大幅提升,多项实测表现惊艳
9月11日·周四 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
百度文心X1.1能力大幅提升,多项实测表现惊艳
百度在2025年9月9日的WAVE SUMMIT深度学习开发者大会上发布了文心大模型X1.1。相较于文心X1,新版本在事实性、指令遵循、智能体能力三大关键指标上显著提升,分别提升了34.8%、12.5%和9.6%。在多项基准测试中,文心X1.1的整体表现超越了DeepSeek R1-0528,部分指标甚至追上了GPT-5和Gemini 2.5 Pro等顶尖模型。文心X1.1通过基于知识一致性的强化学习技术,实现了“知识一致性”,在处理复杂指令和反事实信息时表现出色。此外,百度还升级发布了飞桨框架v3.2,进一步优化了大模型的训练和推理效率。文心X1.1的发布标志着百度在AI领域的技术实力再次提升,为开发者和企业提供了更强大的AI工具。来源:微信公众号【新智元】

昆仑万维方汉:通用Agent并非万能,垂直推理才是关键
昆仑万维董事长兼CEO方汉分享了企业三年四代“天工”大模型的演进故事。方汉指出,通用Agent并非万能解,垂直行业的深度推理数据才是构筑技术壁垒的关键。昆仑万维通过全球化布局与持续创新,形成了涵盖AGI与AIGC业务、信息分发与元宇宙业务、投资业务的“三驾马车”。其推出的天工超级智能体Skywork Super Agents在办公场景中表现出色,能够将传统办公软件的低效流程自动化,大幅提升工作效率。此外,昆仑万维还在音乐、视频、智能体等多模态领域不断创新,推出了多款具有代表性的产品,如音乐大模型Mureka和AI短剧模型SkyReels。方汉认为,情感陪伴等看似小众的需求,反而是最接近C端用户的真实痛点,未来AI的发展将更加注重用户体验和商业落地。来源:微信公众号【新智元】

甲骨文拿下OpenAI 3000亿美元大单,拉里·埃里森身家飙升
2025年9月11日,甲骨文发布了2026财年第一财季业绩,总营收149亿美元,同比增长约12%。受人工智能算力需求驱动,其云业务收入预计到2030财年将跃升至1440亿美元。甲骨文与OpenAI签署了一份价值3000亿美元的算力合同,这将是未来五年内生效的全球最大云计算合同。受此消息影响,甲骨文股价大涨35%,拉里·埃里森的身家一度超越埃隆·马斯克,成为全球首富。尽管OpenAI尚未盈利,但其CEO山姆·奥特曼的激进理念推动了大规模的AI基础设施建设。甲骨文计划在全国范围内建设数据中心,以满足OpenAI的算力需求。此次合作不仅为甲骨文带来了巨大的收入预期,也标志着云计算领域的新格局正在形成。来源:微信公众号【机器之心】

AgentGym-RL发布,开创智能体训练新范式
复旦大学、创智、字节跳动联合发布了AgentGym-RL,这是一个多环境强化学习智能体训练框架。该框架是首个无需监督微调、具备统一端到端架构、支持交互式多轮训练的LLM智能体强化学习框架。AgentGym-RL通过扩展环境交互(Scaling Interaction)和ScalingInter-RL交互轮次扩展策略,显著提升了智能体在复杂任务中的表现。实验表明,7B参数的模型在经过AgentGym-RL训练后,性能超越了100B以上的大型开源模型,甚至追平了OpenAI o3、谷歌Gemini 2.5 Pro等顶尖商业模型。AgentGym-RL的发布为LLM智能体的强化学习提供了全新的解决方案,推动了人工智能从“数据密集型”向“经验密集型”转型。该框架已全面开源,有望成为智能体训练的新标准。来源:微信公众号【机器之心】

中国电信发布星辰超级智能体,推动产业智能升级
中国电信天翼AI发布了星辰超级智能体,该智能体基于中国电信自研的“星辰大模型”技术底座,具备全模态、全尺寸、全国产的特点,支持复杂推理和记忆能力增强。星辰超级智能体能够完成各类复杂任务,如数据分析、代码编写等,并具备安全保障能力。其核心优势在于能够深度嵌入企业内部系统,提升企业生产力。中国电信通过内部落地案例展示了智能体的实际效果,如客服投诉工单的自动预处理等。星辰超级智能体的发布标志着央企在超级智能体领域的重大突破,为产业智能升级提供了有力支持。未来,中国电信将继续迭代星辰大模型,推动智能体在更多行业的落地应用。来源:微信公众号【量子位】
