1月27日·杨植麟亲自开源Kimi K2.5:国产万亿MoE模型再刷SOTA
1月27日·周二 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
杨植麟亲自开源Kimi K2.5:国产万亿MoE模型再刷SOTA
月之暗面创始人杨植麟首次出镜发布Kimi K2.5,开源1万亿参数MoE基础模型,同步上线Kimi Code编程助手。新模型在HLE、BrowseComp等Agent评测中拿下SOTA,视觉理解支持视频输入,Coding能力在SWE-bench Verified达76.8%,成本仅为GPT-5.2-xhigh几分之一。K2.5采用“All in one”统一架构,并引入PARL并行强化学习,可调度最多100个Agent分身,4.5倍速完成1500次工具调用,把原本需数天的研究综述压缩到十几分钟。面向设计师与开发者,Kimi Code支持截图/录屏转代码、自动部署,已集成VSCode、Cursor等IDE。官方表示,中国开源模型正成为新标准,K2.5为Agent协作与代码生成树立新标杆。来源:微信公众号【机器之心】
蚂蚁灵波首秀开源LingBot-Depth,让机器人“看清”透明玻璃
蚂蚁灵波科技首次公开具身智能成果,发布开源高精度感知模型LingBot-Depth,专门解决RGB-D相机在透明、反光材质前深度失真的痛点。团队构建1000万条“不完美”深度数据,提出掩码深度建模(MDM),把传感器自然产生的空洞当作学习信号,用ViT-Large双分支编码RGB与深度,在玻璃、镜面、不锈钢等场景补全稠密深度。实验显示,模型在iBims、NYUv2等数据集深度补全精度领先,RMSE最高降30%;接入SpatialTrackerV2后,相机轨迹更平滑,真实机械臂+灵巧手对透明玻璃杯、钢杯的抓取成功率大幅提升。LingBot-Depth无需更换硬件即可嵌入现有系统,已在HuggingFace开源权重与代码,并提供轻量化版本,助力机器人、AR/VR、3D打印等多场景落地。来源:微信公众号【机器之心】
境电商版“Sora”现身:Hilight AI用Multi-Agent 20分钟生成爆款带货视频
营赛AI发布全球首个AI原生电商视频Multi-Agent系统Hilight AI,被业界称为“跨境电商版Sora”。用户仅需粘贴商品链接或上传图片,20-30分钟即可获得一条可直接投放的15-60秒营销视频,成本最低3元。系统模仿4A公司流程,设10+Agent三层协作:理解与洞察层拆解卖点,创意结构层写脚本、拆分镜,执行成片层剪辑渲染,质检Agent循环打回修改,确保跨帧一致性、口唇同步及商品特征零走样。Hilight自研电商知识图谱与爆款RAG库,支持多语种、多平台比例与BGM,首帧图生视频锁定SKU细节,自动修复穿模、漂移等问题。官方实测亚马逊耳机链接,生成视频动作流畅、灯光质感媲美实拍。产品已开启公测,新用户送8888星光点,邀请好友再得1888点,目标以数据驱动替代经验驱动,帮助卖家抓住TikTok流量窗口。来源:微信公众号【机器之心】
3D版“Nano Banana”来了!Hyper3D Rodin Gen-2 Edit开启自然语言修模时代
中国团队Hyper3D率先推出Rodin Gen-2 Edit,把3D生成带入“可编辑”时代。用户框选模型局部并输入文字,即可在原有几何基础上完成部件增删改,无需反复抽卡。该功能支持平台自产及第三方模型导入,采用原生3D大模型CLAY与ControlNet精准控形,结合BANG递归分件与Smart Low-poly,实现结构自然衔接、拓扑干净,可直接对接Blender、Maya、Unity及3D打印流程。示例中,仅一句“双手改成大炮”,机甲手臂秒变双炮,其余部分完好保留。Hyper3D已服务头部UGC游戏与拓竹打印,获SIGGRAPH 2025最佳论文的CAST技术则瞄准完整3D场景生成。Rodin Gen-2 Edit目前免费体验,官方称3D工作流终于补齐“生成→可控→可编辑”闭环,为游戏、影视、工业设计师节省大量手动返工时间。来源:微信公众号【机器之心】
Google两日两动作:收购3D公司、联手Epic,3D Nano Banana进入倒计时
Google在48小时内连续出手:23日宣布收购3D生成公司Common Sense Machines,团队整体并入DeepMind;26日又与Epic Games达成战略合作,拟将3D创作能力引入Unreal生态。市场普遍认为,这两大动作标志着搜索巨头正加速打造“3D版Nano Banana”,即可实时生成、即刻编辑的通用3D资产引擎。Common Sense Machines擅长将2D图像与文本转化为带纹理、可动画的3D模型,其算法已用于美国军工及元宇宙项目;Epic则拥有成熟的实时渲染与UGC平台。分析师指出,Google有望在年内推出集成于Bard、Android与YouTube的3D生成功能,让创作者像发推文一样“一键发3D”。国内Hyper3D等团队已抢先落地商用编辑工具,中美在3D AIGC赛道竞争进入白热化阶段。来源:微信公众号【量子位】