8月7日·小红书开源首个多模态大模型 dots.vlm1,性能逼近 SOTA
8月7日·周四 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
小红书开源首个多模态大模型 dots.vlm1,性能逼近 SOTA
小红书人文智能实验室(hi lab)开源了其首个多模态大模型 dots.vlm1。该模型基于自研的 12 亿参数 NaViT 视觉编码器和 DeepSeek V3 大语言模型构建,具备强大的视觉理解和推理能力。在视觉评测集上,dots.vlm1 的表现已接近 Gemini 2.5 Pro 等领先模型,同时在纯文本任务中也保持竞争力。其在空间关系理解、复杂图表推理、OCR 识别、高考题评测、STEM 难题、写诗等多个方面表现出色,甚至能准确识别红绿色盲图和解决数独问题。dots.vlm1 的开源为多模态大模型的发展提供了新的参考,展现了小红书在 AI 技术领域的自研实力和对多模态技术的重视。来源:微信公众号【新智元】

GPT-5 内测泄露,推理能力惊人,智商或达 140
GPT-5 的内测信息被提前泄露,显示出其强大的推理能力。据泄露的基准测试结果显示,GPT-5 在 SimpleBench 上的得分高达 90%,高于之前的 62%,甚至超过了人类高中生的 85.7%。此外,GPT-5 的智商被认为可能接近 140,远超人类天才水平。在实际测试中,GPT-5 展示了从制作 GTA 克隆版到创建 3D 太阳系模拟器等多种复杂任务的能力。同时,OpenAI 还发布了 gpt-oss 模型,性能优异,直接登顶开源模型榜单。GPT-5 的发布有望进一步推动 AI 技术的发展和应用。来源:微信公众号【新智元】

即梦 AI 创作者成长计划升级,助力创作者全方位发展
即梦 AI 创作者成长计划全面升级,构建了覆盖潜力新星、进阶创作者和超级创作者三大阶段的扶持体系。该计划通过积分奖励、平台流量、官方项目、模型内测、商单接入等多维资源,为创作者提供全方位支持。创作者在不同阶段可获得相应的激励,如积分奖励、流量扶持、商单机会等。此外,即梦 AI 还通过与剪映、抖音等平台的无缝对接,强化了内容生态的协同性,帮助创作者更好地进行内容创作和分发。这一计划的升级旨在为 AI 创作者打造一个优质社区,推动 AI 内容创作的繁荣。来源:微信公众号【机器之心】

亚马逊云科技牵手 OpenAI,构建最强 AI 生态系统
亚马逊云科技宣布首次通过 Amazon Bedrock 和 Amazon SageMaker AI 平台支持 OpenAI 的新开源模型 gpt-oss。这一合作标志着亚马逊云科技在大模型云服务市场迈出了重要一步,打破了微软在 OpenAI 模型转售上的独占地位。同时,亚马逊云科技也上线了 Anthropic 的最新模型 Claude Opus 4.1,进一步丰富了其 AI 模型库。通过提供多样化的模型选择,亚马逊云科技践行了其 Choice Matters 战略,满足不同客户在生成式 AI 应用中的多样化需求,推动了开源模型的应用和 AI 生态系统的建设。来源:微信公众号【机器之心】

浙大校友开发 AI 眼镜,实现“隔空取物”功能
由浙江大学校友参与的研究团队开发了一种名为 Reality Proxy 的新技术,通过 AI 眼镜实现“隔空取物”的功能。用户只需通过手势和语音指令,即可选中现实世界中的任意物体,并进行多种交互操作,如浏览预览物体、多对象刷选、按属性过滤物体等。该技术通过创建现实物体的数字代理,解决了传统 XR 设备在选择物体时容易出错的问题,使用户能够更便捷地与现实世界中的物体进行交互。这一创新技术在日常信息检索、建筑导航、无人机控制等多个场景中展现出广泛的应用前景。来源:微信公众号【量子位】
