8月26日·面壁智能发布MiniCPM-V 4.5，8B参数模型实现高刷视频理解

1,245 0 0

8月26日·周二 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

面壁智能发布MiniCPM-V 4.5，8B参数模型实现高刷视频理解

面壁智能开源的MiniCPM-V 4.5多模态端侧模型，凭借8B参数量，在单图、高刷视频理解、长视频理解、OCR、复杂文档解析等多个领域达到同级SOTA水平，甚至超越了参数量更大的模型。该模型通过创新的3D-Resampler结构，实现高密度视频压缩，可处理更多视频帧，提升视频理解能力。同时，它支持常规模式和深度思考模式，满足不同场景需求。MiniCPM-V 4.5在实际应用中表现出色，如高刷视频中快速切换画面的文字识别、复杂文档中的结构化信息提取等。其端侧部署友好，显存占用低，推理速度快，为车机、机器人等应用场景提供了高效、低成本的解决方案。来源：微信公众号【新智元】

291个LLM软工Benchmark综述，为AI4SE社区提供评估指南

浙江大学、新加坡管理大学、渥太华大学等机构的研究团队，首次对291个用于评估大语言模型在软件工程任务中的Benchmark进行了系统综述。研究发现，自2022年起Benchmark数量快速增长，Python在评估Benchmark中占比最高。Benchmark覆盖需求与设计、编码辅助、软件测试、AIOps、软件维护、质量管理六大任务，其中编码辅助和质量管理类任务占比最多。当前Benchmark存在任务定义模糊、规模受限、泛化能力不足等挑战。未来改进方向包括多维评估、跨语言跨任务、贴近真实场景等。该研究为AI4SE社区提供了详细的评估工具和方法指南。来源：微信公众号【新智元】

DeepSeek V3.1出现“极”字Bug，引发社区热议

DeepSeek最新的V3.1模型上线不到一周，就被发现存在一个离奇的Bug：某些输出token会被随机替换为“极”字，甚至在自我修复时也无法幸免。用户在调用该模型进行物理试卷整理、代码生成等任务时，均出现了类似问题。此外，该模型还存在多语言混用的问题。社区猜测，该问题可能是由于数据污染导致的，如预训练数据未清洗干净，模型将“极”字当作某种终止符或语言切换标记使用。这一事件提醒模型开发者，数据质量是决定AI模型是否“行为异常”的关键因素。来源：微信公众号【机器之心】

英伟达发布Jetson Thor，AI算力提升7.5倍

英伟达本周一发布了新一代机器人专用芯片Jetson Thor。与上一代Jetson Orin相比，Jetson Thor的AI计算能力提升了7.5倍，最高达到2070 FP4 TFLOPS，功耗为130W，能效是上一代的3.5倍。其内存容量提升两倍至128G，显存带宽为273GB/s。Jetson Thor专为生成式AI模型的推理打造，可支持下一代“物理AI”智能体，包括大型transformer模型、视觉语言模型等。该芯片的发布为具身智能的发展提供了强大的算力支持，目前已有多家机器人公司宣布将搭载该芯片。来源：微信公众号【机器之心】

中兴Mariana突破GPU显存壁垒，提升大模型推理效率

中兴通讯和华东师范大学联合提出的Mariana分布式共享KV存储技术，通过细粒度并发控制方案、定制化的数据布局和自适应缓存策略，解决了高并发、热点倾斜、延迟敏感场景下KV索引的性能瓶颈。Mariana支持大容量存储，具有高吞吐、低延迟读和良好的水平扩展能力，能够显著提升大模型的推理性能。其设计理念与底层硬件解耦，可平滑迁移到CXL硬件生态，为构建下一代大模型推理基础设施提供了新的思路。来源：微信公众号【量子位】