8月26日·面壁智能发布MiniCPM-V 4.5,8B参数模型实现高刷视频理解

8月26日·周二  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

面壁智能发布MiniCPM-V 4.5,8B参数模型实现高刷视频理解

面壁智能开源的MiniCPM-V 4.5多模态端侧模型,凭借8B参数量,在单图、高刷视频理解、长视频理解、OCR、复杂文档解析等多个领域达到同级SOTA水平,甚至超越了参数量更大的模型。该模型通过创新的3D-Resampler结构,实现高密度视频压缩,可处理更多视频帧,提升视频理解能力。同时,它支持常规模式和深度思考模式,满足不同场景需求。MiniCPM-V 4.5在实际应用中表现出色,如高刷视频中快速切换画面的文字识别、复杂文档中的结构化信息提取等。其端侧部署友好,显存占用低,推理速度快,为车机、机器人等应用场景提供了高效、低成本的解决方案。来源:微信公众号【新智元】

8月26日·面壁智能发布MiniCPM-V 4.5,8B参数模型实现高刷视频理解

291个LLM软工Benchmark综述,为AI4SE社区提供评估指南

浙江大学、新加坡管理大学、渥太华大学等机构的研究团队,首次对291个用于评估大语言模型在软件工程任务中的Benchmark进行了系统综述。研究发现,自2022年起Benchmark数量快速增长,Python在评估Benchmark中占比最高。Benchmark覆盖需求与设计、编码辅助、软件测试、AIOps、软件维护、质量管理六大任务,其中编码辅助和质量管理类任务占比最多。当前Benchmark存在任务定义模糊、规模受限、泛化能力不足等挑战。未来改进方向包括多维评估、跨语言跨任务、贴近真实场景等。该研究为AI4SE社区提供了详细的评估工具和方法指南。来源:微信公众号【新智元

8月26日·面壁智能发布MiniCPM-V 4.5,8B参数模型实现高刷视频理解

DeepSeek V3.1出现“极”字Bug,引发社区热议

DeepSeek最新的V3.1模型上线不到一周,就被发现存在一个离奇的Bug:某些输出token会被随机替换为“极”字,甚至在自我修复时也无法幸免。用户在调用该模型进行物理试卷整理、代码生成等任务时,均出现了类似问题。此外,该模型还存在多语言混用的问题。社区猜测,该问题可能是由于数据污染导致的,如预训练数据未清洗干净,模型将“极”字当作某种终止符或语言切换标记使用。这一事件提醒模型开发者,数据质量是决定AI模型是否“行为异常”的关键因素。来源:微信公众号【机器之心

8月26日·面壁智能发布MiniCPM-V 4.5,8B参数模型实现高刷视频理解

英伟达本周一发布了新一代机器人专用芯片Jetson Thor。与上一代Jetson Orin相比,Jetson Thor的AI计算能力提升了7.5倍,最高达到2070 FP4 TFLOPS,功耗为130W,能效是上一代的3.5倍。其内存容量提升两倍至128G,显存带宽为273GB/s。Jetson Thor专为生成式AI模型的推理打造,可支持下一代“物理AI”智能体,包括大型transformer模型、视觉语言模型等。该芯片的发布为具身智能的发展提供了强大的算力支持,目前已有多家机器人公司宣布将搭载该芯片。来源:微信公众号【机器之心

8月26日·面壁智能发布MiniCPM-V 4.5,8B参数模型实现高刷视频理解

中兴Mariana突破GPU显存壁垒,提升大模型推理效率

中兴通讯和华东师范大学联合提出的Mariana分布式共享KV存储技术,通过细粒度并发控制方案、定制化的数据布局和自适应缓存策略,解决了高并发、热点倾斜、延迟敏感场景下KV索引的性能瓶颈。Mariana支持大容量存储,具有高吞吐、低延迟读和良好的水平扩展能力,能够显著提升大模型的推理性能。其设计理念与底层硬件解耦,可平滑迁移到CXL硬件生态,为构建下一代大模型推理基础设施提供了新的思路。来源:微信公众号【量子位】

8月26日·面壁智能发布MiniCPM-V 4.5,8B参数模型实现高刷视频理解
© 版权声明

相关文章

暂无评论

暂无评论...