3月6日·苹果发布最强M3 Ultra芯片，桌面超算可运行6000亿参数大模型

AI资讯速递1年前 (2025)发布 FuturX-Editor

780 0 0

3月6日·周四 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

苹果发布最强M3 Ultra芯片，桌面超算可运行6000亿参数大模型

苹果公司近日发布了新款Mac Studio，搭载全新的M3 Ultra和M4 Max芯片。其中，M3 Ultra集成1840亿个晶体管，拥有32核CPU和80核GPU，性能是M1 Ultra的2.5倍，支持高达512GB统一内存。凭借强大的计算能力，M3 Ultra可直接在本地运行超过6000亿参数的语言模型，如DeepSeek-R1，成为全球首个能在家中运行满血版大模型的“桌面超算”。此外，苹果还发布了搭载M4芯片的MacBook Air，配备全新的天蓝色外观，支持AI任务加速。M3 Ultra和M4 Max的发布，标志着苹果在个人计算设备性能上的又一次飞跃，为AI和专业创作领域提供了强大的硬件支持。来源：微信公众号【新智元】

阿里开源QwQ-32B推理模型，320亿参数媲美671B DeepSeek-R1

阿里巴巴近日开源了通义千问QwQ-32B 推理模型，仅用320亿参数便实现了与6710亿参数的DeepSeek-R1相当的性能，甚至在多项基准测试中超越了o1-mini。QwQ-32B具备强大的推理能力，能在消费级显卡或笔记本上流畅运行，极大地降低了大模型的使用门槛。该模型在数学、编程和通用能力方面表现出色，支持多种量化版本，最小版本仅需13GB显存。QwQ-32B的成功得益于阿里云团队采用的大规模强化学习技术，通过多阶段训练策略，使其在推理能力上达到行业领先水平。目前，QwQ-32B已全面开源，开发者可通过魔搭社区或Hugging Face免费下载和商用。来源：微信公众号【新智元】

360智脑开源Light-R1模型，低成本实现数学推理突破

360智脑近日开源了Light-R1-32B模型及相关训练数据和代码。该模型仅用12台H800 GPU训练6小时，成本约1000美元，从无长思维链的Qwen2.5-32B-Instruct出发，使用7万条数学数据训练，最终在AIME24测试基准中取得76.6分，显著超越DeepSeek-R1-Distill-Qwen-32B的72.6分。Light-R1-32B通过课程学习SFT+DPO训练，展现了强大的数学推理能力和泛化性。此次开源包括模型、训练框架、数据集和评测代码，为低成本快速训练领域专精推理模型提供了重要参考，进一步推动开源社区的发展。来源：微信公众号【机器之心】

腾讯图生视频开源，生成效果显著提升

腾讯近日开源了图生视频功能，进一步完善了其在视频生成领域的布局。图生视频能够将静态图片转化为动态视频，生成效果在画质、物体一致性和物理规律符合度上有显著提升。实测显示，该功能在还原运动员跳水、生成不存在的元素（如在草原上添加马匹）以及镜像场景的运动一致性等方面表现出色，但在细节处理上仍有提升空间。此外，图生视频还支持通过提示词控制视频内容，为用户提供了更高的创作自由度。目前，该功能已上线腾讯混元AI视频平台，用户可免费体验（有次数限制）。腾讯图生视频的开源，为视频生成领域带来了新的技术突破和应用可能性。来源：微信公众号【量子位】

智源发布BGE-VL，用1/70数据量实现多模态检索新突破

智源研究院联合多所高校推出了多模态向量模型BGE-VL，借助大规模合成数据集MegaPairs，在图文检索和组合图像检索等任务中取得了最佳效果。MegaPairs通过自动化挖掘和标注多模态数据，仅需1/70的传统数据量即可实现更优的训练效果，展现出卓越的可扩展性和数据质量。基于MegaPairs训练的BGE-VL模型在多个基准测试中表现优异，尤其在组合图像检索任务中大幅刷新了现有基准。此外，BGE-VL在零样本和微调场景下均表现出良好的泛化能力。智源团队表示，未来将继续探索MegaPairs在更多多模态检索场景中的应用，推动多模态检索技术的发展。相关数据、模型和代码已逐步开源。来源：微信公众号【量子位】