3月6日·苹果发布最强M3 Ultra芯片,桌面超算可运行6000亿参数大模型
3月6日·周四 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
苹果发布最强M3 Ultra芯片,桌面超算可运行6000亿参数大模型
苹果公司近日发布了新款Mac Studio,搭载全新的M3 Ultra和M4 Max芯片。其中,M3 Ultra集成1840亿个晶体管,拥有32核CPU和80核GPU,性能是M1 Ultra的2.5倍,支持高达512GB统一内存。凭借强大的计算能力,M3 Ultra可直接在本地运行超过6000亿参数的语言模型,如DeepSeek-R1,成为全球首个能在家中运行满血版大模型的“桌面超算”。此外,苹果还发布了搭载M4芯片的MacBook Air,配备全新的天蓝色外观,支持AI任务加速。M3 Ultra和M4 Max的发布,标志着苹果在个人计算设备性能上的又一次飞跃,为AI和专业创作领域提供了强大的硬件支持。来源:微信公众号【新智元】

阿里开源QwQ-32B推理模型,320亿参数媲美671B DeepSeek-R1
阿里巴巴近日开源了通义千问QwQ-32B推理模型,仅用320亿参数便实现了与6710亿参数的DeepSeek-R1相当的性能,甚至在多项基准测试中超越了o1-mini。QwQ-32B具备强大的推理能力,能在消费级显卡或笔记本上流畅运行,极大地降低了大模型的使用门槛。该模型在数学、编程和通用能力方面表现出色,支持多种量化版本,最小版本仅需13GB显存。QwQ-32B的成功得益于阿里云团队采用的大规模强化学习技术,通过多阶段训练策略,使其在推理能力上达到行业领先水平。目前,QwQ-32B已全面开源,开发者可通过魔搭社区或Hugging Face免费下载和商用。来源:微信公众号【新智元】

360智脑开源Light-R1模型,低成本实现数学推理突破
360智脑近日开源了Light-R1-32B模型及相关训练数据和代码。该模型仅用12台H800 GPU训练6小时,成本约1000美元,从无长思维链的Qwen2.5-32B-Instruct出发,使用7万条数学数据训练,最终在AIME24测试基准中取得76.6分,显著超越DeepSeek-R1-Distill-Qwen-32B的72.6分。Light-R1-32B通过课程学习SFT+DPO训练,展现了强大的数学推理能力和泛化性。此次开源包括模型、训练框架、数据集和评测代码,为低成本快速训练领域专精推理模型提供了重要参考,进一步推动开源社区的发展。来源:微信公众号【机器之心】

腾讯图生视频开源,生成效果显著提升
腾讯近日开源了图生视频功能,进一步完善了其在视频生成领域的布局。图生视频能够将静态图片转化为动态视频,生成效果在画质、物体一致性和物理规律符合度上有显著提升。实测显示,该功能在还原运动员跳水、生成不存在的元素(如在草原上添加马匹)以及镜像场景的运动一致性等方面表现出色,但在细节处理上仍有提升空间。此外,图生视频还支持通过提示词控制视频内容,为用户提供了更高的创作自由度。目前,该功能已上线腾讯混元AI视频平台,用户可免费体验(有次数限制)。腾讯图生视频的开源,为视频生成领域带来了新的技术突破和应用可能性。来源:微信公众号【量子位】

智源发布BGE-VL,用1/70数据量实现多模态检索新突破
智源研究院联合多所高校推出了多模态向量模型BGE-VL,借助大规模合成数据集MegaPairs,在图文检索和组合图像检索等任务中取得了最佳效果。MegaPairs通过自动化挖掘和标注多模态数据,仅需1/70的传统数据量即可实现更优的训练效果,展现出卓越的可扩展性和数据质量。基于MegaPairs训练的BGE-VL模型在多个基准测试中表现优异,尤其在组合图像检索任务中大幅刷新了现有基准。此外,BGE-VL在零样本和微调场景下均表现出良好的泛化能力。智源团队表示,未来将继续探索MegaPairs在更多多模态检索场景中的应用,推动多模态检索技术的发展。相关数据、模型和代码已逐步开源。来源:微信公众号【量子位】
