4月7日·Llama 4训练作弊风波致高管辞职，代码实测表现不佳引争议

660 0 0

4月7日·周一 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

Llama 4训练作弊风波致高管辞职，代码实测表现不佳引争议

Meta公司推出的Llama 4模型陷入丑闻风波。据内部员工爆料，Llama 4在训练过程中被指存在作弊行为，高层曾建议将多个benchmark测试集混入训练数据，以短期提升指标。该员工无法接受这种做法，愤而辞职，并要求不要在Llama 4技术报告中挂名。此外，Llama 4开源首日，代码能力在全网实测中表现极差，与顶尖大模型实力悬殊，甚至在LM arena上存在过拟合现象，有作弊嫌疑。网友实测也显示其在编程任务等多方面表现不如其他模型，引发诸多不满。来源：微信公众号【新智元】

LeCun新作Web-SSL：多模态训练无需语言监督，性能媲美CLIP

LeCun与谢赛宁等研究人员发布了Web-SSL模型，验证了自监督学习（SSL）在多模态任务中的潜力。该研究通过在大规模网页图像数据上训练，证明了在不依赖语言监督的情况下，视觉SSL模型能够媲美甚至超越CLIP模型。Web-SSL模型系列（1B-7B参数）在视觉问答（VQA）任务中表现出色，尤其在OCR和图表理解任务上，展现了与CLIP相当的性能。研究还发现，SSL模型在模型容量和数据规模上的扩展性良好，表明其具有巨大的开发潜力。研究人员计划开源Web-SSL模型，以推动社区探索无语言监督的视觉预训练新方向。来源：微信公众号【新智元】

科研专用版「DeepSeek」助力高效读论文

款名为「心流 AI 助手」的科研专用工具，该工具接入了 DeepSeek 满血版，专为科研工作者设计。它支持论文图谱、引文直达、自定义知识库问答等功能，还能将对话保存为笔记并导出，甚至生成播客。对于初学者，它提供划重点、划词解读、一键翻译等贴心功能；对于资深研究者，引文直达和论文图谱功能则更具吸引力。此外，该工具还具备知识库、脑图和播客生成等功能，满足个性化知识获取需求。虽然目前仍有一些小问题，但整体已初具雏形，未来可期。来源：微信公众号【机器之心】

ILLUME+：华为诺亚推出新一代多模态大语言模型

华为诺亚盘古研究团队联合香港大学推出了ILLUME+模型，这是ILLUME的升级版本，采用双重视觉联合词表（DualViTok）和扩散解码器的创新设计，显著提升了语义理解和高保真图像生成能力。ILLUME+在图像理解、生成和编辑三大能力上表现出色，解决了传统模型在图像纹理保持和语义对齐方面的难题。其架构类似于GPT-4o的Token→Transformer→Diffusion→pixel结构，能够灵活适应多样的应用场景。ILLUME+的3B模型在多模态理解、生成与编辑的基准测试中展现了卓越性能，比肩7B模型。该模型还支持昇腾训练与推理，为多模态大语言模型的发展提供了新的方向。来源：微信公众号【机器之心】

米哈游蔡浩宇新作《Whispers From The Star》实机演示曝光

米哈游创始人蔡浩宇创立的AI游戏公司Anuttacon推出了一款名为《Whispers From The Star》的AI游戏，并曝光了iPhone实机演示片段。游戏中，玩家通过与AI角色「小美」（Stella）的沉浸式对话，决定她的命运。与传统游戏不同，该游戏剧情实时展开，不受剧本限制，玩家可以通过文本、语音、视频等形式与「小美」互动。游戏目前正在进行封闭测试，仅支持iPhone 12及以上版本。来源：微信公众号【量子位】