4月7日·Llama 4训练作弊风波致高管辞职,代码实测表现不佳引争议

4月7日·周一  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

Llama 4训练作弊风波致高管辞职,代码实测表现不佳引争议

Meta公司推出的Llama 4模型陷入丑闻风波。据内部员工爆料,Llama 4在训练过程中被指存在作弊行为,高层曾建议将多个benchmark测试集混入训练数据,以短期提升指标。该员工无法接受这种做法,愤而辞职,并要求不要在Llama 4技术报告中挂名。此外,Llama 4开源首日,代码能力在全网实测中表现极差,与顶尖大模型实力悬殊,甚至在LM arena上存在过拟合现象,有作弊嫌疑。网友实测也显示其在编程任务等多方面表现不如其他模型,引发诸多不满。来源:微信公众号【新智元】

4月7日·Llama 4训练作弊风波致高管辞职,代码实测表现不佳引争议

LeCun新作Web-SSL:多模态训练无需语言监督,性能媲美CLIP

LeCun与谢赛宁等研究人员发布了Web-SSL模型,验证了自监督学习(SSL)在多模态任务中的潜力。该研究通过在大规模网页图像数据上训练,证明了在不依赖语言监督的情况下,视觉SSL模型能够媲美甚至超越CLIP模型。Web-SSL模型系列(1B-7B参数)在视觉问答(VQA)任务中表现出色,尤其在OCR和图表理解任务上,展现了与CLIP相当的性能。研究还发现,SSL模型在模型容量和数据规模上的扩展性良好,表明其具有巨大的开发潜力。研究人员计划开源Web-SSL模型,以推动社区探索无语言监督的视觉预训练新方向。来源:微信公众号【新智元

4月7日·Llama 4训练作弊风波致高管辞职,代码实测表现不佳引争议 4月7日·Llama 4训练作弊风波致高管辞职,代码实测表现不佳引争议

ILLUME+:华为诺亚推出新一代多模态大语言模型

华为诺亚盘古研究团队联合香港大学推出了ILLUME+模型,这是ILLUME的升级版本,采用双重视觉联合词表(DualViTok)和扩散解码器的创新设计,显著提升了语义理解和高保真图像生成能力。ILLUME+在图像理解、生成和编辑三大能力上表现出色,解决了传统模型在图像纹理保持和语义对齐方面的难题。其架构类似于GPT-4o的Token→Transformer→Diffusion→pixel结构,能够灵活适应多样的应用场景。ILLUME+的3B模型在多模态理解、生成与编辑的基准测试中展现了卓越性能,比肩7B模型。该模型还支持昇腾训练与推理,为多模态大语言模型的发展提供了新的方向。来源:微信公众号【机器之心

4月7日·Llama 4训练作弊风波致高管辞职,代码实测表现不佳引争议

米哈游蔡浩宇新作《Whispers From The Star》实机演示曝光

米哈游创始人蔡浩宇创立的AI游戏公司Anuttacon推出了一款名为《Whispers From The Star》的AI游戏,并曝光了iPhone实机演示片段。游戏中,玩家通过与AI角色「小美」(Stella)的沉浸式对话,决定她的命运。与传统游戏不同,该游戏剧情实时展开,不受剧本限制,玩家可以通过文本、语音、视频等形式与「小美」互动。游戏目前正在进行封闭测试,仅支持iPhone 12及以上版本。来源:微信公众号【量子位

4月7日·Llama 4训练作弊风波致高管辞职,代码实测表现不佳引争议
© 版权声明

相关文章

暂无评论

暂无评论...