7月29日· 日均tokens使用量超5000亿,AI生图玩法猛猛上新,豆包大模型越来越「香」
7月29日·周一 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
日均tokens使用量超5000亿,豆包大模型越来越「香」
2024年,AI图像生成技术迎来重大进步,其中字节跳动的豆包大模型表现尤为突出。在成都举办的火山引擎AI创新巡展上,豆包大模型团队展示了其最新进展,包括文生图模型、语音模型等垂直模型的升级,并推出了「豆包・图生图模型」,新增50多项玩法。豆包大模型自5月对外服务以来,日均tokens使用量已超5000亿,成为国内使用量最大、应用场景最丰富的大模型之一。其技术实力在多个评测中表现卓越,尤其在图像美感、图文一致性、内容创造和复杂度适应性方面达到业界高水平。豆包大模型的升级,不仅提升了图像生成质量,还大幅降低了企业使用AI技术的门槛,推动了AI技术的广泛应用和行业落地。来源:微信公众号【机器之心】

GitHub数据永久可访问:设计缺陷还是特性?
开源社区近期被一则消息震惊,GitHub上删除的内容和私有存储库的数据实际上可以永久访问,这是GitHub官方有意为之的设计。Truffle Security公司在其博客中指出,这一现象源于CFOR(Cross Fork Object Reference)漏洞,允许用户通过提交哈希值访问数据,即便存储库已删除或设为私有。Truffle Security通过调查发现,即使是大型AI公司的公共存储库,也能从已删除的fork中轻易找到敏感的API密钥。GitHub的存储库网络设计意味着一旦存储库被fork,所有提交的数据将永久存在,即使原始存储库被删除或更改了可见性。Truffle Security已将此问题通过GitHub的漏洞披露计划提交给官方,而GitHub回应称这是其故意设计的。尽管GitHub保持了架构的透明性,但这种设计可能会误导用户对数据隐私的期望,增加数据泄露的风险。来源:微信公众号【机器之心】

低成本训练扩散模型:Sony AI 突破视觉生成技术
Sony AI 联合研究机构的研究者们在视觉生成模型领域取得了显著进展,他们仅用1890美元和3700万张图像,便成功训练出一个具有11.6亿参数的扩散模型。这项成果显著降低了从头开始训练这些模型的成本和工作量,与以往需要数万GPU小时和数月时间的Stable Diffusion 2.1相比,这是一个巨大的突破。研究者们通过开发一种低成本的端到端pipeline,减少了transformer处理每张图像的有效patch数,并通过延迟掩蔽策略和轻量级patch-mixer,有效保留了图像的语义信息。此外,他们还利用了MoE和layer-wise scaling技术改进了主干transformer架构,进一步提升了模型性能。这一成果不仅减少了实验开销,还在COCO数据集上实现了12.7 FID的零样本生成,证明了在有限的计算预算下,通过创新的方法可以实现高性能的扩散模型训练。来源:微信公众号【机器之心】

Meta Llama 3 405B模型训练挑战:GPU故障与自动化维护
Meta在其研究报告中披露了训练Llama 3 405B模型时遭遇的重大技术挑战。该模型在16384个Nvidia H100 GPU组成的集群上运行,平均约每三小时就遇到一次故障,总计在54天内发生了419次意外中断。其中,58.7%的中断源于GPU及其高带宽内存(HBM3)。尽管面临这些挑战,Meta的工程师们通过自动化集群维护和创新的故障检测工具,实现了超过90%的有效训练时间。此外,Meta还必须应对数以万计GPU同时变化功耗给数据中心电网带来的压力。通过开发多种优化策略和工具,例如PyTorch的NCCL飞行记录器和NCCLX,Meta能够快速诊断和解决挂起和性能问题,尤其是在NVLink和RoCE相关问题上。这些努力不仅展示了Meta工程师的创新能力,也反映了在大规模AI模型训练中硬件和软件同步发展的重要性。来源:微信公众号【AI前线】

Science研究:GenAI提升个人创意却可能削弱集体多样性
一项发表在Science上的研究发现,生成式人工智能(GenAI)在文学创作中既是助力也是阻碍。研究指出,GenAI能够显著提升个体在创作过程中的创意表现,但同时可能导致集体作品的同质化,减少创意多样性。实验中,500名参与者在AI的辅助下撰写故事,结果发现AI辅助的故事在新颖性和可读性上有所提升,但相互之间的相似度也更高。这引发了对创意领域中AI使用的道德和哲学问题的讨论,包括作品所有权和创意来源的透明度问题。评估者普遍认为,尽管AI辅助创作在道德上可接受,但应明确披露AI的使用情况,并建议将部分收益分配给AI的贡献者。研究结果提示我们,在享受GenAI带来的创作便利的同时,也应警惕其对集体创意多样性可能产生的负面影响。来源:微信公众号【新智元】
【今日案例】
腾讯元宝深度分析:东方甄选与董宇辉分手
https://yuanbao.tencent.com/bot/app/share/chat/4f503d571d832025c54811665f60fc84