7月27日·牛津剑桥AI研究引发学术圈热议：合成数据与模型崩溃

277 0 0

7月27日·周六 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

牛津剑桥AI研究引发学术圈热议：合成数据与模型崩溃

牛津大学和剑桥大学联合发表在《Nature》封面的研究论文，探讨了人工智能（AI）训练中所谓的“近亲繁殖”问题，即模型仅使用AI生成内容可能导致崩溃。这项研究引发了学术界的广泛讨论，许多专家认为，合成数据的关键在于正确使用，而非其本身。论文指出，依赖纯合成数据训练AI模型，可能在短期内提升评估结果，但长期会导致模型性能下降。Scale AI的CEO Alexandr Wang强调，混合数据（Hybrid Data）是未来发展方向，建议结合真实世界数据、人类专家参与和形式逻辑引擎来生成数据。此外，Meta、纽约大学和北京大学的研究人员提出，通过强化学习（reinforcement learning）和人类或模型的反馈，可以恢复甚至超越模型原始性能。斯坦福大学博士生Rylan Schaeffer的研究也表明，将合成数据与真实数据结合积累，可以有效避免模型崩溃。来源：微信公众号【新智元】

多层感知器（MLP）与KAN的较量，KAN只赢一局

新加坡国立大学的研究者对多层感知器（MLP）和Kolmogorov–Arnold Networks（KAN）进行了全面比较。MLP作为深度学习模型的基础组成部分，以其非线性逼近能力而广泛使用，但存在可解释性和扩展性方面的局限。KAN作为MLP的替代方案，以其参数效率和可解释性受到关注。研究者在控制参数或浮点运算（FLOP）相同的情况下，对两种网络在多个领域的任务进行了评估。结果表明，KAN仅在符号公式表示任务中表现优于MLP，而在机器学习、计算机视觉、自然语言处理和音频处理等其他任务中，MLP通常优于KAN。此外，当MLP采用与KAN相同的B样条激活函数时，其性能可达到甚至超越KAN。研究还发现，KAN在连续学习任务中的遗忘问题比MLP更严重。这项研究为理解两种网络的适用性和性能差异提供了新的视角。来源：微信公众号【机器之心】

SGLang Runtime v0.2：加速Llama 405B模型推理的新引擎

LMSYS Org团队推出SGLang Runtime v0.2，这是一个为大型语言模型（LLM）和超大型模型（VLM）设计的通用服务引擎，显著提升了Llama 3.1 405B模型的推理速度。SGLang在GitHub上已获得超过3K的star量，得到了AI研究者贾扬清的高度评价。在与vLLM和TensorRT-LLM的比较中，SGLang展现出卓越的吞吐量和延迟性能，特别是在运行Llama系列模型时，吞吐量可达TensorRT-LLM的2.1倍，vLLM的3.8倍。SGLang完全开源，使用纯Python编写，核心调度器仅用不到4K行代码实现，已被多个机构用于支持模型服务，实现了更快的迭代。此外，SGLang的高效批处理调度器在性能上可与C++构建的闭源实现相媲美，甚至更优。LMSYS Org团队由加州大学伯克利分校、圣地亚哥分校和卡内基梅隆大学的学生与教职工组成，旨在通过SGLang为AI产品和服务提供高效的底层支持。来源：微信公众号【机器之心】

巴黎奥运会拥抱AI技术，开启智能体育赛事新篇章

2024年巴黎奥运会盛大开幕，成为历史上首届将人工智能（AI）纳入官方议程的奥运会。这场盛事不仅在塞纳河上举行开幕式，更通过AI技术的应用，展现了科技与体育的完美结合。从实时监控能源消耗到利用数字孪生技术优化赛事规划，巴黎奥运会在多个层面上运用了AI技术。英特尔、阿里巴巴、Atos等全球技术大厂参与其中，提供了包括AI驱动的多摄像机回放系统、云直播信号远程分发、智能计时和数据分析等服务。此外，OBS LiveCloud和阿里云合作，通过云计算支持奥运直播信号的全球传输。AI技术还被用于提高广播效率、增强观众体验，并在赛事期间生成精彩集锦。这场奥运会不仅是体育竞技的盛会，更是AI技术在体育领域应用的展示窗口。来源：微信公众号【AI前线】

英特尔突破性OCI技术：用光互联提升AI算力

英特尔公司推出了业界首款全集成光学计算互连（OCI）芯片，利用光技术解决了AI大模型时代的算力难题。随着AI模型规模的不断扩大，对计算、存储和I/O通信的要求也越来越高。传统的电气I/O因传输距离短、功耗高而受限。英特尔的OCI技术使用光学I/O取代电气I/O，实现了数据传输距离的大幅延长，最远可达100米，同时数据传输量大且功耗低，非常适合AI大模型的需求。这项技术采用了硅光子技术，集成了硅光子集成电路（PIC）、光放大器和电子集成电路，已经与CPU封装在一起，并可与下一代CPU、GPU、IPU等系统级芯片集成。英特尔的这项创新不仅提高了数据传输效率，还为未来数据中心的高密度I/O提供了新的可能性。来源：微信公众号【量子位】