12月2日·华为开源扩散语言模型,突破32K上下文限制
12月2日·周二 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
华为开源扩散语言模型,突破32K上下文限制
华为近日开源了扩散语言模型openPangu-R-7B-Diffusion,成功将上下文长度扩展至32K,显著提升了模型在长文本处理和复杂推理任务中的表现。该模型基于openPangu-Embedded-7B进行少量数据续训练,采用了创新的前文因果注意力掩码设计,解决了传统扩散模型在长序列训练中的不稳定性问题。在多个权威基准测试中,openPangu-R-7B-Diffusion创下了7B参数量级的新纪录,特别是在数学推理和代码生成任务中表现突出。这一突破不仅展示了华为在AI领域的技术实力,也为扩散模型的广泛应用奠定了基础。来源:微信公众号【机器之心】
OpenAI进入“红色警报”状态,全力改进ChatGPT
在ChatGPT三周年之际,OpenAI宣布进入“红色警报”状态,集中资源改进ChatGPT以应对来自谷歌等竞争对手的压力。公司CEO Sam Altman在内部备忘录中表示,将推迟其他产品的开发进度,如广告业务和AI智能体,以确保ChatGPT的核心竞争力。尽管OpenAI在过去一年中在多个技术方向上进行了尝试,但往往缺乏持续的产品势能。此次改进计划包括深度个性化、模型行为优化和多模态增强,旨在提升用户体验并稳固其市场地位。此外,OpenAI计划在下周发布一款新的推理模型,进一步强化ChatGPT的深度研究功能。来源:微信公众号【机器之心】
千问App集成顶级视觉模型,免费提供好莱坞级体验
千问App在最新更新中接入了阿里最强的两大视觉模型——Qwen-Image和Wan 2.5,为用户带来了一站式的“掌上影像工作室”体验。Qwen-Image在图像编辑中展现了强大的视觉逻辑理解和主体一致性保持能力,而Wan 2.5则实现了原生音画同步,支持生成有声视频。千问App不仅在图像和视频生成上达到了准商业级水准,还通过多模态工作流实现了从图到视频的无缝转换。这一更新使得普通用户能够在手机上免费体验到好莱坞级的生成效果,标志着AI创作工具的进一步普及。来源:微信公众号【机器之心】
世界模型和具身大脑取得新突破,性能提升300%
国产世界模型公司极佳视界发布了GigaWorld-0,成功将世界模型生成数据在VLA训练中的占比提升至90%,显著提升了具身智能模型的性能。GigaWorld-0通过稀疏注意力机制和混合专家架构,高效生成高质量的训练数据,同时结合可微分物理引擎,确保生成数据的几何一致性和物理准确性。在真实机器人平台上的实验表明,GigaWorld-0生成的数据显著提升了VLA模型在新纹理、新视角和新物体位置等泛化场景下的任务成功率和动作精度。这一突破标志着具身智能正式迈入“数据高效、高泛化、低成本”的新阶段。来源:微信公众号【量子位】
米哈游蔡浩宇推出“游戏版ChatGPT”,AnuNeko上线
米哈游创始人蔡浩宇推出了AI聊天软件AnuNeko,这款软件结合了游戏元素,提供了与AI角色互动的独特体验。用户可以选择与不同性格的猫娘角色进行对话,AnuNeko的回复具有高度的人性化和情绪化,能够根据用户的输入调整对话风格。尽管在逻辑问题上表现一般,但其在情绪价值和娱乐性上表现出色。AnuNeko的推出标志着米哈游在AI领域的初步尝试,展现了AI与游戏结合的潜力。来源:微信公众号【量子位】