4月5日

AI资讯速递2年前 (2024)发布 FuturX-Editor

942 0 0

4月5日·周五 AI工具和资源推荐

AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

让智能体像孩子一样观察别人学习动作，跨视角技能学习数据集EgoExoLearn来了

由上海人工智能实验室，南京大学，中科院深圳先进技术研究院牵头，联合东京大学，复旦大学，浙江大学，中国科学技术大学等高校的学生和研究者，共同公布了跨视角技能学习数据集EgoExoLearn，为机器人赋予了通过观察他人学习新动作的能力。EgoExoLearn 数据集独辟蹊径，采集了第一视角与第三视角的视频素材。第一视角视频捕捉了人们学习第三视角演示动作的全过程，这种视角的转换与融合，为机器模拟人类学习模式提供了宝贵的数据资源。数据集的构建不仅涵盖了日常生活的琐碎场景，更延伸到了专业实验室的复杂操作。EgoExoLearn 精心收录了总计 120 小时的视角与示范视频，旨在让机器在多种环境下都能有效学习。来源：微信公众号【机器之心】

简单指令就能生成完整音乐！Stability AI发布音频大模型2.0，生成音乐成下个技术竞逐热点

根据 Stability AI 的官方博文，Stable Audio 2.0 使用了 AudioSparx 的数据进行训练，这些数据包含了超过 80 万个音频文件，涵盖了音乐、声效和单独乐器的声音素材，以及相应的文字描述信息。Stable Audio 2.0 能够仅凭自然语言描述，生成长达三分钟的完整音乐，而且是高质量的 44.1 kHz 立体声。这个数字表示的是音频信号的采样频率，采样率越高，越能够捕捉更细微的声波变化，录制的声音也就越接近原始声音。44.1 kHz 是 CD 音质标准的采样率，能够提供较高的音频质量。除了用文本直接生成音乐，用户也可以先上传一段音频，再用文字描述想要的效果，Stable Audio 2.0 就能按指示改造该音频，也就是拥有音频到音频的转换能力。此外，它还能生成特定的音效，创作形式十分灵活。来源：微信公众号【问芯Voice】

【技术深度解析】探索ChatGPT：从代码越狱到安全防护全过程

随着ChatGPT的快速崛起，它不仅成为了人工智能领域的一个亮点，也引发了关于安全性和隐私保护的广泛讨论。在这篇技术深度解析中，我们将深入探索ChatGPT背后的安全机制，从代码执行环境的“越狱”漏洞，到OpenAI如何构建其安全防护的全过程，为读者揭开ChatGPT安全防护的神秘面纱。本文会尝试从 Linux 基础的安全性来思考它的应用逻辑。来源：AiMeticulously

OpenAI:引入微调 API 的改进并扩展自定义模型计划

开发人员可以使用多种技术来提高模型性能，以减少延迟、提高准确性并降低成本。无论是通过检索增强生成 (RAG) 扩展模型知识、通过微调自定义模型的行为，还是使用新的特定领域知识构建自定义训练的模型，我们都开发了一系列选项来支持客户的 AI 实施。今天，我们推出新功能，让开发人员能够更好地控制 API 的微调，并引入更多方法与我们的 AI 专家和研究人员团队合作构建自定义模型。我们的微调 API 还支持比单个提示所能容纳的更多示例，以实现更高质量的结果，同时降低成本和延迟。微调的一些常见用例包括训练模型以特定编程语言生成更好的代码、以特定格式总结文本或根据用户行为制作个性化内容。来源：OpenAI