4月5日
4月5日·周五 AI工具和资源推荐
AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了
由上海人工智能实验室,南京大学,中科院深圳先进技术研究院牵头,联合东京大学,复旦大学,浙江大学,中国科学技术大学等高校的学生和研究者,共同公布了跨视角技能学习数据集EgoExoLearn,为机器人赋予了通过观察他人学习新动作的能力。EgoExoLearn 数据集独辟蹊径,采集了第一视角与第三视角的视频素材。第一视角视频捕捉了人们学习第三视角演示动作的全过程,这种视角的转换与融合,为机器模拟人类学习模式提供了宝贵的数据资源。数据集的构建不仅涵盖了日常生活的琐碎场景,更延伸到了专业实验室的复杂操作。EgoExoLearn 精心收录了总计 120 小时的视角与示范视频,旨在让机器在多种环境下都能有效学习。来源:微信公众号【机器之心】
简单指令就能生成完整音乐!Stability AI发布音频大模型2.0,生成音乐成下个技术竞逐热点
根据 Stability AI 的官方博文,Stable Audio 2.0 使用了 AudioSparx 的数据进行训练,这些数据包含了超过 80 万个音频文件,涵盖了音乐、声效和单独乐器的声音素材,以及相应的文字描述信息。Stable Audio 2.0 能够仅凭自然语言描述,生成长达三分钟的完整音乐,而且是高质量的 44.1 kHz 立体声。这个数字表示的是音频信号的采样频率,采样率越高,越能够捕捉更细微的声波变化,录制的声音也就越接近原始声音。44.1 kHz 是 CD 音质标准的采样率,能够提供较高的音频质量。除了用文本直接生成音乐,用户也可以先上传一段音频,再用文字描述想要的效果,Stable Audio 2.0 就能按指示改造该音频,也就是拥有音频到音频的转换能力。此外,它还能生成特定的音效,创作形式十分灵活。来源:微信公众号【问芯Voice】
【技术深度解析】探索ChatGPT:从代码越狱到安全防护全过程
随着ChatGPT的快速崛起,它不仅成为了人工智能领域的一个亮点,也引发了关于安全性和隐私保护的广泛讨论。在这篇技术深度解析中,我们将深入探索ChatGPT背后的安全机制,从代码执行环境的“越狱”漏洞,到OpenAI如何构建其安全防护的全过程,为读者揭开ChatGPT安全防护的神秘面纱。本文会尝试从 Linux 基础的安全性来思考它的应用逻辑。来源:AiMeticulously
OpenAI:引入微调 API 的改进并扩展自定义模型计划
开发人员可以使用多种技术来提高模型性能,以减少延迟、提高准确性并降低成本。 无论是通过检索增强生成 (RAG) 扩展模型知识、通过微调自定义模型的行为,还是使用新的特定领域知识构建自定义训练的模型,我们都开发了一系列选项来支持客户的 AI 实施。 今天,我们推出新功能,让开发人员能够更好地控制 API 的微调,并引入更多方法与我们的 AI 专家和研究人员团队合作构建自定义模型。我们的微调 API 还支持比单个提示所能容纳的更多示例,以实现更高质量的结果,同时降低成本和延迟。 微调的一些常见用例包括训练模型以特定编程语言生成更好的代码、以特定格式总结文本或根据用户行为制作个性化内容。来源:OpenAI