3月25日·周一 AI工具和资源推荐
AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
词曲创作只需几秒,「AI作曲家」Suno引爆音乐圈,第一手体验和攻略来了
自从 ChatGPT 在 2022 年底爆火以来,我们已经看到 AI 生成的诸多艺术创作成果:ChatGPT 写出过情节引人入胜的网文,Midjourney 生成过肉眼难辨的人像。最近,AI 搞创作的风终于吹到了「歌曲生成」领域,一款名为 Suno 的 AI 驱动的歌曲生成器,在社区内开始了病毒式传播。其实此前陆续推出的 AI 音乐生成器并不少,比如 Adobe 的 Project Music GenAI , YouTube 的 Dream Track 和 Voicify AI(现在的 Jammable)。但只有 Suno 被称为「音乐界的 ChatGPT」,其与众不同之处在于,它可以根据简单的提示创建从歌词到人声和配器的所有内容。 Suno 团队近日更新的 V3 模型 —— 首次能够生成广播质量的音乐。目前,Suno V3 在以下几个方面具有显著优势:更好的音频质量;更多样化的风格和流派;更强的提示遵从性,包括更少的幻觉和更优雅的结局。通过 Suno V3,用户现在可以使用免费账户创建两分钟时长的完整歌曲,具体效果取决于自己选择的流派。来源:微信公众号【机器之心】
离职谷歌的Transformer作者创业,连发3个模型大语言模型(EvoLLM-JP)、视觉语言模型(EvoVLM-JP)、图像生成模型(EvoSDXL-JP)
David Ha、Llion Jones 成立的初创公司 Sakana AI 致力于构建生成式 AI 模型。最近,Sakana AI 宣布推出一种通用方法 ——Evolutionary Model Merge。该方法使用进化算法来有效地发现组合不同开源模型的最佳方法,这些开源模型具有不同功能。Evolutionary Model Merge 方法能够自动创建具有用户指定功能的新基础模型。为了测试其方法的有效性,研究团队用 Evolutionary Model Merge 方法演化出能够进行数学推理的日语大语言模型(LLM)和日语视觉语言模型(VLM)。实验结果表明这两个模型在没有经过明确优化的情况下,在多个 LLM 和视觉基准上都取得了 SOTA 结果。特别是,其中进行数学推理的日语 LLM 是一个 7B 参数模型,它在大量日语 LLM 基准上取得了顶级性能,甚至超过了一些 SOTA 70B 参数 LLM。最终,研究团队应用 Evolutionary Model Merge 方法演化出 3 个强大的基础模型:1. 大语言模型(EvoLLM-JP)2. 视觉语言模型(EvoVLM-JP)3. 图像生成模型(EvoSDXL-JP)。来源:微信公众号【机器之心】
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器
PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并进行了模型改进和 M2KR 上的大规模预训练。近期,剑桥大学信息工程系人工智能实验室完整开源了首个预训练、通用多模态后期交互知识检索器 PreFLMR (Pre-trained Fine-grained Late-interaction Multi-modal Retriever)。相比以往常见的模型,PreFLMR 有以下特点:PreFLMR 是一个可以解决文文检索,图文检索,知识检索等多个子任务的通用预训练模型。传统的密集文本检索(Dense Passage Retrieval, DPR)只使用一个向量表征问询(Query)或文档(Document)。PreFLMR 能够根据用户输入的指令(例如 “提取能用于回答以下问题的文档” 或 “提取与图中物品相关的文档”),从庞大的知识库中提取相关的文档,帮助多模态大模型大幅提升在专业知识问答任务上的表现。来源:微信公众号【机器之心】
写给不会代码的你:20分钟上手 Python + AI
在深入学习 AI 时,许多朋友发现需要编程,变得头大。同时,各类教程都默认了你会打命令行,导致入门十分困难。鉴于此,就有了这份简明入门,旨在让大家更快掌握 Python 和 AI 的相互调用。并使你在接下来的 20 分钟内,循序渐进的完成以下任务:完成一个简单程序、完成一个爬虫应用,抓取公众号文章、完成一个 AI 应用,为公众号文章生成概述。
关于 Python:Python 就像哆拉A梦,它:
- 拥有一个百宝袋,装满了各种道具,被称为标准库。当遇到问题时,都可以拿出来直接使用。
- 如果百宝袋里的道具不够用,还可以打电话给未来百货,去订购新道具。在这里:
- 打电话:对应 pip 一类的工具,可以用来订购任何的道具。
- 未来百货:对应 GitHub 一类的分享代码的平台,里面啥都有。
- 被全世界广泛使用,尤其是在 AI 领域,所以遍地是大哥
关于 OpenAI API:OpenAI 通过两种方式提供服务:
- 其一:通过 ChatGPT,提供开箱即用的服务,直接对话即可,简单直观。
- 其二:通过 OpenAI API,提供更加灵活的服务,通过代码调用,来完成更多自动化任务,比如全自动将本地的 1 万本小说,从中文翻译成英文。
发现了没,这里的 OpenAI API, 对应着上面未来百货道具。
来源:微信公众号【海外独角兽 】
今年目标1亿活跃用户!Perplexity联手Arc浏览器对抗Google背后产品逻辑
近日,Perpleixity 创始人&CEO Aravind Srinivas 对话了现任 Stripe CTO David Singleton,讨论了 Perplexity 如何构建一种新的 AI 驱动的传统搜索引擎替代方案、迄今为止的历程,以及其背后的技术。
Aravind 的核心观点包括:早期商业模式的重要性:Aravind 强调了早期实现盈利的重要性,认为这有助于构建更可持续、长期的业务,并为公司带来更多的筹码和杠杆。关于产品方向的思考:Aravind 讨论了如何在创业初期确定产品方向,强调了对产品市场契合度的认识和追求,并指出了不断调整和优化产品路线图的重要性。广告模式的演进:Aravind对广告模式进行了思考,强调了广告的相关性对于用户体验的重要性。他认为,未来的广告模式可能会更加融入用户体验,以提高广告的相关性和吸引力。数据收集和处理的挑战:他谈到了在数据收集方面可能面临的挑战,尤其是在争取对特定网站的访问权限方面。同时,他也提到了数据收集中可能出现的偏见问题,以及如何应对这些问题。关于内容生成的思考:Aravind对于内容生成的影响提出了一些见解,特别是针对搜索引擎优化对内容质量的影响。他认为,通过为用户提供高质量的内容,大型语言模型(LLMs)可能会对内容的生成产生积极影响。来源:微信公众号【有新Newin】
LangChain 携手 NVIDIA:RAG加速新篇章
NVIDIA NIM 是一系列用户友好的微服务,它们旨在加速企业内部生成式 AI 的部署进程。这种多功能的运行环境支持包括开源社区模型、NVIDIA AI 基础模型以及自定义 AI 模型在内的广泛 AI 模型。开发者可以利用行业标准的 API,仅需数行代码即可快速构建出企业级的 AI 应用。NIM 基于 NVIDIA Triton Inference Server、NVIDIA TensorRT、NVIDIA TensorRT-LLLLM 等强大的推理引擎,以及 PyTorch 等技术构建,旨在提供无缝的 AI 推理体验,确保您可以自信地在任何环境中部署 AI 应用。无论是在本地服务器还是云端环境中,NIM 都是实现大规模、高性能生成式 AI 推理的最佳选择。开始使用 NIM 非常简单。在 NVIDIA API 目录中,开发者可以轻松访问多种 AI 模型,用于构建和部署生成式 AI 应用。NIM 是 NVIDIA AI Enterprise 的一部分,这是一个全面的、基于云的软件平台,旨在简化生产级 AI 应用的开发和部署流程。来源:微信公众号【AI小智】