3月10日

AI资讯速递1年前 (2024)更新 FuturX-Editor

396 0 0

3月10日·周日 AI工具和资源推荐

AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

Notion CEO：RAG是知识管理的未来，AI将SaaS带入新一轮Bundling

Notion 是生产力工具领域 AI 策略最为激进的一家公司：在 ChatGPT 推出 2 个月后，Notion 就宣布推出 Notion AI，将 GenAI 的体验直接融入到产品，并根据不同需求和场景预设了 prompt，用户只需要空格或“/”即可调用 GPT。Notion AI 上线 1 个月后，就有消息称 Notion AI 为 Notion 带来了 1000 万美元的 ARR，上线 2 个月后，Notion AI 用户突破 400 万。除了不断提升问答交互的体验，Notion 还推出了 Notion Project、Notion Q&A 和 Notion Calendar 等新功能、产品。在访谈中，Ivan 分享了 Notion 在 AI 实践中的思考：团队 all-in AI 的决策是如何做出的、为什么说 RAG、workflow agent 被外界低估了，以及 language model 一定程度上会将 SaaS 世界带入到新一轮 bundling 周期中。Notion 的愿景是通过构建出各种各样的“积木块”让用户在平台上搭建出更具个性化、符合实际需求的定制化应用，从而实现“人人都能制作自己的软件”这件事，Ivan 认为，language model 的出现一定会加速这一过程，更进一步，RAG 还会彻底革命知识型工作和团队沟通的形态，Notion Project、Notion Q&A 和 Notion Calendar 等新功能、产品正是服务于此。来源：微信公众号【Founder Park】

首个自主完成人类任务机器人出现，五指灵活速度超人，大模型加持虚拟空间训练

这周，由OpenAI，微软，贝佐斯，英伟达投资的机器人公司Figure AI融资接近7亿美元，号称在1年之内要做出等独立行走工作的人形机器人。而特斯拉的擎天柱也屡屡传出好消息。一家位于加拿大的机器人公司Sanctuary AI最近发布了一款全新的人形机器人Phoenix。官方号称它能以和人类一样的速率自主完成很多工作。Pheonix可以轻轻地抓取、移动并优雅地将每个对象放置在它的左右两侧。它可以自主地识别物体的颜色，将不同颜色的物体分开放置，整个过程非常丝滑，速度确实和人类差不多。Phoenix由先进且独特的人工智能系统 Carbon 来控制，身高1米7，重155磅，拥有行业最领先的机器手，可与人类手的灵活性和精细操作相媲美。Carbon融合现代人工智能技术，将自然语言转化为现实世界的行动，具有可解释、可审查的推理能力，负责规划任务和运动计划，使得Phoenix能像人一样思考、行动，从而完成工作任务。来源：微信公众号【新智元】

Pika放大招：今天起，视频和音效可以“一锅出”了！

Pika发布了一项新功能：今天起，大家可以给视频无缝生成音效了——Sound Effects！不仅是发布的宣传片，Pika官网现在也放出了多个demo。例如无需任何prompt，AI只是看了眼烤培根的视频，便可以配出毫无违和感的音效。再如给一句prompt：Super saturated color, fireworks over a field at sunset.超饱和色彩，日落时田野上的烟火。Pika便可以在生成视频的同时配上声音，从效果中不难看出，烟花绽放的瞬间，声音卡点也是相当的精准。值得一提的是，Sound Effects功能目前只对超级合作者（Super Collaborator）和Pro用户开放测试。来源：微信公众号【量子位】

基于DiT，支持4K图像生成，华为诺亚0.6B文生图模型PixArt-Σ来了

为了探索以怎样的方式将这些新元素高效地整合进现有模型，依托有限的资源让模型变得更强大这个问题，华为诺亚方舟实验室等研究机构的一个研究团队提出一种新的训练方法：由弱到强式训练（weak-to-strong training）。他们的研究基于他们去年十月提出的一种高效的文生图训练方法 PixArt-α。PixArt-α 是 DiT（扩散 Transformer）框架的一种早期尝试。而现在，随着 Sora 登上热搜以及 Stable Diffusion 层出不穷的应用，DiT 架构的有效性得到了研究社区越来越多工作的验证，例如 PixArt, Dit-3D, GenTron 等。该团队使用 PixArt-α 的预训练基础模型，通过整合高级元素以促进其持续提升，最终得到了一个更加强大的模型 PixArt-Σ。该团队还使用了先进的多模态模型 GPT-4 Vision 来执行 AI 偏好研究。他们的做法是给 GPT-4 Vision 提供两张图像，让它基于图像质量和图像 – 文本对齐程度进行投票。结果见图 9 中的橙色和绿色条形图，可以看到情况与人类评估基本一致。该团队也进行了消融研究来验证各种改进措施的有效性。来源：微信公众号【机器之心】