3月13日
3月13日·周三 AI工具和资源推荐
AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
首个AI软件工程师上线!已通过公司面试抢程序员饭碗,华人创始团队手握10块IOI金牌
Cognition AI 团队发布首个人工智能软件工程师 Devin ,在 SWE-Bench 基础测试中,无需人类协助,Devin 就可以解决 13.86% 的问题。而目前的 SOTA 模型,在没有人类帮忙的情况下,只能完成 1.96% 的任务。Devin 不仅通过了一家业内领先的人工智能公司的面试,在自由职业平台 Upwork 上也能成功接单,完成单主要求的工作。总体来看,与其他具有编程能力的大模型,Devin 不仅辅助编程或提供代码片段,它能够独立支持一整个项目,而不仅仅是辅助或提供代码片段的建议。相比于「副驾驶」的角色,Devin 更接近于一个独立工作者。而 Cognition AI 声称 Devin 实现了在 AI 领域被称为「理解」的突破,这意味着它能够不仅是在预测下一个单词或代码行应该输出什么,而是更像在思考如何解决问题的总体方法。来源: 微信公众号【机器之心】
北京智源人工智能研究院、新加坡南洋理工大学、北京大学携手提出通用计算机控制,向数字世界AGI迈进!智能体已经从头开玩「荒野大镖客 2」了
北京智源人工智能研究院、新加坡南洋理工大学、北京大学携手提出通用计算机控制 General Computer Control (GCC),即智能体需要像人一样看屏幕,通过键盘、鼠标完成计算机上的所有任务。在过去很长一段时间里,人工智能研究以游戏为场景,而 GCC 将为通用人工智能研究提供场景,也将进一步促进大模型和 AI Agents 的落地与产业化。为此,研究团队提出通用计算机控制智能体框架 Cradle,使智能体不依赖任何内部 API 直接控制键盘、鼠标和任何软件交互,无论开源还是闭源,甚至能玩《荒野大镖客 2》这样的商业 3A 游戏大作!来源:微信公众号【机器之心】
“现代AI之父”Jürgen Schmidhuber团队迎新成果:用图结构构建智能体,助力研发AI智能体
诸葛鸣晨和所在团队提出一个观点:所有形式的多模态智能体都能够利用一种通用语言(例如自然语言)——以模块化的方式进行头脑风暴,进而完成单一智能体无法完成的任务。诸葛鸣晨和所在团队提出一种构建智能体的新型理解方式—— GPTSwarm。即通过以下对应关系,来重新定义智能体的构建:1. 操作(Operation)↔节点(Node)2. 智能体(Agent)↔由多节点构成的图(Graph of Nodes)3. 蜂群(Swarm)↔复合图(Composite of Graphs)。有了这套定义方法,就能将所关注的问题转化为“图”的优化问题,包括:a. 合作与通信(Collaboration and Communication)↔图之间的信息流动(Information Flow between Graphs)b. 编排(Orchestration)↔复合图中的边缘连接(Edge Connections in the Composite Graph)c. 优化(Optimization)↔节点或边缘的优化(Optimization of Nodes or Edges)作为一种新型理解方式,GPTSwarm 通过将智能体构建的概念,映射到操作、智能体、蜂群(多智能体)与节点、节点图、复合图的对应关系中,从而能够重新定义智能体的架构。来源:微信公众号【DeepTech深科技】
Meta公开 Llama-3基础训练设施:使用了49,000个H100
3 月 13 日,社交、科技巨头 Meta 在官网公布了两个全新的 24K H100 GPU 集群(49,152 个),专门用于训练大模型 Llama-3。此外,Llama-3 使用了 RoCEv2 网络,基于 Tectonic/Hammerspace 的 NFS/FUSE 网络存储,继续使用了 PyTorch 机器学习库。从训练进度来看,估计 Llama-3 最快将于 4 月末或 5 月中旬上线。受 Sora 影响,很可能是一个多模态模型,并且会继续开源。Meta 表示,预计到 2024 年底,将拥有 600,000 个 H100 的算力。来源:微信公众号【AI前线】
超快!Deepgram Aura:实时文本转语音API 低于250毫秒
Deepgram Aura 是一款实时文本转语音 API,其主要特点是低延迟,不超过250毫秒,能够即时响应用户的需求。它还具备人类般对话的自然度和流畅度,包括自然的节奏和停顿,能够根据对话上下文动态调整音调和情绪,使得对话更加生动和真实。同时,Deepgram Aura 还支持实时互动,能够与人类之间进行实时信息交换,提供了一种高效便捷的沟通方式。Deepgram Aura 的性价比也很高,每千字符仅需0.015美元,适合各种规模的用户使用。该 API 提供了易于集成的接口和开源演示,支持快速开发,新用户还可获得200美元的免费信用额度进行测试。通过 GitHub 和在线体验平台,用户可以方便地了解和体验 Deepgram Aura 的功能和性能。Deepgram Aura 是一款性能优越的实时文本转语音 API,具备低延迟、自然对话流畅和实时互动等特点,适合各种场景下的应用,为用户提供了高效便捷的语音交流解决方案。来源:凤凰新闻-站长之家