3月14日
3月14日·周四 AI工具和资源推荐
AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
仅用13天!OpenAI“智能大脑”上身人形机器人
3月13日,备受瞩目的人形机器人初创公司Figure发布了一则视频。视频中,Figure公司的人形机器人Figure 01可以与人类流畅对话,同时还能够精准执行人类发出的指令,并解释这样做的原因。Figure 公司强调,整段视频没有任何加速和剪辑,完全是一镜到底拍摄的,同时,该机器人也是在完全自主的情况下进行的行为,绝对没有任何远程操纵。而此次Figure 01机器人惊艳表现的背后,是 OpenAI 为其配置的“智能大脑”。值得一提的是,从3月1日 Figure正式宣布与OpenAI进行合作,到这个视频的发布,仅仅只有十三天时间。这一技术突破得益于OpenAI与Figure的共同努力。OpenAI负责提供视觉推理和语言理解的支持,而Figure的神经网络则负责实现机器人的快速、简单和灵活的动作。Figure 公司AI团队的负责人Corey Lynch在X上详细解释了此次视频中机器人互动背后的技术。来源: 微信公众号【 】
强化学习大牛Pieter Abbeel的“机器人大脑”,把大模型带入了现实世界
由 Abbeel 和他的学生创建的强化学习机器人平台公司 Covariant,基于自己的真实、复杂机器人数据集与海量的互联网数据,推出了一个机器人基础模型(RFM-1)。据介绍,在识别了图像、感官数据和文本的模式后,该技术让机器人有能力处理物理世界中的突发状况。即使机器人从未见过香蕉,它也知道如何拿起香蕉。它还能用简单的英语做出反应,就像聊天机器人一样。如果你告诉它“拿起香蕉”,它就知道是什么意思。如果你告诉它“拿起一个黄色的水果”,它也能理解。它甚至还能生成视频,预测当它试图拿起香蕉时可能会发生什么。这些视频在仓库中没有实际用途,但它们显示了机器人对周围事物的理解。此外,该模型不仅可以通过一般的互联网数据进行训练,还可以通过丰富的物理现实世界交互数据进行训练。来源:微信公众号【学术头条】
LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力
近日,一项由 Swin-Transformer 团队打造,来自西安交通大学、中国科学技术大学、清华大学和微软亚洲研究院的学者共同完成的研究工作 Xwin 颠覆了这一认知,揭示了通用预训练下 7B(即 70 亿参数)规模的语言模型(LLaMA-2-7B)在数学问题解决方面已经展现出较强的潜力,并可使用基于合成数据的有监督微调方法促使模型愈发稳定地将数学能力激发出来。这项研究发布在 arXiv 上,题为《Common 7B Language Models Already Possess Strong Math Capabilities》。研究团队首先仅使用 7.5K 数据,对 LLaMA-2-7B 模型指令微调,进而测评模型在 GSM8K 和 MATH 的表现。实验结果表明,当对每一个测试集中的问题从 256 个生成的答案中选择最佳答案时,测试准确率可分别高达 97.7% 和 72.0%,这一结果说明即使是通用预训练下 7B 量级的小模型,也具备生成优质回答的巨大潜力,这一发现挑战了以往的观点,即强大的数学推理潜力并非仅限于大规模和数学相关预训练模型。来源:微信公众号【机器之心】
零一万物API正式上线:支持输入30万汉字,看不懂《百年孤独》的人有救了
国内的大模型独角兽公司零一万物,也在今天正式发布了 Yi 大模型 API 开放平台。此次 API 开放平台提供以下模型:Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能。Yi-34B-Chat-200K:200K 上下文,多文档阅读理解、超长知识库构建小能手。Yi-VL-Plus: 多模态模型,支持文本、视觉多模态输入,中文图表体验超过 GPT-4V。Yi-34B-Chat-200K 能够处理大约 30 万个中英文字符。我们可以拿文学类书籍来类比,32K 就像是一篇 2 万字的短篇小说(比如《潜伏》原著),128K 大概是一部中篇小说的体量(比如《人间失格》),而 200K 则相当于《呼啸山庄》、《百年孤独》、《骆驼祥子》这类长篇著作了。来源:微信公众号【机器之心】
DeepMind新款AI Agent会玩山羊模拟器和无人深空,目前已能完成600条指令
谷歌 DeepMind 的一款新的人工智能代理(AI Agent)学会了玩不同的游戏,包括它以前从未见过的游戏,比如山羊模拟器。这是一款有趣的动作游戏,具有夸张的物理效果。研究人员能够让它按照文本指令玩七种不同的游戏,并在三种不同的 3D 研究环境中移动。这是迈向更通用的人工智能的一步,因为它可以在多个环境中使用类似的技能。早期的人工智能系统只能精通一种游戏,或者只能遵循单个目标或命令,而这种新的人工智能代理能够玩各种不同的游戏,包括英灵神殿和无人深空。它被称为 SIMA,是“可扩展、可指导、多世界代理”的缩写。来源:微信公众号【DeepTech深科技】