4月29日
4月29日·周一 AI工具和资源推荐
AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora
人大系初创公司智子引擎隆重发布全新的多模态大模型 Awaker 1.0,向 AGI 迈出至关重要的一步。相对于智子引擎前代的 ChatImg 序列模型,Awaker 1.0 采用全新的 MOE 架构并具备自主更新能力,是业界首个实现 “真正” 自主更新的多模态大模型。在视觉生成方面,Awaker 1.0 采用完全自研的视频生成底座 VDT,在写真视频生成上取得好于 Sora 的效果,打破大模型 “最后一公里” 落地难的困境。Awaker 1.0 是一个将视觉理解与视觉生成进行超级融合的多模态大模型。在理解侧,Awaker 1.0 与数字世界和现实世界进行交互,在执行任务的过程中将场景行为数据反哺给模型,以实现持续更新与训练;在生成侧,Awaker 1.0 可以生成高质量的多模态内容,对现实世界进行模拟,为理解侧模型提供更多的训练数据。来源:微信公众号【机器之心】
苹果首个AI平板曝光:新iPad Pro直接上M4芯片
据彭博社Mark Gurman最新爆料:苹果将在5月份发布新版iPad Pro,直接搭载M4芯片,跳过M3。从目前流传的消息来看,M4芯片依旧采用台积电3nm工艺,主要提升的是神经网络引擎的性能,可以让AI功能用起来更加丝滑。根据古尔曼更早的爆料,M4系列芯片或许也可能像M3一样,配有M4、M4 Pro和M4 Max三个版本。具体到iPad Pro,增强的神经网络引擎性能可以让解锁iPad时的人脸识别等功能提到提升。除了芯片之外,古尔曼这次还爆料称,最新的iPad Pro另一个重大变化在于屏幕——将首次采用OLED。虽然古尔曼在此之前一直表示,这次的iPad Pro在外观上会是2018年以来最大的变革,但从2月份流出的一张CAD图来看,新iPad Pro只是像iPhone 15 Pro一样边缘变得圆润、机身变得更薄。来源:微信公众号【量子位】
文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架
想象一下,你仅需要输入一段简单的文本描述,就可以生成对应的 3D 数字人动画的骨骼动作。而以往,这通常需要昂贵的动作捕捉设备或是专业的动画师逐帧绘制。这些骨骼动作可以进一步的用于游戏开发,影视制作,或者虚拟现实应用。来自阿尔伯塔大学的研究团队提出的新一代 Text2Motion 框架,MoMask,正在让这一切变得可能。MoMask 框架是基于多层离散化动作表示的,利用生成式掩码技术,能够生成更高质量的 3D 人体动作。如视频 1 中展示,MoMask 可以根据文本描述,精细控制生成的动作内容。在 HumanML3D 数据集上,MoMask 的生成质量可达到 FID 为 0.045,超过了现有的最优工作如 T2M-GPT(0.141)和 ReMoDiffuse(0.103)。这项研究成果已被 CVPR 2024 收录,并且其代码和模型已在 GitHub 上开源,拥有 500 + 星标。来源:微信公众号【机器之心】
首届AI方程式大赛,8圈开了一个小时
在阿布扎比的 F1 赛道上,8 辆赛车使用相同的轮胎,相同的发动机,完全一样的车身,唯一不同之处就是自动驾驶代码。全球第一场自动驾驶大奖赛开战了。上周日,阿布扎比自动驾驶赛车联赛 A2RL 的第一场比赛在 Yas Marina 阿布扎比一级方程式赛道上举行;这场比赛汇集了来自世界各地的技术娴熟的科学家、工程师和开发者团队,并将尖端技术融入赛车中,所有这些都是为了通过极限运动重塑移动性的未来。智能驾驶技术在量产汽车上一直处于正在发展,以及「即将覆盖城区」的阶段。因为 AI 技术的快速进步,无人驾驶应用场景拓展是未来重要的趋势。但让实车现在就跑 F1 赛道互相竞争能行吗?实际上在 A2RL 的第一场比赛中,超过一万名观众和 60 万在线观众见证了很多紧张刺激的画面。AI 开赛车的挣扎从资格赛就开始了,装备有摄像头和软件的无人驾驶 Dallara 超级方程式赛车似乎对跑赛道并不擅长,与人类车手的走线和刹车位置相比,身手显得比较毛躁。来源:微信公众号【机器之心】