7月5日· AI创新前沿:智能体技术与多模态交互的融合突破

AI资讯速递2个月前更新 大Joe
69 0

7月5日·周五 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

联汇科技发布OmAgent,引领智能体技术新浪潮

联汇科技在世界人工智能大会期间发布了第二代多模态智能体OmAgent,标志着智能体技术进入新的发展阶段。OmAgent的感知模块OmDet V2实现了20倍以上的速度提升,大幅增强了边缘计算设备的应用潜力。同时,OmChat V2思考决策模型支持复杂输入,显著提升了智能体的自主决策能力。联汇科技还宣布OmAgent框架全面开源,旨在推动智能体技术在更广领域的应用,构建开放的智能体生态。来源:微信公众号【机器之心】

7月5日· AI创新前沿:智能体技术与多模态交互的融合突破

穹彻智能发布Noematrix Brain,推动具身智能技术新发展

在2024年世界人工智能大会上,穹彻智能Noematrix推出了其创新产品——穹彻具身大脑Noematrix Brain,旨在加速具身智能大模型的落地应用。该技术通过实体机器人展示了衣物折叠和黄瓜削皮等高难度操作,展现了其在复杂物体操作和精细度方面的超越人类水平的能力。Noematrix Brain结合了原子技能库AnySkill和基础软件框架,为机器人提供了规划、记忆和执行等核心能力,推动了具身智能技术在零售、物流、家庭服务等领域的应用发展。来源:微信公众号【机器之心】

7月5日· AI创新前沿:智能体技术与多模态交互的融合突破

商汤科技推出国内首个流式多模态交互模型5o

商汤科技在最新活动中发布了国内首个流式多模态交互模型——日日新5.5系列中的5o,这是一款拥有6000亿参数的先进AI模型。5o模型不仅声音拟人且实时响应,还能处理图像和视频等多种模态,实现与人类的生动丰富交流。商汤CEO徐立宣布,这项技术很快将面向公众。此外,商汤还展示了基于日日新5.5能力打造的Vimi,这是首个可控人物视频生成大模型,仅需一张照片即可生成长达1分钟的视频,为视频创作者提供了强大的AI工具。商汤的这些创新技术标志着人工智能交互模式的重大进步。来源:微信公众号【量子位】

7月5日· AI创新前沿:智能体技术与多模态交互的融合突破

贾佳亚团队突破:10k数据显著提升大模型数学能力

香港中文大学贾佳亚团队提出了一种创新的优化策略Step-DPO,显著提升了大型语言模型在数学推理任务上的表现。该方法借鉴了教师指导学生时指出错误步骤的教育方式,通过细化直接偏好优化(DPO),使得72B参数的Qwen模型在数学成绩上超越了GPT-4等闭源模型。仅需10k数据和少量训练步骤,Step-DPO就能在多个数据集上实现5.6%的准确率提升,并且在长链条推理任务上展现出更强的能力。这项工作不仅展示了大模型在数学领域的潜力,也为未来教育技术的发展提供了新思路。来源:微信公众号【量子位】

7月5日· AI创新前沿:智能体技术与多模态交互的融合突破

AI革新二次元创作:YoYo动漫视频一键生成

国产AI视频生成技术取得突破,二次元动漫视频制作变得轻松便捷。通过YoYo创作网站,动漫爱好者只需通过简单的文字提示或图片上传,即可一键生成高质量、风格多样的动漫视频内容。这项技术不仅解决了传统动漫制作的复杂性,还大幅降低了创作门槛,让每个爱好者都能轻松创作出具有电影级画面的动漫作品。YoYo平台支持从哥特风到梦幻风,再到机甲风的一键生成,为二次元创作者提供了强大的工具,预示着AI在动漫制作领域的广泛应用前景。来源:微信公众号【新智元】

7月5日· AI创新前沿:智能体技术与多模态交互的融合突破

【今日案例】

如何让模拟飞行帮助孩子摆脱游戏成瘾

https://kimi.moonshot.cn/share/cq3c3equl72c066f3ifg

© 版权声明

相关文章

暂无评论

暂无评论...