1月16日· Vidu 2.0:国产AI视频的全球爆火与创新突破

1月16日·周四  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

Vidu 2.0:国产AI视频的全球爆火与创新突破

国产AI视频平台Vidu 2.0自上线以来,在全球范围内引发广泛关注。该平台以惊人的速度、超低的成本和卓越的视频质量,迅速赢得了全球用户的青睐。Vidu 2.0的视频生成速度突破至秒级,10秒内即可生成高质量视频,成本更是低至1秒4分钱,进入“分”时代。其生成的视频不仅风格一致,还能实现首尾帧过渡丝滑、镜头运动自然流畅等效果。Vidu 2.0还推出了“参考生视频”功能,进一步提升了视频生成的可控性。自7月底全球上线以来,Vidu仅用20天用户数突破百万,100天突破千万,目前平台累计生成视频已突破1亿条,服务范围覆盖全球超200个国家和地区,用户规模位列全球第一梯队。Vidu 2.0的成功,不仅展现了中国技术创新的实力,也为视频生成行业树立了新的里程碑,推动AI视频进入“秒级时代”。来源:微信公众号【新智元】

1月16日· Vidu 2.0:国产AI视频的全球爆火与创新突破

Keras之父押注程序合成,开启AGI新征途

Keras之父François Chollet与Mike Knoop共同创立了全新AI实验室Ndea,致力于探索通往AGI(通用人工智能)的新路径——深度学习引导的程序合成。这一理念曾是Chollet在谷歌的业余项目,如今成为Ndea的核心研究方向。他们认为,程序合成能将规格转化为解决方案,是解锁AGI的关键。Ndea的目标是构建前沿AI系统,融合直观模式识别与形式推理,以实现自主抽象和技能获取。Chollet强调,若在程序合成领域取得成功,其应用将超越AI,推广至科学问题,加速科学进步。Ndea的成立标志着AI研究的新拐点,预示着程序合成或将成为推动AGI发展的关键力量。来源:微信公众号【新智元】

1月16日· Vidu 2.0:国产AI视频的全球爆火与创新突破

阶跃星辰发布Step R-mini,推理模型迎来“文理兼修”新时代

国产大模型“六小虎”成员阶跃星辰近日发布了最新一代模型——Step Reasoner mini(简称“Step R-mini”),这是其Step系列模型家族的首个推理模型。Step R-mini擅长主动规划、尝试和反思,通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。它不仅在逻辑推理、代码和数学等复杂问题上表现出色,在文学创作等通用领域也有不俗表现,实现了“文理兼修”。在基准测试中,Step R-mini在AIME 2024和Math500数学基准上均达到SOTA水平,代码能力也在LiveCodeBench任务上超越了o1-preview。此外,阶跃星辰还在打造多模态推理的视觉推理模型,将推理能力融入更多交互形态的大模型中,进一步拓展了模型的应用边界。来源:微信公众号【机器之心】

1月16日· Vidu 2.0:国产AI视频的全球爆火与创新突破

理想汽车推出端到端自动驾驶,AI推理可视化成亮点

近日,理想汽车的OTA7.0正式版向全量车主推送,其OneModel端到端+VLM智驾系统实现了“全场景端到端”能力,成为国内唯一、全球第二家将端到端技术应用于城市、高速及环路NOA场景的车企。此次更新的最大亮点是行业首创的AI推理可视化功能,它首次将自动驾驶过程中AI模型的思考推理过程直观展示出来,增强了用户对智能驾驶系统的信任。理想汽车的端到端智驾系统覆盖从车位到车位的全程,支持全国新开通高速、长隧道、城市/高速切换点等道路的行驶,能够在大部分路段无降级不断点地智驾通行。该系统通过端到端模型实现类似本能的快思考,保证大多数场景的高效;利用速度偏慢但思考能力上限更高的AI模型(DriveVLM)实现少数复杂场景下的处理能力,使智能驾驶系统更加拟人化。理想汽车的这一创新,不仅提升了智能驾驶的体验,也为自动驾驶技术的发展提供了新的方向。来源:微信公众号【机器之心】

1月16日· Vidu 2.0:国产AI视频的全球爆火与创新突破

国产AI MiniCPM-o 2.6开源,8B参数端侧运行引关注

国产AI模型MiniCPM-o 2.6由面壁智能推出,在海外引发广泛关注。该模型仅8B参数,却能在iPad等端侧设备上流畅运行,多模态能力与GPT-4o相当。MiniCPM-o 2.6具备强大的“看、听、说”能力,能精准识别声音、理解视频内容,并以自然语言进行交流,甚至能模仿不同口音。其在多项评测中表现优异,被面壁智能称为开源社区最强语音通用模型、最强端侧视觉通用模型及最强实时流式多模态模型。该模型采用端到端全模态架构,通过时分复用的全模态流式信息处理机制,实现高效低延迟交互。面壁智能一直专注于端侧模型优化,致力于在手机、PC等设备上实现大模型的高效运行。MiniCPM-o 2.6的开源,为AI原生应用和硬件的发展提供了新思路,也极大便利了视障人士等特殊群体。来源:微信公众号【量子位】

1月16日· Vidu 2.0:国产AI视频的全球爆火与创新突破

【今日案例】

为什么这些豪车车主,主动巡游,甚至打卡排班展示豪车呢?背后的心理诉求是什么?

https://kimi.moonshot.cn/share/cu2is1df4399307qjl20

© 版权声明

相关文章

暂无评论

暂无评论...