4月22日·国产视频生成大模型Vidu Q1登顶VBench,性价比超高
4月22日·周二 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
国产视频生成大模型Vidu Q1登顶VBench,性价比超高
近日,国产大模型Vidu Q1在全球视频生成领域崭露头角,荣登权威评测基准VBench-1.0和VBench-2.0的榜首。Vidu Q1由生数科技推出,凭借其卓越的视频生成能力,超越了Sora、Runway等国内外顶尖模型。该模型支持1080p高清画质,能够生成好莱坞级的首尾帧运镜效果,细节逼真,且价格仅为同行的十分之一,每秒低至0.3元。Vidu Q1不仅在视频生成逼真度上遥遥领先,还在内容真实性上取得了优异成绩。此外,它还具备强大的首尾帧功能,能够基于两张图实现电影级的百万运镜效果,流畅自然,仿佛出自专业导演之手。Vidu Q1的上线,为视频创作带来了全新的可能,无论是广告、动漫还是电影特效,都能轻松驾驭。目前,用户已可在Vidu APP或官网体验这一高质量模型。来源:微信公众号【新智元】

Transformer作者新研究:简单指令“Wait”激发LLM反思能力
Transformer的首席作者Ashish Vaswani团队在最新研究中发现,仅通过预训练,大语言模型(LLM)就能展现出自我反思和纠正的能力,而无需依赖强化学习(RL)。研究团队通过在预训练阶段引入对抗性数学应用题,发现模型在接收到简单指令“Wait”后,能够有效激发显式反思,表现甚至堪比直接告知模型存在错误时的修正效果。这一发现表明,预训练过程本身就能塑造通用推理能力,为加速模型推理能力的习得开辟了新路径。此外,研究还发现,随着预训练计算量的增加,模型的反思能力显著增强,准确率与预训练计算量的对数之间呈现高相关性。这一成果不仅挑战了DeepSeek关于反思能力源于强化学习的观点,也为未来LLM的设计和优化提供了新的思路。来源:微信公众号【新智元】

全球首个自回归视频生成大模型MAGI-1开源
近日,由马尔奖得主曹越创立的Sand AI团队开源了全球首个自回归视频生成大模型MAGI-1。该模型通过自回归预测视频块序列来生成视频,具有流畅度高、精准时间轴控制和自然运动三大特点。MAGI-1能够生成一镜到底的长视频场景,支持秒级时间轴控制,并克服了传统AI视频生成中动作僵硬的问题,生成效果自然流畅。此外,MAGI-1还提供视频扩展功能,用户可直接续写生成更长视频片段,无需手动拼接。目前,该模型已推出24B和4.5B参数版本,并在GitHub和HuggingFace页面提供预训练权重,供开发者下载使用。MAGI-1的发布标志着视频生成技术的新突破,为实时、快速视频生成奠定了基础。来源:微信公众号【机器之心】

生成式AI进入第二幕:认知工程引领AI新纪元
生成式AI的发展正在经历一场重大变革,从以预训练和提示工程为核心的第一幕,迈向以测试时扩展(Test-Time Scaling)和认知工程为核心的第二幕。上海交通大学与创智学院联合提出“认知工程”概念,标志着AI从知识管理工具向深度思考的认知管理工具转变。在第一幕中,生成式AI取得了显著成就,但也暴露出在复杂推理、知识更新和深度思考方面的局限性。第二幕通过测试时扩展技术,如并行采样、树搜索、多轮修正和长思维链推理,显著提升了模型的推理能力和智能水平。此外,认知工程还催生了“认知数据工程”,强调从人类思维过程和AI自主发现中获取数据,以推动AI的进一步发展。这一转变不仅将改变AI的能力边界,还将重塑人类与技术的协作方式,开启AI作为“思考伙伴”的新时代。来源:微信公众号【机器之心】

复旦团队研发“史上最快闪存技术”,突破速度极限登Nature
复旦大学周鹏-刘春森团队研发的皮秒闪存器件“破晓(PoX)”成功登上《Nature》,其擦写速度达到亚纳秒级,比现有闪存快1万倍,每秒可执行操作25亿次。该技术通过将传统硅材料替换为石墨烯等二维材料,利用二维材料增强的热载流子注入机制,显著提高了载流子注入效率。实验表明,该闪存器件在低至5V的编程电压下,可实现400皮秒的超快编程速度,编程/擦除循环寿命超过550万次,数据保存年限可达十年以上。这一成果不仅突破了闪存速度的理论极限,还为未来高性能存储技术的发展提供了新的方向。来源:微信公众号【量子位】
