4月22日·国产视频生成大模型Vidu Q1登顶VBench，性价比超高

332 0 0

4月22日·周二 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

国产视频生成大模型Vidu Q1登顶VBench，性价比超高

近日，国产大模型Vidu Q1在全球视频生成领域崭露头角，荣登权威评测基准VBench-1.0和VBench-2.0的榜首。Vidu Q1由生数科技推出，凭借其卓越的视频生成能力，超越了Sora、Runway等国内外顶尖模型。该模型支持1080p高清画质，能够生成好莱坞级的首尾帧运镜效果，细节逼真，且价格仅为同行的十分之一，每秒低至0.3元。Vidu Q1不仅在视频生成逼真度上遥遥领先，还在内容真实性上取得了优异成绩。此外，它还具备强大的首尾帧功能，能够基于两张图实现电影级的百万运镜效果，流畅自然，仿佛出自专业导演之手。Vidu Q1的上线，为视频创作带来了全新的可能，无论是广告、动漫还是电影特效，都能轻松驾驭。目前，用户已可在Vidu APP或官网体验这一高质量模型。来源：微信公众号【新智元】

Transformer作者新研究：简单指令“Wait”激发LLM反思能力

Transformer的首席作者Ashish Vaswani团队在最新研究中发现，仅通过预训练，大语言模型（LLM）就能展现出自我反思和纠正的能力，而无需依赖强化学习（RL）。研究团队通过在预训练阶段引入对抗性数学应用题，发现模型在接收到简单指令“Wait”后，能够有效激发显式反思，表现甚至堪比直接告知模型存在错误时的修正效果。这一发现表明，预训练过程本身就能塑造通用推理能力，为加速模型推理能力的习得开辟了新路径。此外，研究还发现，随着预训练计算量的增加，模型的反思能力显著增强，准确率与预训练计算量的对数之间呈现高相关性。这一成果不仅挑战了DeepSeek关于反思能力源于强化学习的观点，也为未来LLM的设计和优化提供了新的思路。来源：微信公众号【新智元】

全球首个自回归视频生成大模型MAGI-1开源

近日，由马尔奖得主曹越创立的Sand AI团队开源了全球首个自回归视频生成大模型MAGI-1。该模型通过自回归预测视频块序列来生成视频，具有流畅度高、精准时间轴控制和自然运动三大特点。MAGI-1能够生成一镜到底的长视频场景，支持秒级时间轴控制，并克服了传统AI视频生成中动作僵硬的问题，生成效果自然流畅。此外，MAGI-1还提供视频扩展功能，用户可直接续写生成更长视频片段，无需手动拼接。目前，该模型已推出24B和4.5B参数版本，并在GitHub和HuggingFace页面提供预训练权重，供开发者下载使用。MAGI-1的发布标志着视频生成技术的新突破，为实时、快速视频生成奠定了基础。来源：微信公众号【机器之心】

生成式AI进入第二幕：认知工程引领AI新纪元

生成式AI的发展正在经历一场重大变革，从以预训练和提示工程为核心的第一幕，迈向以测试时扩展（Test-Time Scaling）和认知工程为核心的第二幕。上海交通大学与创智学院联合提出“认知工程”概念，标志着AI从知识管理工具向深度思考的认知管理工具转变。在第一幕中，生成式AI取得了显著成就，但也暴露出在复杂推理、知识更新和深度思考方面的局限性。第二幕通过测试时扩展技术，如并行采样、树搜索、多轮修正和长思维链推理，显著提升了模型的推理能力和智能水平。此外，认知工程还催生了“认知数据工程”，强调从人类思维过程和AI自主发现中获取数据，以推动AI的进一步发展。这一转变不仅将改变AI的能力边界，还将重塑人类与技术的协作方式，开启AI作为“思考伙伴”的新时代。来源：微信公众号【机器之心】

复旦团队研发“史上最快闪存技术”，突破速度极限登Nature

复旦大学周鹏-刘春森团队研发的皮秒闪存器件“破晓（PoX）”成功登上《Nature》，其擦写速度达到亚纳秒级，比现有闪存快1万倍，每秒可执行操作25亿次。该技术通过将传统硅材料替换为石墨烯等二维材料，利用二维材料增强的热载流子注入机制，显著提高了载流子注入效率。实验表明，该闪存器件在低至5V的编程电压下，可实现400皮秒的超快编程速度，编程/擦除循环寿命超过550万次，数据保存年限可达十年以上。这一成果不仅突破了闪存速度的理论极限，还为未来高性能存储技术的发展提供了新的方向。来源：微信公众号【量子位】