1月28日·DeepSeek冲击芯片产业，英伟达市值暴跌6000亿

AI资讯速递1年前 (2025)更新 FuturX-Editor

499 0 0

1月28日·周二 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

DeepSeek冲击芯片产业，英伟达市值暴跌6000亿

1月28日，美股科技股遭遇历史性崩盘，DeepSeek引发的市场恐慌成为导火索。英伟达股价暴跌17%，市值一夜蒸发近6000亿美元，创下单个公司史上最大市值损失纪录。此前，DeepSeek以极低的成本和性能受限的芯片完成了突破性AI模型的开发，引发了市场对传统算力需求的质疑。投资者普遍担心GPU支出可能见顶，导致英伟达及相关数据中心公司股价大幅下跌。与此同时，苹果因在AI竞争中投入较少，反而股价上涨3.3%。尽管AI大牛Karpathy强调算力仍是智能上限的关键，但市场恐慌情绪已难以平息，传统科技股和相关产业链均受到冲击。来源：微信公众号【新智元】

推理语言模型（RLM）蓝图发布，迈向通用人工智能新里程碑

ETH Zurich等机构的研究人员在arxiv上发表了一篇关于推理语言模型（Reasoning Language Models，RLM）的论文，提出了RLM的全面蓝图。RLM被视为迈向通用人工智能（AGI）的重要里程碑，其结合了大语言模型（LLM）、强化学习（RL）和高性能计算（HPC）三大关键方向，能够实现高效且灵活的系统2思维，突破传统LLM的局限。RLM分为隐式和显式两种类型，显式RLM通过显式推理机制（如蒙特卡洛树搜索）实现更灵活和可解释的推理过程。该蓝图还涵盖了RLM的通用架构、训练范式和数据生成方式，为未来开发新型推理模型提供了理论基础和实践指南。这一研究不仅有望让强推理模型如o3等更广泛地应用于大众，还可能推动AI技术在复杂问题解决和创新领域的突破。来源：微信公众号【新智元】

北大提出VARGPT：单一框架实现视觉理解与生成的自回归大一统

北京大学团队提出了一种新型多模态大模型——VARGPT，首次在单一自回归框架内实现了视觉理解和视觉生成任务的统一。VARGPT通过预测下一个token完成视觉理解，预测下一个scale完成视觉生成，展现出强大的混合模态输入输出能力。该模型基于LLaVA-1.5架构，创新性地引入了视觉解码器、多尺度图像分词器和特征投影器，建立起文本与视觉特征的高效映射关系。VARGPT采用三阶段统一训练流程，结合1.28M条预训练数据和3.86M条指令微调数据，显著提升了视觉问答和指令到图像生成的能力。在多个基准测试中，VARGPT超越了现有同规模多模态大模型，成为支持混合模态输入输出的强大工具。尽管目前VARGPT在图像分辨率和细节捕捉上仍有提升空间，但其为多模态任务的统一处理提供了全新思路，未来有望实现图像、文本和视频等多种模态的完全统一。来源：微信公众号【新智元】

MergeNet实现异构知识迁移，模型参数成通用载体

浙江大学和上海交通大学的研究团队提出了一种名为MergeNet的新型知识迁移框架，旨在实现跨异构模型架构、任务类型和数据模态的知识迁移。传统知识迁移方法（如知识蒸馏和迁移学习）依赖于模型结构或任务特征的共享，难以应对模型架构和任务类型差异较大的场景。MergeNet通过将模型参数作为知识的通用载体，采用低秩矩阵对异构知识进行统一表示，消除了模型架构差异。同时，引入低秩参数知识适配器（LPKA），利用注意力机制动态调整参数映射，解决了异构模型知识不兼容的问题。MergeNet的训练过程结合了自学习和互学习，通过知识迁移与自身优化相结合的方式，显著提升了模型性能。实验结果表明，MergeNet在跨结构、跨模态和跨任务知识迁移场景中均表现出色，为异构知识迁移提供了更灵活、通用的解决方案。来源：微信公众号【机器之心】

阿里Qwen开源视觉理解新旗舰，7B模型性能超GPT-4o-mini

阿里通义Qwen团队开源了全新的视觉理解模型Qwen2.5-VL，涵盖3B、7B和72B三种不同参数规模的版本。该模型被称为“旗舰视觉语言模型”，在视觉定位、通用图像识别、文档解析、视觉Agent操作、视频理解和文字识别等多方面表现出色。其中，7B版本的Qwen2.5-VL-7B-Instruct在多个任务中超越了GPT-4o-mini。此外，Qwen2.5-VL还具备无需特定任务微调即可作为视觉Agent操作的能力，尤其在文档和图表理解方面表现突出。该系列模型的开源，为开发者提供了强大的视觉理解工具，推动了多模态AI技术的发展。Qwen团队表示，未来将继续提升模型的推理能力和多模态整合能力，朝着综合全能模型的目标迈进。来源：微信公众号【量子位】 1月28日·DeepSeek冲击芯片产业，英伟达市值暴跌6000亿