1月28日·DeepSeek冲击芯片产业,英伟达市值暴跌6000亿
1月28日·周二 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
DeepSeek冲击芯片产业,英伟达市值暴跌6000亿
1月28日,美股科技股遭遇历史性崩盘,DeepSeek引发的市场恐慌成为导火索。英伟达股价暴跌17%,市值一夜蒸发近6000亿美元,创下单个公司史上最大市值损失纪录。此前,DeepSeek以极低的成本和性能受限的芯片完成了突破性AI模型的开发,引发了市场对传统算力需求的质疑。投资者普遍担心GPU支出可能见顶,导致英伟达及相关数据中心公司股价大幅下跌。与此同时,苹果因在AI竞争中投入较少,反而股价上涨3.3%。尽管AI大牛Karpathy强调算力仍是智能上限的关键,但市场恐慌情绪已难以平息,传统科技股和相关产业链均受到冲击。来源:微信公众号【新智元】

推理语言模型(RLM)蓝图发布,迈向通用人工智能新里程碑
ETH Zurich等机构的研究人员在arxiv上发表了一篇关于推理语言模型(Reasoning Language Models,RLM)的论文,提出了RLM的全面蓝图。RLM被视为迈向通用人工智能(AGI)的重要里程碑,其结合了大语言模型(LLM)、强化学习(RL)和高性能计算(HPC)三大关键方向,能够实现高效且灵活的系统2思维,突破传统LLM的局限。RLM分为隐式和显式两种类型,显式RLM通过显式推理机制(如蒙特卡洛树搜索)实现更灵活和可解释的推理过程。该蓝图还涵盖了RLM的通用架构、训练范式和数据生成方式,为未来开发新型推理模型提供了理论基础和实践指南。这一研究不仅有望让强推理模型如o3等更广泛地应用于大众,还可能推动AI技术在复杂问题解决和创新领域的突破。来源:微信公众号【新智元】
北大提出VARGPT:单一框架实现视觉理解与生成的自回归大一统
北京大学团队提出了一种新型多模态大模型——VARGPT,首次在单一自回归框架内实现了视觉理解和视觉生成任务的统一。VARGPT通过预测下一个token完成视觉理解,预测下一个scale完成视觉生成,展现出强大的混合模态输入输出能力。该模型基于LLaVA-1.5架构,创新性地引入了视觉解码器、多尺度图像分词器和特征投影器,建立起文本与视觉特征的高效映射关系。VARGPT采用三阶段统一训练流程,结合1.28M条预训练数据和3.86M条指令微调数据,显著提升了视觉问答和指令到图像生成的能力。在多个基准测试中,VARGPT超越了现有同规模多模态大模型,成为支持混合模态输入输出的强大工具。尽管目前VARGPT在图像分辨率和细节捕捉上仍有提升空间,但其为多模态任务的统一处理提供了全新思路,未来有望实现图像、文本和视频等多种模态的完全统一。来源:微信公众号【新智元】

MergeNet实现异构知识迁移,模型参数成通用载体
浙江大学和上海交通大学的研究团队提出了一种名为MergeNet的新型知识迁移框架,旨在实现跨异构模型架构、任务类型和数据模态的知识迁移。传统知识迁移方法(如知识蒸馏和迁移学习)依赖于模型结构或任务特征的共享,难以应对模型架构和任务类型差异较大的场景。MergeNet通过将模型参数作为知识的通用载体,采用低秩矩阵对异构知识进行统一表示,消除了模型架构差异。同时,引入低秩参数知识适配器(LPKA),利用注意力机制动态调整参数映射,解决了异构模型知识不兼容的问题。MergeNet的训练过程结合了自学习和互学习,通过知识迁移与自身优化相结合的方式,显著提升了模型性能。实验结果表明,MergeNet在跨结构、跨模态和跨任务知识迁移场景中均表现出色,为异构知识迁移提供了更灵活、通用的解决方案。来源:微信公众号【机器之心】

阿里Qwen开源视觉理解新旗舰,7B模型性能超GPT-4o-mini
阿里通义Qwen团队开源了全新的视觉理解模型Qwen2.5-VL,涵盖3B、7B和72B三种不同参数规模的版本。该模型被称为“旗舰视觉语言模型”,在视觉定位、通用图像识别、文档解析、视觉Agent操作、视频理解和文字识别等多方面表现出色。其中,7B版本的Qwen2.5-VL-7B-Instruct在多个任务中超越了GPT-4o-mini。此外,Qwen2.5-VL还具备无需特定任务微调即可作为视觉Agent操作的能力,尤其在文档和图表理解方面表现突出。该系列模型的开源,为开发者提供了强大的视觉理解工具,推动了多模态AI技术的发展。Qwen团队表示,未来将继续提升模型的推理能力和多模态整合能力,朝着综合全能模型的目标迈进。来源:微信公众号【量子位】