1月28日·DeepSeek冲击芯片产业,英伟达市值暴跌6000亿

1月28日·周二  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

DeepSeek冲击芯片产业,英伟达市值暴跌6000亿

1月28日,美股科技股遭遇历史性崩盘,DeepSeek引发的市场恐慌成为导火索。英伟达股价暴跌17%,市值一夜蒸发近6000亿美元,创下单个公司史上最大市值损失纪录。此前,DeepSeek以极低的成本和性能受限的芯片完成了突破性AI模型的开发,引发了市场对传统算力需求的质疑。投资者普遍担心GPU支出可能见顶,导致英伟达及相关数据中心公司股价大幅下跌。与此同时,苹果因在AI竞争中投入较少,反而股价上涨3.3%。尽管AI大牛Karpathy强调算力仍是智能上限的关键,但市场恐慌情绪已难以平息,传统科技股和相关产业链均受到冲击。来源:微信公众号【新智元】

1月28日·DeepSeek冲击芯片产业,英伟达市值暴跌6000亿

推理语言模型(RLM)蓝图发布,迈向通用人工智能新里程碑

ETH Zurich等机构的研究人员在arxiv上发表了一篇关于推理语言模型(Reasoning Language Models,RLM)的论文,提出了RLM的全面蓝图。RLM被视为迈向通用人工智能(AGI)的重要里程碑,其结合了大语言模型(LLM)、强化学习(RL)和高性能计算(HPC)三大关键方向,能够实现高效且灵活的系统2思维,突破传统LLM的局限。RLM分为隐式和显式两种类型,显式RLM通过显式推理机制(如蒙特卡洛树搜索)实现更灵活和可解释的推理过程。该蓝图还涵盖了RLM的通用架构、训练范式和数据生成方式,为未来开发新型推理模型提供了理论基础和实践指南。这一研究不仅有望让强推理模型如o3等更广泛地应用于大众,还可能推动AI技术在复杂问题解决和创新领域的突破。来源:微信公众号【新智元】

1月28日·DeepSeek冲击芯片产业,英伟达市值暴跌6000亿

北大提出VARGPT:单一框架实现视觉理解与生成的自回归大一统

1月28日·DeepSeek冲击芯片产业,英伟达市值暴跌6000亿

MergeNet实现异构知识迁移,模型参数成通用载体

浙江大学和上海交通大学的研究团队提出了一种名为MergeNet的新型知识迁移框架,旨在实现跨异构模型架构、任务类型和数据模态的知识迁移。传统知识迁移方法(如知识蒸馏和迁移学习)依赖于模型结构或任务特征的共享,难以应对模型架构和任务类型差异较大的场景。MergeNet通过将模型参数作为知识的通用载体,采用低秩矩阵对异构知识进行统一表示,消除了模型架构差异。同时,引入低秩参数知识适配器(LPKA),利用注意力机制动态调整参数映射,解决了异构模型知识不兼容的问题。MergeNet的训练过程结合了自学习和互学习,通过知识迁移与自身优化相结合的方式,显著提升了模型性能。实验结果表明,MergeNet在跨结构、跨模态和跨任务知识迁移场景中均表现出色,为异构知识迁移提供了更灵活、通用的解决方案。来源:微信公众号【机器之心】

1月28日·DeepSeek冲击芯片产业,英伟达市值暴跌6000亿

阿里Qwen开源视觉理解新旗舰,7B模型性能超GPT-4o-mini

阿里通义Qwen团队开源了全新的视觉理解模型Qwen2.5-VL,涵盖3B、7B和72B三种不同参数规模的版本。该模型被称为“旗舰视觉语言模型”,在视觉定位、通用图像识别、文档解析、视觉Agent操作、视频理解和文字识别等多方面表现出色。其中,7B版本的Qwen2.5-VL-7B-Instruct在多个任务中超越了GPT-4o-mini。此外,Qwen2.5-VL还具备无需特定任务微调即可作为视觉Agent操作的能力,尤其在文档和图表理解方面表现突出。该系列模型的开源,为开发者提供了强大的视觉理解工具,推动了多模态AI技术的发展。Qwen团队表示,未来将继续提升模型的推理能力和多模态整合能力,朝着综合全能模型的目标迈进。来源:微信公众号【量子位】1月28日·DeepSeek冲击芯片产业,英伟达市值暴跌6000亿

© 版权声明

相关文章

暂无评论

暂无评论...