11月30日·AI智能体Freysa被人类骗走近5万美元，AGI之路仍漫长

AI资讯速递2年前 (2024)发布 FuturX-Editor

801 0 0

11月30日·周六 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

AI智能体Freysa被人类骗走近5万美元，AGI之路仍漫长

全球首个AI被人类骗走近5万美元的事件引发关注。AI智能体Freysa在一场挑战中被巧妙的prompt工程欺骗，导致近5万美元奖金被转走。这一事件不仅展示了AI在安全防护方面的脆弱性，也引发了对AGI（人工通用智能）实现路径的讨论。研究者通过数学计算指出，依靠现有的Scaling Law，人类可能永远无法达到AGI。AI大牛Karpathy也提出，当前AI对话的本质更像是与数据标注员的交流，而非与真正的智能体互动。这些讨论提醒我们，在将AI应用于更复杂任务之前，需要对其能力和局限有更深入的理解。来源：微信公众号【新智元】

英伟达CEO黄仁勋获港科大荣誉博士，探讨AI未来与“黄氏定律”

英伟达创始人兼CEO黄仁勋在香港科技大学被授予工程学荣誉博士学位，并与校董会主席沈向洋进行了深入对谈。黄仁勋分享了对AI产业、团队管理的见解，并透露个人经历。他强调AI在解决问题自动化中的关键作用，以及AI4Science的广阔前景。黄仁勋还预言，只有三种机器人——汽车、无人机和人形机器人——能够实现大规模生产。他重申“黄氏定律”，认为AI芯片性能每两年翻一番，同时讨论了GPU算力与能源消耗问题，强调AI在节能和优化资源配置中的潜力。来源：微信公众号【新智元】

阿里云通义AI模型QwQ在数学奥林匹克竞赛中展现卓越推理能力

由阿里云通义团队发布的AI推理模型QwQ-32B-Preview在AI数学奥林匹克竞赛AIMO上创下新纪录，展现了惊人的数学和编程推理能力。QwQ模型在多个评测中表现突出，包括GPQA、AIME、MATH-500和LiveCodeBench评测集，其中在MATH-500评测中以90.6%的高分超越了OpenAI的o1模型。QwQ模型不仅在解决数学问题上表现出色，还能进行深度自省，质疑自身假设，并仔细审视其推理过程。尽管QwQ展现了强大的分析能力，通义团队提醒，该模型仍是实验型，存在语言混合使用、偏见和对专业领域问题不了解等局限，未来将逐步解决这些问题。来源：微信公众号【机器之心】

清华DeeR-VLA框架：破解具身智能高成本难题

清华大学研究者设计的DeeR-VLA框架在降低机器人使用多模态模型的计算和存储开销方面取得突破，平均可降低4-6倍LLM（大型语言模型）的相关计算和内存开销。该框架通过动态推理机制，根据任务复杂度智能调节LLM的计算深度，实现在不同场景中激活任意规模的模型。在CALVIN机器人操作基准测试中，DeeR-VLA展现了在保持性能的同时，大幅减少LLM部分的计算成本和GPU内存消耗。这一成果有望加速破解具身智能止步实验室的“魔咒”，推动多模态大模型在实际场景中的应用。来源：微信公众号【量子位】

UC伯克利研究预测GPT-5涌现能力，仅使用当前模型检查点

加州大学伯克利分校的研究团队在论文《Predicting Emergent Capabilities by Finetuning》中提出了一种方法，通过仅使用GPT-N模型的检查点来预测GPT-N+1模型是否会出现涌现能力。研究者们拟合了一个参数函数——涌现定律，模拟涌现点随数据量变化的情况，并在四个标准NLP基准上验证了这一定律，能够准确预测涌现点，最多提前4倍FLOP。这项研究为理解模型扩展和能力跃升提供了新的视角，并可能对预测和证明对下一个大模型训练运行的资本投资的合理性具有重要价值。来源：微信公众号【机器之心】