11月10日·奥特曼预言AGI时代即将到来,OpenAI掌握关键路径
11月10日·周日 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
奥特曼预言AGI时代即将到来,OpenAI掌握关键路径
在最新专访中,OpenAI CEO奥特曼透露,公司已掌握通往人工通用智能(AGI)的内部路径,预计ASI(超级智能)将在“几千天内”降临。奥特曼认为,目前是创办科技公司的最佳时机,深度学习的有效性将引领人类进入ASI时代。他强调,尽管可能遇到未知障碍,但复合增长的潜力巨大,未来可能实现充足能源、解决气候问题等重大挑战。此外,奥特曼还分享了OpenAI的“5级AGI”蓝图,从推理者到创新者,再到整个组织规模的巨变,展现了AI发展的宏伟愿景。来源:微信公众号【新智元】
哈佛开发新型AI癌症诊断工具CHIEF,准确率96%
哈佛医学院研究人员开发了一款名为CHIEF的多功能AI癌症诊断模型,其准确性高达96%,并已在《Nature》杂志上发表。CHIEF模型不仅能识别19种癌症类型,还能预测患者生存率,其灵活性类似于ChatGPT,远超现有癌症诊断模型。该模型通过分析肿瘤组织的数字切片,检测癌细胞并分析肿瘤的基因特征,同时考虑肿瘤微环境特征,这些特征与患者对治疗的反应相关。CHIEF在多种任务中表现出色,包括癌细胞检测、肿瘤起源识别、预测患者结果、识别与患者治疗反应相关的基因和DNA模式。该模型的训练涉及1500万张未标记图像和6万张全切片图像,测试结果在全球24家医院的19400多张全切片图像上进行,显示出卓越的性能。来源:微信公众号【新智元】
斯坦福团队发布HourVideo:空间智能领域的新基准
斯坦福大学李飞飞和吴佳俊团队推出了HourVideo,这是一个全新的基准数据集,旨在评估多模态模型对长达一小时视频的理解能力。HourVideo包含500个第一人称视角视频,覆盖77种日常活动,视频时长在20到120分钟之间。该数据集通过对比现有模型与人类专家的表现,揭示了当前模型在长视频理解上与人类水平的差距。HourVideo的设计包括总结、感知、视觉推理和导航等18个子任务,以全面测试模型的长期理解能力。实验结果显示,即使是最先进的多模态模型,其性能也远低于人类专家水平,表明在多模态能力上,大模型们仍有很大的提升空间。来源:微信公众号【量子位】
即插即用新框架SearchLVLMs提升多模态模型实时信息处理能力
上海人工智能实验室联合多所高校提出了一种名为SearchLVLMs的新型框架,该框架能够使多模态大模型在无需微调的情况下,通过互联网检索增强功能,对实时信息进行准确反馈。这一即插即用框架包含查询生成、搜索引擎调用和分层过滤三个核心部分,通过辅助模型以prompt形式在推理阶段提供信息,显著提升了模型对新信息的处理能力。实验结果显示,SearchLVLMs框架在多个模型上实现了超过50%的性能提升,甚至超过了一些自带互联网检索增强的闭源商用模型。这一成果为大模型的实时信息处理提供了新的解决方案,具有重要的实际应用价值。来源:微信公众号【量子位】
北大提出傅里叶分析神经网络FAN,强化周期性特征建模
北京大学计算机学院李戈教授团队提出了一种新型网络架构FAN(Fourier Analysis Networks),旨在解决现有基础模型如MLP和Transformer在周期性特征建模方面的缺陷。FAN通过引入傅里叶级数的思想,将周期性信息嵌入网络结构中,使模型能够更自然地捕捉和理解数据中的周期性模式。实验结果表明,FAN在周期性建模、符号公式表示、时间序列预测和语言建模等任务中表现优异,超过了Transformer等主流模型。FAN的设计不仅填补了现有模型在周期性建模上的空白,还减少了参数量和计算量,展现出广泛的应用潜力。来源:微信公众号【机器之心】
【今日案例】
智谱清言的AI视频聊天的应用场景
https://yuanbao.tencent.com/bot/app/share/chat/ade1297fd6b4e5a203a5c02cd7f1b0d5