8月19日·GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史
8月19日·周二 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史
GPT-5的“屎山代码”与七年进化史 OpenAI的GPT系列模型从2018年的GPT-1发展到如今的GPT-5,经历了显著的进化。通过14个精心设计的Prompt,我们可以直观地看到这些模型在处理各种任务时的能力变化。从最初的简单回答到如今的复杂推理,GPT系列在语言生成、代码编写、数学解答等多个领域表现出色。然而,GPT-5在某些情况下也暴露出问题,例如生成“屎山代码”,即复杂且难以维护的代码。这表明尽管模型在某些方面取得了巨大进步,但在代码生成等任务上仍需进一步优化。OpenAI通过这些Prompt展示了GPT系列的成长历程,也让用户对模型的潜力和局限有了更清晰的认识。来源:微信公众号【新智元】

GPT-4o-mini华人领队离开OpenAI:真正推动AI进步的是互联网
前OpenAI研究员Kevin Lu宣布加入由前OpenAI CTO Mira Murati创立的Thinking Machines Lab。Kevin Lu曾主导GPT-4o mini的发布,专注于强化学习、小模型与合成数据。他在博客中指出,真正推动AI进步的不是模型架构,而是互联网。互联网提供了丰富且多样化的数据来源,是AI模型实现规模化扩展的关键技术。他认为,未来的研究应更多关注数据的消费方式,而非单纯追求架构优化。来源:微信公众号【新智元】

开源版Genie 3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
昆仑万维发布了开源交互世界模型Matrix-Game 2.0,参数量仅1.8B,可在单块GPU上运行,生成的虚拟环境帧率可达25FPS。该模型支持实时长序列交互,用户可通过键盘控制人物移动和视角切换。Matrix-Game 2.0在复杂环境生成和物理一致性方面表现出色,被认为是开源版本的Genie 3。其开源性质为开发者提供了极大的灵活性和创新空间。来源:微信公众号【机器之心】

图生视频新玩法刷爆外网:图上画两笔就能动起来,终于告别文本提示
Higgsfield AI推出了Draw-to-Video功能,用户只需上传一张静态图像,在上面绘制图形、文字或箭头等元素,即可生成具有电影质感的视频画面。该功能无需文本提示,通过简单的图形动作指引即可完成创作,极大地简化了视频生成的流程。Draw-to-Video的推出标志着AI视频生成技术的一次重大突破,为内容创作者提供了更直观、更高效的创作工具。来源:微信公众号【机器之心】

突破Claude-4编程上限!自进化Agent框架拿下新SOTA,底模越好性能越高,已开源
中科院、清华大学和阶跃星辰等机构提出了SE-Agent,一个创新的自进化框架。SE-Agent通过修订、重组和精炼等操作,让智能体学会系统性地优化其思考过程。在SWE-Bench Verified基准测试中,SE-Agent取得了80%的Top-1 Resolution Rate,刷新了领域纪录。该框架证明了其随着基础模型升级而不断进步的能力,为提升LLM智能体的复杂推理能力提供了新的范式。来源:微信公众号【量子位】
