5月9日·ChatGPT深度研究功能接入GitHub，助力开发者高效工作

638 0 0

5月9日·周五 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

ChatGPT深度研究功能接入GitHub，助力开发者高效工作

ChatGPT推出了“深度研究”功能，可直接连接GitHub。用户在提出相关问题时，ChatGPT能够从GitHub代码库中获取实时数据并进行分析处理，生成详尽的报告，涵盖项目架构、关键模块、技术栈等内容，还能提供代码质量改进建议。目前该功能处于测试阶段，仅限Team用户使用，未来将逐步开放给Plus、Pro用户。此外，OpenAI还发布了强化微调（Reinforcement fine-tuning，RFT）功能，可提升模型在复杂领域的性能。这一更新被网友称赞为“真·RAG”，为开发者带来了极大便利。来源：微信公众号【量子位】

全球首个AI多人游戏模型开源，仅需1500美元实现多人互动

以色列的Enigma Labs开源了世界首个AI多人游戏模型Multiverse。该模型仅需一台PC和1500美元成本，就能让两个AI智能体在同一虚拟世界中感知、互动和协作。Multiverse通过创新架构解决了多人游戏中视角一致性和物理规律同步的难题，采用沿通道轴堆叠帧的方法，确保两个玩家视角在每一层都被同时处理。此外，该模型还通过稀疏采样和长画面预测训练，优化了车辆运动学和相对运动的建模。项目代码已全面开源，可在Hugging Face、GitHub及Enigma Labs官网查看。这一成果不仅是AI游戏领域的重要突破，更是AGI创造世界模型的关键一步。来源：微信公众号【新智元】

ChatGPT o3隐私漏洞曝光：一张照片即可定位用户住址

最新研究揭示了OpenAI的多模态大语言模型ChatGPT o3存在严重的隐私泄露风险。研究人员通过简单提示词和一张照片，就能让模型将用户住址精准定位到1英里范围内。该研究由威斯康星大学麦迪逊分校、佐治亚大学和南加州大学联合完成，论文已在arXiv上发布。研究发现，即使对照片中的关键信息进行遮挡，AI仍可通过其他线索（如建筑风格、地理标识等）进行推理。ChatGPT o3通过视觉解析和外部工具调用（如街景API、房产数据库等）实现精准定位。这一发现引发了对多模态AI隐私保护的深刻反思，传统隐私保护手段已难以应对，亟需重构隐私防线。来源：微信公众号【机器之心】

快手推出KuaiMod，用大模型重构短视频生态

快手近日发布了基于多模态大模型的短视频生态优化方案KuaiMod，旨在通过大模型技术提升内容管理效率和用户体验。KuaiMod通过构建首个短视频平台劣质内容判别基准测试和自动化内容判别框架，利用视觉语言模型的链式推理能力，精准识别低质内容。在离线测试中，KuaiMod-7B模型准确率高达92.4%，显著优于其他方案。目前，该方案已在快手平台全面部署，使用户举报率降低超过20%。此外，快手还致力于打造社区短视频理解多模态大模型，从内容理解、用户兴趣感知到业务变现，全面重塑平台的智能基础设施。KuaiMod的评测标准和技术方案已全面开源，为行业树立了新的标杆。来源：微信公众号【机器之心】

腾讯开源HunyuanCustom，精准复刻主体的视频生成神器

腾讯近日开源了“自定义”视频生成模型HunyuanCustom，主打主体一致性，能够通过一张图片精准确定视频主角，并在不同场景中保持高度一致。该模型支持单主体参考、多主体参考、局部编辑和角色配音四大功能，其中单主体参考功能已上线并开源，其他功能也将在本月内开源。HunyuanCustom在主体一致性方面表现优异，评分达到开源模型SOTA水平，可与闭源模型媲美。此外，该模型还支持720P画质，推荐使用80GB显存的英伟达GPU进行部署。HunyuanCustom的开源为视频生成领域带来了新的技术突破，也为创作者提供了更强大的工具。来源：微信公众号【量子位】