1月20日·OpenAI被曝提前获取FrontierMath数据，o3成绩引发争议

AI资讯速递1年前 (2025)发布 FuturX-Editor

724 0 0

1月20日·周一 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

OpenAI被曝提前获取FrontierMath数据，o3成绩引发争议

近日，OpenAI发布的推理模型o3在数学基准FrontierMath上取得惊人成绩，准确率相比o1提升12倍，引发广泛关注。然而，据新智元报道，o3的优异表现背后，竟是OpenAI资助了FrontierMath的主办方Epoch AI，并提前获得了大部分试题的访问权。这一行为被指违背了基准测试的公平性原则，因为参与出题的60多位数学家，包括菲尔兹奖获得者等，均被蒙在鼓里。Epoch AI回应称，虽有口头协议禁止使用数据训练模型，但合同限制导致未能及时向数学家们披露相关信息。此事件引发学术界对OpenAI的信任危机，多位学者公开谴责其行为。未来，o3在其他评测中的表现将备受关注，以验证其真实能力。来源：微信公众号【新智元】

豆包上线端到端语音功能，拟人化对话体验惊艳

豆包APP宣布全新端到端实时语音通话功能正式上线，用户无需等待预发布即可免费体验。该功能凭借高度拟人化的对话能力，展现出极强的情感理解和表达能力，无论在语速、语气还是情绪承接上都接近真人水平。在中文对话方面，豆包表现尤为出色，相比ChatGPT等海外产品及国内同类应用，其在复杂语义理解和即时信息检索上优势明显。此外，豆包还具备角色扮演、唱歌等趣味功能，为用户带来丰富的交互体验。技术上，豆包通过语音理解和生成一体化模型，解决了传统语音助手情商与智商难以平衡的难题，实现了低时延、高表现力的语音交互。此次更新不仅标志着中文语音交互领域的重大突破，也为未来多模态交互方式的发展提供了新的方向。来源：微信公众号【机器之心】

浙大与达摩院从教学视频中挖掘多模态语料，为大模型打造图文教科书

浙江大学与阿里巴巴达摩院联合提出了一种基于教学视频的多模态知识语料构建方法，旨在为视觉语言模型（VLMs）提供高质量的图文并茂的教科书式语料。研究团队从互联网上收集了超过2.5年的教学视频，涵盖数学、物理、化学等六大学科，通过音频转录、关键帧提取和OCR文本识别等技术，将其转化为连贯的图文交织数据集。该数据集不仅解决了传统图文语料知识密度低、图像与文本关联松散的问题，还显著提升了VLMs在知识推理和上下文感知能力上的表现。实验表明，基于该数据集预训练的模型在多个基准测试中性能大幅提升，尤其是在数学和科学领域。该研究为多模态大模型的高质量训练提供了新的思路，相关成果已登上Hugging Face Dataset Trending榜单。来源：微信公众号【量子位】

小红书上线AI翻译功能，网友挖掘背后大模型

小红书近日上线了AI翻译功能，引发了网友的广泛关注和热议。该功能不仅支持多种语言的翻译，还能应对颜文字、网络热梗、化学式、摩斯电码等特殊内容的翻译需求，甚至可以根据用户提出的Prompt生成特定内容。例如，用户可以要求输出emoji或翻译特定语句，AI翻译功能均能给出回应。不过，该功能背后的模型引发了网友的猜测，部分输出结果显示为智谱清言或GPT-4，有观点认为小红书可能使用了相关模型的数据进行蒸馏。目前，小红书AI翻译功能已上线，用户更新版本后即可体验，其强大的翻译能力和趣味性让小红书在社交应用中脱颖而出。来源：微信公众号【量子位】

2024年大模型商用加速，MaaS成产业落地风向标

2024年，大模型商用化进程显著加速，成为推动行业变革的重要力量。量子位的市场观察显示，大模型在教科、通信、能源等十大领域加速落地，尤其在信息处理、智能客服等场景中进展迅速。IDC数据显示，2024年上半年，中国智算服务市场规模同比增长79.6%，其中GenAI IaaS市场增长203.6%，火山引擎、阿里巴巴等云巨头在该领域表现突出。此外，生成式AI的日均tokens处理规模在一年内暴涨320倍，显示出市场需求的爆发式增长。MaaS（模型即服务）成为大模型产业落地的核心模式，预计到2027年市场规模占比将达47%。云厂商通过优化算力、降低成本，推动大模型快速进入“价值创造阶段”，同时，低代码/零代码的AI应用开发平台也成为新趋势，进一步释放大模型潜力。整体来看，大模型商用化正重塑云计算格局，推动各行业智能化转型。来源：微信公众号【量子位】