10月28日·阿里通义推出代码模式:AI实时编程预览工具
10月28日·周一 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
阿里通义推出代码模式:AI实时编程预览工具
阿里巴巴旗下的通义近日发布了一款名为“代码模式”的AI代码工具,该工具通过实时预览功能,降低了应用开发的门槛。在这一模式下,非专业程序员也能轻松创建应用。用户只需用自然语言描述需求,AI即可生成相应的代码,并在网页上实时预览效果。通义代码模式基于Qwen 2.5大模型开发,支持40多种编程语言,并在代码生成、推理和修复能力上表现出色。目前,通义正在招募首批1024名用户体验这一新模式,以期收集反馈并进一步优化产品。来源:微信公众号【机器之心】

Meta开源AI播客工具NotebookLlama挑战谷歌
Meta最近发布了一款名为NotebookLlama的AI播客工具,这是对谷歌NotebookLM的开源替代品。NotebookLlama使用Llama模型处理任务,包括生成播客脚本和文本到语音转换。尽管NotebookLlama在声音自然度上尚有不足,被指出带有机器人口音,但Meta的研究人员表示,使用更强大的模型可以提升其性能。NotebookLlama的开源代码允许用户自定义和优化播客生成过程,展现了AI技术在播客制作领域的潜力和进步。尽管效果仍有待提高,但开源的特性意味着社区可以共同推动其发展。来源:微信公众号【机器之心】

极佳科技推出DriveDreamer4D,提升自动驾驶场景重建效果
极佳科技近日联合多家机构推出DriveDreamer4D,这是首个利用世界模型增强4D驾驶场景重建效果的算法。该技术显著提升了多种自动驾驶4D重建算法的效果,在用户研究中获得超过80%的偏好投票。DriveDreamer4D通过生成丰富的驾驶数据,改善了复杂驾驶操作(如变道、加速和减速)的重建质量。该算法利用世界模型作为数据引擎,合成新轨迹视频,提升了车辆和车道线的时空一致性。实验结果显示,DriveDreamer4D在渲染质量和一致性方面优于传统算法,标志着自动驾驶技术的又一重要突破。来源:微信公众号【机器之心】

超长视频理解大模型Video-XL:效率与性能的新平衡
智源研究院联合多所高校发布了最新的超长视频理解大模型Video-XL,该模型仅需一块80G显卡即可处理2048帧输入,即小时级长度视频。Video-XL在多个主流长视频理解基准评测中多项任务排名第一,实现了效率与性能的良好平衡。在视频“大海捞针”任务中,该模型取得了接近95%的准确率,展现了出色的泛化能力。Video-XL的模型代码已经开源,有望在电影摘要、视频异常检测、广告植入检测等应用场景中发挥重要作用,成为长视频理解的得力助手。来源:微信公众号【量子位】

思考偏好优化(TPO):大模型推理能力的新突破
近日,一项名为思考偏好优化(TPO)的新研究提出了一种能让大模型在回答问题前进行内部“思考”的方法,以提升输出答案的质量。TPO通过将思维链式提示融入训练中,使用评判模型评估响应,形成偏好对进行直接偏好优化(DPO),从而提高模型性能。该方法无需额外人工标注数据,适用于推理性任务及一般问答。在AlpacaEval和Arena-Hard基准测试中,TPO模型表现出色,性能比基线提升了约4%。这项研究由Meta FAIR、加州大学伯克利分校、纽约大学的研究人员共同提出,一作为华人学者Tianhao Wu,其导师之一是2011年清华特奖得主焦剑涛。来源:微信公众号【量子位】
