10月28日·阿里通义推出代码模式：AI实时编程预览工具

AI资讯速递1年前 (2024)发布 FuturX-Editor

650 0 0

10月28日·周一 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

阿里通义推出代码模式：AI实时编程预览工具

阿里巴巴旗下的通义近日发布了一款名为“代码模式”的AI代码工具，该工具通过实时预览功能，降低了应用开发的门槛。在这一模式下，非专业程序员也能轻松创建应用。用户只需用自然语言描述需求，AI即可生成相应的代码，并在网页上实时预览效果。通义代码模式基于Qwen 2.5大模型开发，支持40多种编程语言，并在代码生成、推理和修复能力上表现出色。目前，通义正在招募首批1024名用户体验这一新模式，以期收集反馈并进一步优化产品。来源：微信公众号【机器之心】

Meta开源AI播客工具NotebookLlama挑战谷歌

Meta最近发布了一款名为NotebookLlama的AI播客工具，这是对谷歌NotebookLM的开源替代品。NotebookLlama使用Llama模型处理任务，包括生成播客脚本和文本到语音转换。尽管NotebookLlama在声音自然度上尚有不足，被指出带有机器人口音，但Meta的研究人员表示，使用更强大的模型可以提升其性能。NotebookLlama的开源代码允许用户自定义和优化播客生成过程，展现了AI技术在播客制作领域的潜力和进步。尽管效果仍有待提高，但开源的特性意味着社区可以共同推动其发展。来源：微信公众号【机器之心】

极佳科技推出DriveDreamer4D，提升自动驾驶场景重建效果

极佳科技近日联合多家机构推出DriveDreamer4D，这是首个利用世界模型增强4D驾驶场景重建效果的算法。该技术显著提升了多种自动驾驶4D重建算法的效果，在用户研究中获得超过80%的偏好投票。DriveDreamer4D通过生成丰富的驾驶数据，改善了复杂驾驶操作（如变道、加速和减速）的重建质量。该算法利用世界模型作为数据引擎，合成新轨迹视频，提升了车辆和车道线的时空一致性。实验结果显示，DriveDreamer4D在渲染质量和一致性方面优于传统算法，标志着自动驾驶技术的又一重要突破。来源：微信公众号【机器之心】

超长视频理解大模型Video-XL：效率与性能的新平衡

智源研究院联合多所高校发布了最新的超长视频理解大模型Video-XL，该模型仅需一块80G显卡即可处理2048帧输入，即小时级长度视频。Video-XL在多个主流长视频理解基准评测中多项任务排名第一，实现了效率与性能的良好平衡。在视频“大海捞针”任务中，该模型取得了接近95%的准确率，展现了出色的泛化能力。Video-XL的模型代码已经开源，有望在电影摘要、视频异常检测、广告植入检测等应用场景中发挥重要作用，成为长视频理解的得力助手。来源：微信公众号【量子位】

思考偏好优化（TPO）：大模型推理能力的新突破

近日，一项名为思考偏好优化（TPO）的新研究提出了一种能让大模型在回答问题前进行内部“思考”的方法，以提升输出答案的质量。TPO通过将思维链式提示融入训练中，使用评判模型评估响应，形成偏好对进行直接偏好优化（DPO），从而提高模型性能。该方法无需额外人工标注数据，适用于推理性任务及一般问答。在AlpacaEval和Arena-Hard基准测试中，TPO模型表现出色，性能比基线提升了约4%。这项研究由Meta FAIR、加州大学伯克利分校、纽约大学的研究人员共同提出，一作为华人学者Tianhao Wu，其导师之一是2011年清华特奖得主焦剑涛。来源：微信公众号【量子位】