9月15日·氛围编程的“坑”与“宠”：资深程序员的爱恨交织

273 0 0

9月15日·周一 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

氛围编程的“坑”与“宠”：资深程序员的爱恨交织

一位拥有15年开发经验的程序员Carla Rover因使用AI工具进行“氛围编程”而陷入困境的故事。Rover为了赶项目进度，过度依赖AI编程工具，结果代码漏洞百出，不得不推倒重来，甚至因此痛哭半小时。这一事件引发了行业对“氛围编程”的广泛讨论。一方面，AI工具如Cursor、Copilot等确实为开发者提供了便利，但另一方面，它们也带来了诸多问题，如代码质量参差不齐、安全漏洞频现等。据统计，近800名开发者中，至少95%的人需要额外时间去修复AI生成的代码。尽管如此，仍有开发者表示，AI编程在某些场景下确实有用，人工审查不可或缺。来源：微信公众号【新智元】

全球首位AI部长诞生：阿尔巴尼亚的反腐新招

阿尔巴尼亚总理Edi Rama宣布，该国任命了一个名为Diella的AI虚拟系统为“AI部长”，全面负责公共采购项目，以对抗长期困扰该国的腐败问题。Diella在阿尔巴尼亚语中意为“阳光”，其职责是确保公共招标的透明化和廉洁性。阿尔巴尼亚希望通过Diella实现“公共招标100%无腐败”的目标。这一举措不仅是对AI技术的信任，也是政府数字化改革的一部分。Diella此前作为电子政务平台e-Albania的虚拟助理，已经为民众所熟知。此次任命引发了全球关注，人们开始思考AI在政治领域的责任与局限。来源：微信公众号【新智元】

从“对口型”到“会表演”：可灵AI数字人技术升级

快手可灵团队近日宣布，其数字人技术实现了从“对口型”到“会表演”的重大突破。全新数字人功能已在可灵平台开启公测。该技术通过多模态大语言模型赋能的两阶段生成框架，让数字人不仅能根据音频对口型，还能根据用户指令进行生动的表情和动作表演。团队设计了多模态导演模块，将音频、图像和文字提示整合成一条清晰的故事线，并生成全局一致的蓝图视频。随后，通过关键帧提取和子段视频合成，最终生成流畅的长视频。实验结果表明，该技术在口型对齐、情绪表达和动作控制等方面均优于现有方法。来源：微信公众号【机器之心】

浙大校友一作，光学生成图像技术登Nature

加州大学洛杉矶分校的研究团队在《自然》杂志发表了一种几乎不消耗电量的AI图像生成器。该生成器是一种受扩散模型启发的光学生成模型，通过数字编码器生成静态噪声，再利用空间光调制器将噪声模式转化为图像。与传统AI依赖大量计算不同，该系统利用光学原理完成核心工作，能耗极低。实验显示，该系统生成的图像效果与传统图像生成器相当，但能耗显著降低。该技术可用于VR、AR显示以及智能手机等可穿戴设备的图像生成。论文第一作者Shiqi Chen是浙江大学校友，目前在UCLA从事博士后研究。来源：微信公众号【机器之心】

腾讯混元升级AI绘画微调范式，人工评估分数大幅提升

腾讯混元团队提出了一种新的AI绘画微调方法，显著提升了生成图像的真实感和美学质量。该方法通过在整个扩散轨迹上进行优化，解决了传统扩散模型优化步骤少、容易出现“奖励作弊”的问题。团队提出了Direct-Align方法，能够从任意时间步恢复原始图像，避免了早期时间步的梯度爆炸问题。同时，语义相对偏好优化（SRPO）技术将奖励信号重新定义为文本条件信号，通过添加正面和负面提示词，实现在线调整奖励。实验表明，经过SRPO训练的模型在人工评估中表现优异，真实感和美学质量分别提升了3.7倍和3.1倍。来源：微信公众号【量子位】