9月15日·氛围编程的“坑”与“宠”:资深程序员的爱恨交织
9月15日·周一 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
氛围编程的“坑”与“宠”:资深程序员的爱恨交织
一位拥有15年开发经验的程序员Carla Rover因使用AI工具进行“氛围编程”而陷入困境的故事。Rover为了赶项目进度,过度依赖AI编程工具,结果代码漏洞百出,不得不推倒重来,甚至因此痛哭半小时。这一事件引发了行业对“氛围编程”的广泛讨论。一方面,AI工具如Cursor、Copilot等确实为开发者提供了便利,但另一方面,它们也带来了诸多问题,如代码质量参差不齐、安全漏洞频现等。据统计,近800名开发者中,至少95%的人需要额外时间去修复AI生成的代码。尽管如此,仍有开发者表示,AI编程在某些场景下确实有用,人工审查不可或缺。来源:微信公众号【新智元】

全球首位AI部长诞生:阿尔巴尼亚的反腐新招
阿尔巴尼亚总理Edi Rama宣布,该国任命了一个名为Diella的AI虚拟系统为“AI部长”,全面负责公共采购项目,以对抗长期困扰该国的腐败问题。Diella在阿尔巴尼亚语中意为“阳光”,其职责是确保公共招标的透明化和廉洁性。阿尔巴尼亚希望通过Diella实现“公共招标100%无腐败”的目标。这一举措不仅是对AI技术的信任,也是政府数字化改革的一部分。Diella此前作为电子政务平台e-Albania的虚拟助理,已经为民众所熟知。此次任命引发了全球关注,人们开始思考AI在政治领域的责任与局限。来源:微信公众号【新智元】

从“对口型”到“会表演”:可灵AI数字人技术升级
快手可灵团队近日宣布,其数字人技术实现了从“对口型”到“会表演”的重大突破。全新数字人功能已在可灵平台开启公测。该技术通过多模态大语言模型赋能的两阶段生成框架,让数字人不仅能根据音频对口型,还能根据用户指令进行生动的表情和动作表演。团队设计了多模态导演模块,将音频、图像和文字提示整合成一条清晰的故事线,并生成全局一致的蓝图视频。随后,通过关键帧提取和子段视频合成,最终生成流畅的长视频。实验结果表明,该技术在口型对齐、情绪表达和动作控制等方面均优于现有方法。来源:微信公众号【机器之心】

浙大校友一作,光学生成图像技术登Nature
加州大学洛杉矶分校的研究团队在《自然》杂志发表了一种几乎不消耗电量的AI图像生成器。该生成器是一种受扩散模型启发的光学生成模型,通过数字编码器生成静态噪声,再利用空间光调制器将噪声模式转化为图像。与传统AI依赖大量计算不同,该系统利用光学原理完成核心工作,能耗极低。实验显示,该系统生成的图像效果与传统图像生成器相当,但能耗显著降低。该技术可用于VR、AR显示以及智能手机等可穿戴设备的图像生成。论文第一作者Shiqi Chen是浙江大学校友,目前在UCLA从事博士后研究。来源:微信公众号【机器之心】

腾讯混元升级AI绘画微调范式,人工评估分数大幅提升
腾讯混元团队提出了一种新的AI绘画微调方法,显著提升了生成图像的真实感和美学质量。该方法通过在整个扩散轨迹上进行优化,解决了传统扩散模型优化步骤少、容易出现“奖励作弊”的问题。团队提出了Direct-Align方法,能够从任意时间步恢复原始图像,避免了早期时间步的梯度爆炸问题。同时,语义相对偏好优化(SRPO)技术将奖励信号重新定义为文本条件信号,通过添加正面和负面提示词,实现在线调整奖励。实验表明,经过SRPO训练的模型在人工评估中表现优异,真实感和美学质量分别提升了3.7倍和3.1倍。来源:微信公众号【量子位】
