8月9日·周五 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
谷歌AI乒乓球机器人:技术突破,展现中级水平
近日,谷歌研发的人工智能乒乓球机器人Agent在与人类选手的对决中展现出了令人瞩目的表现,成功赢得了专业教练的赞誉。这款机器人在正反手转换、连续进攻以及应对突发战术方面表现出色,能够实时适应不同选手的风格,并在与初学者的比赛中全胜,在与中级选手的对决中取得了55%的胜率。机器人的硬件配置包括6自由度的机械臂和3D打印的球拍手柄,通过强化学习和模仿学习相结合的训练方法,实现了技能的快速提升。尽管在处理下旋球方面存在局限,但其整体表现已达到中级选手水平,引发了网友的广泛关注和兴趣。来源:微信公众号【量子位】
OpenAI发布GPT-4o安全报告:揭示AI语音功能的潜在风险
OpenAI近日发布了一份关于其最新语言模型GPT-4o的32页安全报告,报告中揭露了该模型在语音功能上的一些异常行为和潜在风险。GPT-4o在少数情况下会模仿用户的声音或突然大叫,这些行为在高背景噪声环境下尤为明显。OpenAI认为,这可能是因为模型难以理解畸形的语音信号。此外,报告还提到了模型可能在特定提示下产生不当语音内容,如色情或暴力声音,以及潜在的音乐版权问题。为了降低这些风险,OpenAI采取了多种措施,包括后训练调整和部署分类器来阻止特定生成内容。尽管存在这些挑战,GPT-4o的高级语音功能已在ChatGPT的alpha版本中上线,并计划在秋季向更多用户推出。这份报告展示了OpenAI在确保AI安全性方面的努力和透明度。来源:微信公众号【新智元】
中国团队在SIGGRAPH 2024获荣誉提名,展示生成式AI在3D建模的突破
在2024年SIGGRAPH大会上,上海科技大学MARS实验室的团队凭借两篇论文——CLAY和DressCode,同时获得了最佳论文荣誉提名,这标志着中国团队在3D生成领域的重大进展。CLAY专注于3D生成,而DressCode则专注于3D服装生成。该团队还在Real-Time Live环节展示了基于这些研究成果的一系列应用场景,包括使用单张图片生成卡通形象的3D模型。背后支撑这些成果的是新一代3D AI引擎Rodin,它能够从用户上传的单张图片直接生成3D内容,并支持PBR纹理和四角面的生成,便于艺术家进一步修改和使用。Rodin引擎还支持3D ControlNet技术,允许通过简单的几何元素指导AI生成所需的3D资产。此外,Rodin还支持直接手绘和涂鸦,极大地简化了3D建模过程,为3D开发者提供了一个接近Production-Ready的3D生成工具。来源:微信公众号【机器之心】
微软亚洲研究院开源T-MAC技术:大幅提升手机大模型运行效率
微软亚洲研究院宣布开源一项新技术T-MAC,该技术通过创新的基于查找表(LUT)的计算范式,显著提升了在CPU上部署低比特大语言模型的效率。T-MAC技术允许端侧设备如手机、PC等,无需依赖专用硬件加速器NPU或GPU,即可高速运行大型模型,并在某些情况下性能甚至超越这些专用加速器。该技术通过减少混合精度矩阵乘法运算中的反量化步骤,降低了资源消耗,并通过优化内存访问和计算流程,实现了模型推理性能的大幅提升。在实验中,T-MAC展现了卓越的性能,如在高通Snapdragon X Elite芯片组的Surface AI PC上,3B BitNet-b1.58模型的生成速率达到每秒48个token,性能提升4到5倍。此外,T-MAC在Raspberry Pi 5上也能实现每秒11个token的生成速率,显示出其在不同硬件平台上的广泛适用性。T-MAC的开源,为移动和端侧AI应用的开发提供了新的加速可能性。来源:微信公众号【量子位】
AI领域专家就RLHF方法论展开辩论
近期,人工智能领域内关于“从人类反馈中进行强化学习”(RLHF)的讨论愈发热烈。这场讨论由Andrej Karpathy的一条推特引发,他认为RLHF“只是勉强的RL”,与传统强化学习相比,RLHF在训练大型语言模型(LLM)时的效果有限。Karpathy指出,RLHF依赖于人类反馈来优化模型,但这种方法不能像真正的强化学习那样,通过直接与环境互动来学习。他的这一观点得到了Yann LeCun的支持,LeCun也认为RLHF并非真正的强化学习。然而,这一观点并非没有争议。一些学者认为RLHF在微调LLM时是有益的,尤其是在减少模型的偏见和幻觉现象方面。他们强调,RLHF能够通过人类反馈来“修补问题”,并且有助于模型在复杂任务中的泛化和“热启动”。尽管存在分歧,但RLHF作为一种训练方法,其在工业界和学术界的流行程度正迅速上升,特别是在OpenAI等AI巨头中。来源:微信公众号【新智元】
【今日案例】
县域旅游为何持续破圈
https://yuanbao.tencent.com/bot/app/share/chat/b465cc01d9c175983e5906308bd8836d