11月26日·AI视频技术革新:Runway与Luma引领创意革命
11月26日·周二 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
AI视频技术革新:Runway与Luma引领创意革命
近日,AI视频技术领域迎来了两大突破性更新,Runway和Luma两大巨头分别推出了Frames和DreamMachine,标志着视频创作迈入了新的纪元。Runway的Frames模型通过风格控制和视觉真实度的突破,使得用户能够一键生成具有特定风格的世界,而Luma的DreamMachine则通过自然交互,将文字、图像、视频融合,让创意瞬间成真。这两款工具的发布,不仅提升了AI生图的质量,也为创意工作者提供了前所未有的创作自由度和效率,预示着AI视频技术将深刻影响未来的电影制作和视觉艺术创作。来源:微信公众号【新智元】
谷歌科学家Yi Tay创业639天后重返谷歌
前谷歌大脑高级研究科学家Yi Tay,Reka联合创始人,在经历了639天的创业旅程后,宣布重返谷歌DeepMind,继续他的人工智能和大语言模型(LLM)研究。在Reka期间,Yi Tay不仅在技术层面取得了显著成就,还在创业、商业和公司建设方面积累了宝贵经验。尽管面临资源有限的挑战,Reka Core在Lmsys排名中表现突出,超越了GPT-4的早期版本。Yi Tay的回归反映了当前初创企业面临的艰难环境,许多前谷歌员工创办的初创企业在经历寒冬后选择回归大厂。这一现象揭示了学术研究与商业化之间的差异,以及初创公司在资金、人才和市场竞争中的生存挑战。来源:微信公众号【新智元】
吴恩达开源Python包aisuite:统一接口调用多个AI模型
AI领域著名学者吴恩达最近开源了一个新的Python包——aisuite,旨在简化开发者与多个AI模型提供商的集成工作。通过aisuite,开发者可以使用统一的接口调用并测试来自OpenAI、Anthropic、Google等多个提供商的大型语言模型(LLM)。该工具允许用户通过更改一个字符串来选择不同提供商的模型,极大地方便了模型的切换和对比测试。aisuite基于Python客户端库构建,目前专注于聊天补全功能,未来计划扩展到更多应用场景。安装和设置aisuite也非常简单,用户只需获取相应提供商的API密钥并按照文档进行配置即可。这个开源项目为开发者提供了一个高效、便捷的解决方案,以应对多模型集成的复杂性。来源:微信公众号【新智元】
陈天奇团队推出XGrammar:LLM结构化生成新引擎
陈天奇团队近日发布了XGrammar,这是一个开源软件库,旨在为大语言模型(LLM)提供高效、灵活且可移植的结构化生成能力。XGrammar通过字节级下推自动机来解释上下文无关语法,显著提高了结构化数据生成的效率,将上下文无关语法的每token延迟减少多达100倍,并在H100 GPU上实现了80倍的端到端LLM serving速度提升。XGrammar的设计允许每个字符边缘包含一个或多个字节,处理不规则的token边界,并支持包含sub-UTF8字符的token。该团队还提出了一系列算法和系统优化,进一步提升了掩码生成速度并减少了预处理时间。XGrammar的发布,为LLM在结构化生成领域的应用带来了重大突破。来源:微信公众号【机器之心】
OpenAI Sora模型泄露事件:能力进化,引发争议
OpenAI的Sora模型遭遇泄露,泄露版本显示其能力相比2月演示版有所进化,尤其在镜头切换、动作幅度和物理模拟方面。泄露内容发布在Hugging Face上,并非模型权重泄露,而是试用接口的公开,并附有泄露者的公开信。信中表达了对OpenAI利用艺术家进行无偿测试和宣传的不满,并呼吁艺术家使用开源工具。泄露后3小时,OpenAI紧急关闭了Sora的测试权限。尽管泄露接口已失效,但已有视频流出。此次事件引发了关于AI技术使用方式和艺术家权益的讨论,同时也展示了Sora在图像生成方面的进步。来源:微信公众号【量子位】
【今日案例】
字节跳动在AI领域的布局
https://yuanbao.tencent.com/bot/app/share/chat/d2b20ae5d593c99811551e2e68a59c5f