3月27日

AI资讯速递1年前 (2024)发布 FuturX-Editor
240 0

3月27日·周三 AI工具和资源推荐

AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

46秒AI生成真人视频爆火,遭在线打假「换口型、声音」

今天,一段宣称完全由 AI 生成的不到 50 秒的视频在社交圈疯传,在「视频是否真由 AI 生成」这一点上,网友更是在评论区吵翻了天。上传者表示,音频和视频都是 AI 生成的,它们出自一款 AI 工具 Arcads。有人想要上传者提供 AI 生成的证据,上传者只是含糊回答「视频就是 AI 生成,自己没有那么无聊。」面对纷至沓来的质疑,视频上传者展开了「对线」。她表示,这段视频之所以看起来真实,是因为自己将脚本与 AI 模型进行了匹配。此外还分析了模型,接着根据视频人物的行为举止添加了文本。

Arcads 官方网站上,研发团队介绍称 Arcads 是一款人工智能驱动的工具,旨在将文本转换为高质量的视频广告。它使用先进的人工智能算法来生成逼真的视频,只需要用户提供文本。Arcads 非常适合品牌营销,特别是专注于数字产品、需要快速高效地制作大量视频广告的团队。Arcads 能够提升广告效果,同时减少制作时间和成本,在几分钟内就可以制作出视频广告。来源:微信公众号【机器之心】

两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源

Picsart AI Resarch 等多个机构联合提出了一种新的文生视频方法:StreamingT2V。这也是一种自回归方法,并配备了长短期记忆模块,进而可以生成具有时间一致性的长视频。该团队提出了条件注意力模块(CAM)。得益于其注意力性质,它可以有效地借用之前帧的内容信息来生成新的帧,同时还不会让之前帧的结构 / 形状限制新帧中的运动情况。而为了解决生成的视频中人与物外观变化的问题,该团队又提出了外观保留模块(APM):其可从一张初始图像(锚帧)提取对象或全局场景的外观信息,并使用该信息调节所有视频块的视频生成过程。为了进一步提升长视频生成的质量和分辨率,该团队针对自回归生成任务对一个视频增强模型进行了改进。为此,该团队选择了一个高分辨率文生视频模型并使用了 SDEdit 方法来提升连续 24 帧(其中有 8 帧重叠帧)视频块的质量。为了使视频块增强过渡变得平滑,他们还设计了一种随机混合方法,能以无缝方式混合重叠的增强过的视频块。来源:微信公众号【机器之心】

RLHF有了通用平台和基准,天大开源,专攻现实决策场景

天津大学深度强化学习实验室的研究团队推出了面向现实决策场景的 Uni-RLHF 平台,这是一个专为 RLHF 量身定制的综合系统实施方案。它旨在根据真实的人类反馈提供完整的工作流程,一站式解决实际问题。Uni-RLHF 包含三个部分:1)通用多反馈标注平台,2)大规模众包反馈数据集,3)模块化离线 RLHF 基线代码库。具体流程来看,Uni-RLHF 首先针对各种反馈类型开发了用户友好的标注界面,与各种主流 RL 环境兼容。然后建立了一个系统的众包标注流水线,产生了包含 32 个任务、超过 1500 万个时间步的大规模标注数据集。最后,基于大规模反馈数据集,实现了最先进的 RLHF 算法的基线结果和模块化组件以供其他研究者使用。Uni-RLHF 希望通过评估各种设计选择,深入了解它们的优势和潜在的改进领域,构建有价值的开源平台、数据集和基线,以促进基于真实人类反馈开发更强大、更可靠的 RLHF 解决方案。目前平台、数据集和基线代码库均已开源。来源:微信公众号【机器之心】

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

大模型竞技场上,Claude 3大杯Opus新王登基,Elo分数来到榜首。连小杯Haiku也跻身第二梯队,超过了GPT-4-0613这个型号,把GPT-3.5-turbo远远甩在身后。Haiku的输入token价格,可是比GPT-3.5-turbo还便宜了一半,输出方面,每100万token也比GPT-3.5-turbo便宜近2块钱。跟GPT-4相比,价格更是只有1/20。并且Haiku同样支持200k上下文。难怪有开发者直言:GPT-3.5在Claude Haiku面前不堪一击。不仅仅是价格更便宜,Haiku还更上一层楼了。而在Claude 3加入竞技之前,GPT-4家族已经霸榜快一年了。

大模型竞技场榜单(LMSYS Chatbot Arena Leaderboard)的评分标准是人类打分,同一个问题同时抛给A、B两个模型,人类裁判觉得哪个回答得好就给哪个投票。值得一提的是,在竞技场官方贺电中,Haiku这个型号也被专门高亮了出来:根据我们的用户偏好,Claude 3 Haiku达到了GPT-4级别。其速度、功能和上下文长度在目前的市场上是独一份的。简单来说,就是让Opus给Haiku当老师:先用Opus生成执行任务的范例,再用这些教学案例来提高Haiku的姿势水平。划重点:Haiku的价格仅为Opus的1/60,而响应速度则是Opus的10倍。这个名为gpt-prompt-engineer的项目目前在GitHub上累计揽下7.3k标星。来源:微信公众号【量子位】

一口气升级7个大模型SaaS应用,百度智能云:突出一个“开箱即用”

百度智能云最近一口气升级了7个大模型企业级应用,并且全部推出SaaS版本,突出一个“开箱即用”,涵盖了企业目前最常见的几种大模型使用场景。首先是号称能实现 “跨模态营销物料生产”的百度智能云“一念”。文生图、图生视频、文生成视频……(各种排列组合)统统不在话下,营销文案、海报都能轻松拿捏,支持视频混剪、生成数字人视频,还能无缝衔接企业现有的平台和营销物料。创作完成后,“一念”还能自动给内容打标签,写摘要,生成的内容可以直接分发至多个平台,连发布的功夫都给省了。百度智能云的曦灵数字人在做直播时不仅可以自动生成、改写营销话术,还能让数字人回答直播弹幕,跟直播观众互动。百度智能云用大模型全面重构了智能客服平台客悦,据介绍:用户问题的自助解决率提升至90%以上,Baidu Comate正式升级至2.0,不仅在代码生成、单测设计与生成方面能力更强,还新推出两大重磅能力。。来源:微信公众号【量子位

© 版权声明

相关文章

暂无评论

暂无评论...