7月9日·谷歌Veo 3升级,照片秒变活人开口讲话,广告动漫圈迎来变革

7月9日·周三  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

苹果大模型团队负责人转投Meta,AI战略布局生变

谷歌Veo 3迎来重大升级,只需上传一张照片即可生成音频和视频内容,角色一致性达到新高度。用户可以在谷歌Flow创作平台上体验这一功能。Veo 3能够将静态图片转化为动态视频,甚至让角色开口讲话,生成效果令人惊艳。该技术不仅支持科幻片、广告等场景的创作,还能通过丰富的运镜功能实现高质量的视频生成。此次升级引发了广告和动漫行业的广泛关注,被认为可能重塑相关领域的创作模式。来源:微信公众号【新智元】

7月9日·谷歌Veo 3升级,照片秒变活人开口讲话,广告动漫圈迎来变革

Mamba作者Albert Gu质疑Transformer:分词是“枷锁”,SSM才是未来

Mamba作者、CMU助理教授Albert Gu在其博客中抛出颠覆性观点,认为Transformer依赖的分词(Tokenization)机制是为弥补其自身缺陷而不得不戴上的“枷锁”。他指出,状态空间模型(SSM)在处理原始数据时展现出比Transformer更优越的性能和效率。Gu认为,Transformer的归纳偏置使其在建模能力上存在局限,尤其是在处理低语义密度数据时。相比之下,SSM通过压缩历史信息,能够更高效地处理长序列数据,且不受限于数据的语义粒度。他还提出,未来的模型架构应能够处理噪声数据而不增加计算或内存负担,这或许会推动AI架构的变革。Gu的这一观点引发了学术界对Transformer架构和SSM模型的重新思考。来源:微信公众号【机器之心

7月9日·谷歌Veo 3升级,照片秒变活人开口讲话,广告动漫圈迎来变革

哥大学生开发AI“照妖镜”,对抗作弊工具Cluely

哥伦比亚大学学生Antonio Li和Patrick Shen开发了一款名为Truely的反作弊工具,旨在对抗由哥大退学生Roy Lee开发的AI作弊工具Cluely。Cluely是一款备受争议的AI桌面助手,能够代替使用者参加会议或采访,引发广泛关注。Truely通过检测对方设备上的进程标识符(PID),判断是否运行了Cluely进程,并在检测到时发出警报。其核心功能包括实时进程监控、自动加入Zoom会议、自动聊天警报等。尽管Truely的使用过程较为繁琐且需要对方安装软件,但它为应对AI作弊提供了可行的反制手段。与此同时,Cluely因逆向工程提示词被公开,向相关推文提交了DMCA申请,要求删除相关内容,引发了对安全研究者法律威胁的争议。来源:微信公众号【机器之心

7月9日·谷歌Veo 3升级,照片秒变活人开口讲话,广告动漫圈迎来变革

上海交大团队在“人类最后的考试”中突破30分,开源方案领先OpenAI和谷歌

上海交通大学联合深势科技团队在“人类最后的考试”(Humanity’s Last Exam,HLE)中取得了32.1分的突破性成绩,成为首个得分超过30%的系统。HLE是由AI安全中心和Scale AI发起的超难测试集,题目由全球500多家机构的1000多名学者提供,涵盖数理化、生物医药、工程和社会科学等多学科领域。上海交大团队开发的工具增强推理智能体X-Master和多智能体工作流系统X-Masters是此次突破的关键。X-Master通过模拟人类研究者的动态问题解决过程,在内部推理和外部工具使用之间流畅切换,而X-Masters则通过分散-堆叠式智能体工作流,系统地增强推理的广度和深度。该团队还开源了整个方案,为后续研究提供了重要参考。网友们对这一成果表示惊叹,认为AI竞赛愈发激烈,国内团队的表现尤为突出。来源:微信公众号【机器之心

7月9日·谷歌Veo 3升级,照片秒变活人开口讲话,广告动漫圈迎来变革

稚晖君领衔智元机器人控股科创板上市公司,改写具身智能发展路径

7月9日·谷歌Veo 3升级,照片秒变活人开口讲话,广告动漫圈迎来变革
© 版权声明

相关文章

暂无评论

暂无评论...