3月22日
3月22日·周五 AI工具和资源推荐
AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
今天起,Windows可以一键召唤GPT-4了
把 Copilot 按钮放在 Windows 桌面的任务栏,甚至实体键盘上,用大模型提升每个人的生产效率。美东时间 3 月 21 日周四,生成式 AI 领军的微软又为我们带来了一点小小的震撼。如果你的 Windows 11 电脑最近更新过系统补丁,就会看到这个新增的 Copilot 预览版按钮。OpenAI 大模型加持的 Copilot 功能终于登陆 Windows 了。微软将 Copilot 功能引入整个产品组合,从 Microsoft 365 到 Microsoft Teams、Edge,现在是 100% 整合进了 Windows 系统本身,只要你有电脑,就能用得上。它提供的能力丰富,也很有用:比如邮箱里 100 封未读,不用去翻,直接问 Copilot,让它总结一下其中某封有用邮件的内容。Copilot 也可以帮你整理 Teams 在线会议的要点。你的 Email、聊天内容、文件以及互联网上的信息,都可以被大模型处理帮你提升效率。微软表示,根据目前的统计,Copilot 的某些功能每个月可以帮你节省超过 10 小时的时间。来源:微信公众号【机器之心】
微软NaturalSpeech语音合成推出第三代,网友惊呼:超自然!实至名归
在 2024 年,微软NaturalSpeech 研究项目团队联合中科大、港中大(深圳)、浙大等机构联合发布了全新的系统:NaturalSpeech 3,它从语音数据的 “表示” 和 “建模” 两个角度出发,利用创新的属性分解扩散模型和属性分解语音神经编解码器 FACodec,通过 Data/Model Scaling,实现了零样本语音合成的重要突破,极大地向第二阶段目标迈进。NaturalSpeech 3 可以仅仅通过 3s 的提示音频在没有见过的说话人上实现效果惊艳音色克隆。NaturalSpeech 3 不仅能够实现逼真的音色模型,还能够非常好的还原韵律,情感等特征。NaturalSpeech 3 还可以对不同的属性使用不同的提示实现更为可控的生成,例如可以使用一个语速较快的人的声音作为 duration 的提示,使得生成的结果同样具有较快的语速。NaturalSpeech 3 的成功秘诀来自于基于属性分解的 Codec+Diffusion 建模范式以及 Data/Model Scaling。传统 TTS 系统因训练数据集有限,难以支持高质量的零样本语音合成。来源:微信公众号【机器之心】
Nature重磅:AI击败最先进全球洪水预警系统,提前7天预测河流洪水,每年挽救数千人生命
来自 Google Research 洪水预测团队的 Grey Nearing 及其同事开发的人工智能模型,通过利用现有的 5680 个测量仪进行训练,可预测未测量流域在 7 天预测期内的日径流。随后,他们将该人工智能模型与全球领先的短期和长期洪水预测软件——全球洪水预警系统(GloFAS)进行了对比测试。结果显示,该模型同日预测准确率与当前系统相当甚至更高。此外,该模型在预测重现窗口(return window)期为五年的极端天气事件时,其准确性与 GloFAS 预测重现窗口期为一年的事件时的准确性相当或更高。相关研究论文以“Global prediction of extreme floods in ungauged watersheds”为题,已发表在权威科学期刊 Nature 上。该研究使用了一种叫做长短期记忆(LSTM)网络的人工智能模型来进行河流流量的预测。这个模型的设计有点像我们的大脑,它可以从一系列的气象数据中学习并预测未来的河流流量。来源:微信公众号【学术头条】
国产游戏AI引擎亮相GDC!腾讯发布了自研游戏AI引擎——GiiNEX
在2024全球游戏开发者大会(GDC)上,腾讯发布了自研游戏AI引擎——GiiNEX,并展示了GiiNEX在游戏3D城市生成和UGC关卡设计场景中的创新,可为专业开发者和普通玩家提供高效创作支持。在城市布局环节中,构思并创建一个面积达25平方千米的城市,开发者过去需要至少5天时间,而采用GiiNEX城市布局工具只要25分钟,效率提升百倍。GiiNEX建筑外观工具支持导入图片快速建模。单栋建筑生成仅需不到20分钟,比起传统的手工搭建提效50倍。上传房间的多角度照片,1小时内即可还原一个立体感的室内场景,相比传统手工方式提效40倍。利用大模型等生成式AI技术,GiiNEX为玩家提供了一系列游戏内可用的UGC关卡设计工具(从灵感启发到建筑构建,再到配色及美术设计等),目前已在游戏《元梦之星》上线。后续GiiNEX还将AI能力扩展至地图布局、玩法设计、关卡模板生成等创作全流程。来源:微信公众号【元宇宙NEWS】
宣称AR里程碑!Meta发布Llama AI场景模型SceneScript
Reality Labs Research日前发布了一段45秒视频,并展示了未来的眼镜是如何捕获点云,而基于Llama AI的SceneScript模型又是如何将其解释为可识别的现实世界对象,如墙壁、窗户、门和家具。ceneScript能够使用端到端机器学习直接推断房间的几何形状,并使用语言表示它。与以前的方法相比,这种方法产生了紧凑、完整、可解释和可扩展的物理场景表示。eality Labs Research发布了SceneScript,一种生成场景布局和使用语言表示场景的新方法。不是使用硬编码规则将原始视觉数据转换为房间建筑元素的近似值,团队训练SceneScript使用端到端机器学习直接推断房间的几何形状。SceneScript可以解锁MR头显和未来AR眼镜的关键用例,比如生成为视障人士提供逐步导航所需的地图。SceneScript同时为LLMs提供了对物理空间进行推理所需的词汇表,而这可能最终释放下一代数字助理的潜力,为它们提供必要的物理世界背景,以回答复杂的空间查询。来源:微信公众号【MicroDisplay】