1月17日

1月17日·周三 AI工具和资源推荐

AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

智谱 AI 推出新一代基座大模型 GLM-4,能力逼近 GPT-4,配备多模态、长文本和智能体

1月16日,智谱AI在其首届技术开放日(Zhipu DevDay)正式发布了新一代基座大模型GLM-4。GLM-4的整体性能相比上一代大幅提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。除此之外,GLM-4大幅提升了智能体能力,GLM-4 All Tools 实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线,用户用简单的提示词指令就能创建属于自己的 GLM 智能体。GLM-4 最大的亮点:多模态能力:推出了CogView3代,效果超过开源SD模型,逼近 DALLE-3。All Tools能力:GLM-4能自主理解复杂指令,自由调用WebGLM搜索增强、Code Interpreter代码解释器和多模态生成能力,完成复杂任务。GLMs个性化智能体定制:用户可以通过智谱清言官方网站创建属于自己的GLM智能体,无需编程基础。MaaS平台和API:GLM-4登陆了Maas平台,提供API访问,支持开发者内测Assistant API。来源:极客公园-AI新浪潮观察

Yann LeCun发来肯定:腾讯人像照片生成可以随便玩了

来自南开大学、腾讯等机构提出了 PhotoMaker,这是一种高效的个性化文本到图像生成方法。相关论文《PhotoMaker:Customizing Realistic Human Photos via Stacked ID Embedding 》于去年 12 月放出,刚刚,项目也已经开源。不到一天时间,星标量高达 650+。PhotoMaker 除了生成逼真的人像,还能进行其他风格的生成,如草图、漫画、动画等。这项研究可以人人试玩,操作也非常简单,分为 4 步:首先是上传一张图片,一张就可以了,不过多张效果会更好,上传图片中的人脸应该占据图像的大部分。第二步是输入文本提示,操作过程中确保使用触发词 img,例如 man img、woman img 或 girl img。第三步是选择喜欢的风格模板(内置有十多种)。最后一步是单击 Submit 按钮,等待生成。以上生成过程如果有操作不当的地方,PhotoMaker 都会进行提示,不用怕自己操作失误。PhotoMaker 这种高效的个性化文本到图像生成方法,它主要将任意数量的输入 ID 图像编码成一个堆叠 ID 嵌入,以保留 ID 信息。这样的嵌入作为统一的 ID 表征,不仅可以全面封装相同输入 ID 的特征,而且还可以适应不同 ID 的特征以供后续集成。这为更有趣和实用价值的应用铺平了道路。来源:微信公众号【机器之心】

又一大模型技术开源!有道自研RAG引擎QAnything正式开放下载

网易有道自研的知识库问答引擎QAnything正式开源!除了可以调用云端大模型服务,还支持纯本地部署,大家可免费在开源社区Github内进行下载(地址:https://github.com/netease-youdao/Qanything)一键部署即可使用!系统支持word、ppt、excel、pdf、图片等多种文档格式,直接导入进去即可像”ChatGPT”一样问答。如果你有大量的文档需要问答,又对隐私比较关心,且有个带Nvidia显卡(推荐3090及以上)的电脑,都可以下载QAnything使用哦。QAnything的主要原理是基于检索增强的生成(Retrieval Augmented Generation,简称RAG)。RAG是目前很火的一种技术框架,它能够利用检索外部内容的方式增强大语言模型的准确度、专业能力和个性化等各方面的性能。QAnything作为有道自研的RAG引擎,结合了用户私有数据和大模型的优势——用户的任何内容,以任意的形式存在,比如各种格式的文档,音频,数据库等,都可以在QAnything的支持下,变成可以针对其内容进行问答的使用方式,通过这个技术框架用户可以很方便地搭建自己的智能知识助手。来源:微信公众号【网易有道】

© 版权声明

相关文章

暂无评论

暂无评论...