1月17日

AI资讯速递2年前 (2024)发布 FuturX-Editor

801 0 1

1月17日·周三 AI工具和资源推荐

AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

智谱 AI 推出新一代基座大模型 GLM-4，能力逼近 GPT-4，配备多模态、长文本和智能体

1月16日，智谱AI在其首届技术开放日（Zhipu DevDay）正式发布了新一代基座大模型GLM-4。GLM-4的整体性能相比上一代大幅提升，逼近GPT-4。它可以支持更长的上下文，具备更强的多模态能力。同时，它的推理速度更快，支持更高的并发，大大降低推理成本。除此之外，GLM-4大幅提升了智能体能力，GLM-4 All Tools 实现自主根据用户意图，自动理解、规划复杂指令，自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线，用户用简单的提示词指令就能创建属于自己的 GLM 智能体。GLM-4 最大的亮点：多模态能力：推出了CogView3代，效果超过开源SD模型，逼近 DALLE-3。All Tools能力：GLM-4能自主理解复杂指令，自由调用WebGLM搜索增强、Code Interpreter代码解释器和多模态生成能力，完成复杂任务。GLMs个性化智能体定制：用户可以通过智谱清言官方网站创建属于自己的GLM智能体，无需编程基础。MaaS平台和API：GLM-4登陆了Maas平台，提供API访问，支持开发者内测Assistant API。来源：极客公园-AI新浪潮观察

Yann LeCun发来肯定：腾讯人像照片生成可以随便玩了

来自南开大学、腾讯等机构提出了 PhotoMaker，这是一种高效的个性化文本到图像生成方法。相关论文《PhotoMaker：Customizing Realistic Human Photos via Stacked ID Embedding 》于去年 12 月放出，刚刚，项目也已经开源。不到一天时间，星标量高达 650+。PhotoMaker 除了生成逼真的人像，还能进行其他风格的生成，如草图、漫画、动画等。这项研究可以人人试玩，操作也非常简单，分为 4 步：首先是上传一张图片，一张就可以了，不过多张效果会更好，上传图片中的人脸应该占据图像的大部分。第二步是输入文本提示，操作过程中确保使用触发词 img，例如 man img、woman img 或 girl img。第三步是选择喜欢的风格模板（内置有十多种）。最后一步是单击 Submit 按钮，等待生成。以上生成过程如果有操作不当的地方，PhotoMaker 都会进行提示，不用怕自己操作失误。PhotoMaker 这种高效的个性化文本到图像生成方法，它主要将任意数量的输入 ID 图像编码成一个堆叠 ID 嵌入，以保留 ID 信息。这样的嵌入作为统一的 ID 表征，不仅可以全面封装相同输入 ID 的特征，而且还可以适应不同 ID 的特征以供后续集成。这为更有趣和实用价值的应用铺平了道路。来源：微信公众号【机器之心】

又一大模型技术开源！有道自研RAG引擎QAnything正式开放下载

网易有道自研的知识库问答引擎QAnything正式开源！除了可以调用云端大模型服务，还支持纯本地部署，大家可免费在开源社区Github内进行下载（地址：https://github.com/netease-youdao/Qanything）一键部署即可使用！系统支持word、ppt、excel、pdf、图片等多种文档格式，直接导入进去即可像”ChatGPT”一样问答。如果你有大量的文档需要问答，又对隐私比较关心，且有个带Nvidia显卡(推荐3090及以上)的电脑，都可以下载QAnything使用哦。QAnything的主要原理是基于检索增强的生成（Retrieval Augmented Generation，简称RAG）。RAG是目前很火的一种技术框架，它能够利用检索外部内容的方式增强大语言模型的准确度、专业能力和个性化等各方面的性能。QAnything作为有道自研的RAG引擎，结合了用户私有数据和大模型的优势——用户的任何内容，以任意的形式存在，比如各种格式的文档，音频，数据库等，都可以在QAnything的支持下，变成可以针对其内容进行问答的使用方式，通过这个技术框架用户可以很方便地搭建自己的智能知识助手。来源：微信公众号【网易有道】