10月26日·卫浴巨头科勒智能马桶:健康监测的新入口
10月26日·周日 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
卫浴巨头科勒智能马桶:健康监测的新入口
卫浴巨头科勒推出了一款名为Dekoda的智能马桶相机,售价599美元。它通过摄像头拍摄排泄物,利用AI算法分析肠道健康、身体含水状态等,并能识别用户身份。类似产品还有初创公司Throne的设备,其“人工肠智能”算法可分析排泄物的多维指标。斯坦福大学教授曾研发智慧马桶,通过肛纹识别身份并分析排泄物数据。这些智能马桶强调健康管理而非医疗诊断,目标人群是老龄用户和慢性消化道疾病患者。然而,隐私保护和算法准确性是关键挑战。科勒强调摄像头只拍马桶内,数据端到端加密;而TOTO则采用光学传感方案规避隐私风险。智能马桶有望成为健康监测的新入口,但目前仍面临信任和市场接受度的挑战。来源:微信公众号【机器之心】
苹果开源图像编辑数据集Pico-Banana-400K
苹果研究团队开源了一个名为Pico-Banana-400K的图像编辑数据集,包含40万张基于真实图像的编辑示例。该数据集利用Nano-Banana模型生成多样化编辑对,涵盖35种编辑分类法,通过多模态大模型评分和人工筛选确保质量。它包含单轮监督微调子集、多轮编辑集、偏好集和长短指令配对集,支持多种研究需求。苹果还构建了自我编辑和评估流程,由Nano-Banana负责编辑,Gemini 2.5 Pro负责评判。该数据集为训练和评测新一代文本引导图像编辑模型奠定了基础,推动了多模态学习的发展。来源:微信公众号【机器之心】
Fast-dLLM v2:提升大语言模型吞吐量
NVIDIA、港大和MIT联合推出了Fast-dLLM v2,将自回归(AR)模型适配为并行解码的Block-dLLM,仅需约1B tokens微调即可实现“无损”迁移。该模型通过块式扩散与AR友好注意力、层级缓存和置信度感知并行解码等技术,在A100/H100上将端到端吞吐量提升最高达2.5倍,同时保持生成质量。实验表明,其7B规模吞吐量比Qwen2.5-7B-Instruct提升2.54倍,且准确率更高。Fast-dLLM v2降低了训练成本,提供了成本与收益均衡的解决方案,为大语言模型的高效推理提供了新思路。来源:微信公众号【量子位】
PRIMA视网膜:人工视觉技术助力盲人复明
Nature杂志报道了一项人工视觉技术的重大突破,由Neuralink联合创始人创立的Science Corporation开发的PRIMA视网膜植入物,帮助一位70岁失明老人恢复了视力。PRIMA通过无线光伏组件和特殊眼镜,将图像信息转化为电刺激,恢复视网膜神经元的视觉信号传递。临床实验表明,该系统能让84%的患者恢复功能性中央视力,80%的患者视力显著提升。PRIMA已向欧洲监管部门提交申请,并计划明年推出。尽管目前存在局限性,如视觉效果为黑白且像素有限,但该技术为失明者带来了希望,未来有望进一步优化。来源:微信公众号【量子位】
美图AI Agent RoboNeo:P图新体验
美图推出了一款名为RoboNeo的AI Agent,用户可以通过对话框输入指令进行图像生成和编辑。它支持多种功能,如AI改图、扩图、超清、抠图等,并具备拆分图层功能,可自动识别图片元素并进行编辑。在图像生成方面,RoboNeo能够生成高质量的贴纸、合照等,但在视频生成方面存在一些问题,如画面逻辑性和文字生成效果不佳。尽管如此,RoboNeo凭借其强大的修图能力和便捷的操作方式,为用户带来了全新的P图体验。来源:微信公众号【量子位】