OneRec : 快手推出的端到端生成式推荐系统

AI工具4小时前发布 FuturX-Editor
12 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

OneRec是快手推出的一款基于生成式AI的端到端推荐系统,旨在突破传统推荐系统依赖多阶段流水线(如召回、粗排、精排)的架构限制。通过将推荐任务转化为序列生成问题,OneRec直接从用户历史行为中生成推荐列表,实现了推荐流程的一体化。该系统已在快手App和极速版中全面上线,承接约25%的请求量,显著提升了用户停留时长和生命周期价值,同时大幅降低了算力成本。

OneRec : 快手推出的端到端生成式推荐系统

功能特点

  1. 端到端生成:通过Encoder-Decoder架构直接生成推荐列表,无需多阶段排序。
  2. 多模态融合:结合视频标题、图像等多维信息与用户行为,生成更精准的推荐。
  3. 强化学习偏好对齐:引入综合奖励系统(用户偏好、格式奖励、业务奖励),提升推荐质量。
  4. 高效算力利用:通过架构优化和算子压缩,训练和推理的算力利用率(MFU)分别提升至23.7%和28.8%,运营成本仅为传统方案的10.6%。
  5. 大规模工业应用:已在快手主场景全量部署,支持512大Beam Size生成需求。

优缺点

优点

  • 效果提升:推荐更精准,用户停留时长和生命周期显著增长。
  • 成本降低:算力利用率大幅提升,运营成本降低近90%。
  • 架构简化:端到端设计减少了传统推荐系统的复杂性和目标冲突。

缺点

  • 计算资源需求:尽管MFU提升,但大规模生成式模型仍需较高的计算资源。
  • 冷启动问题:对于新用户或新物品,生成式推荐可能面临数据稀疏的挑战。
  • 可解释性:生成式模型的推荐结果可能较难解释,影响调试和优化。

如何使用

OneRec已在快手内部全面上线,开发者无法直接调用其API。但快手可能通过开放平台或合作方式提供相关技术能力。对于外部开发者,建议关注快手开放平台的动态,或参考快手发布的技术报告和论文(如《OneRec: Unifying Retrieve and Rank with Generative Recommender and Preference Alignment》)了解技术细节。

框架技术原理

  1. Encoder-Decoder架构
    • Encoder:整合用户终身/短期行为序列,实现多尺度建模。
    • Decoder:基于MoE(Mixture-of-Experts)增强的结构,通过Next Token Prediction生成推荐结果。
  2. 多模态分词器
    • 融合视频标题、图像等多维信息与用户行为,利用RQ-Kmeans分层生成语义ID。
  3. 强化学习偏好对齐
    • 通过融合偏好奖励、格式奖励及业务奖励构建综合奖励系统,利用个性化P-Score作为强化信号。
    • 采用改进的ECPO算法提升训练稳定性。
  4. 性能优化
    • 训练侧:请求分组特征复用、变长Flash Attention、自研SKAI系统实现Embedding全流程GPU训练。
    • 推理侧:Encoder单次前向、Beam间KV共享、Decoder层KV Cache,支持512大Beam Size生成需求。

创新点

  1. 端到端生成式推荐:首次将推荐任务转化为序列生成问题,替代传统多阶段排序。
  2. 会话级列表生成:考虑每个会话内物品的相对内容和顺序,生成更连贯、多样化的推荐列表。
  3. 迭代偏好对齐(IPA):通过奖励模型生成偏好数据,优化生成结果,提升推荐质量。
  4. 高效算力利用:通过架构重构和算子压缩,实现算力效能的显著提升。

评估标准

  1. 推荐效果:用户停留时长、点赞、关注、评论等交互指标。
  2. 算力利用率:训练和推理的MFU(Machine Floating-point Utilization)。
  3. 运营成本:与传统推荐系统的成本对比。
  4. 业务指标:如GMV、订单量、购买用户数等(在本地生活服务场景中)。

应用领域

  1. 短视频推荐:快手App和极速版的主场景。
  2. 本地生活服务:如电商、到店服务等,推动GMV和订单量增长。
  3. 其他内容推荐场景:如新闻、音乐、直播等,具有广泛的适用性。

项目地址

© 版权声明

相关文章

暂无评论

暂无评论...