OneRec : 快手推出的端到端生成式推荐系统
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
主要介绍
OneRec是快手推出的一款基于生成式AI的端到端推荐系统,旨在突破传统推荐系统依赖多阶段流水线(如召回、粗排、精排)的架构限制。通过将推荐任务转化为序列生成问题,OneRec直接从用户历史行为中生成推荐列表,实现了推荐流程的一体化。该系统已在快手App和极速版中全面上线,承接约25%的请求量,显著提升了用户停留时长和生命周期价值,同时大幅降低了算力成本。

功能特点
- 端到端生成:通过Encoder-Decoder架构直接生成推荐列表,无需多阶段排序。
- 多模态融合:结合视频标题、图像等多维信息与用户行为,生成更精准的推荐。
- 强化学习偏好对齐:引入综合奖励系统(用户偏好、格式奖励、业务奖励),提升推荐质量。
- 高效算力利用:通过架构优化和算子压缩,训练和推理的算力利用率(MFU)分别提升至23.7%和28.8%,运营成本仅为传统方案的10.6%。
- 大规模工业应用:已在快手主场景全量部署,支持512大Beam Size生成需求。
优缺点
优点:
- 效果提升:推荐更精准,用户停留时长和生命周期显著增长。
- 成本降低:算力利用率大幅提升,运营成本降低近90%。
- 架构简化:端到端设计减少了传统推荐系统的复杂性和目标冲突。
缺点:
- 计算资源需求:尽管MFU提升,但大规模生成式模型仍需较高的计算资源。
- 冷启动问题:对于新用户或新物品,生成式推荐可能面临数据稀疏的挑战。
- 可解释性:生成式模型的推荐结果可能较难解释,影响调试和优化。
如何使用
OneRec已在快手内部全面上线,开发者无法直接调用其API。但快手可能通过开放平台或合作方式提供相关技术能力。对于外部开发者,建议关注快手开放平台的动态,或参考快手发布的技术报告和论文(如《OneRec: Unifying Retrieve and Rank with Generative Recommender and Preference Alignment》)了解技术细节。
框架技术原理
- Encoder-Decoder架构:
- Encoder:整合用户终身/短期行为序列,实现多尺度建模。
- Decoder:基于MoE(Mixture-of-Experts)增强的结构,通过Next Token Prediction生成推荐结果。
- 多模态分词器:
- 融合视频标题、图像等多维信息与用户行为,利用RQ-Kmeans分层生成语义ID。
- 强化学习偏好对齐:
- 通过融合偏好奖励、格式奖励及业务奖励构建综合奖励系统,利用个性化P-Score作为强化信号。
- 采用改进的ECPO算法提升训练稳定性。
- 性能优化:
- 训练侧:请求分组特征复用、变长Flash Attention、自研SKAI系统实现Embedding全流程GPU训练。
- 推理侧:Encoder单次前向、Beam间KV共享、Decoder层KV Cache,支持512大Beam Size生成需求。
创新点
- 端到端生成式推荐:首次将推荐任务转化为序列生成问题,替代传统多阶段排序。
- 会话级列表生成:考虑每个会话内物品的相对内容和顺序,生成更连贯、多样化的推荐列表。
- 迭代偏好对齐(IPA):通过奖励模型生成偏好数据,优化生成结果,提升推荐质量。
- 高效算力利用:通过架构重构和算子压缩,实现算力效能的显著提升。
评估标准
- 推荐效果:用户停留时长、点赞、关注、评论等交互指标。
- 算力利用率:训练和推理的MFU(Machine Floating-point Utilization)。
- 运营成本:与传统推荐系统的成本对比。
- 业务指标:如GMV、订单量、购买用户数等(在本地生活服务场景中)。
应用领域
- 短视频推荐:快手App和极速版的主场景。
- 本地生活服务:如电商、到店服务等,推动GMV和订单量增长。
- 其他内容推荐场景:如新闻、音乐、直播等,具有广泛的适用性。
项目地址
- arXiv技术论文:https://export.arxiv.org/pdf/2502.18965
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...