扩散模型也能搞定社交信息推荐,港大数据智能实验室提出
RecDiff团队投稿
量子位|公众号QbitAI
用扩散模型搞社交信息推荐,怎么解决数据噪声难题?现有的一些自监督学习方法效果还是有限。
针对此,港大数据智能实验室提出了新项目RecDiff
。
RecDiff是一种全新的基于扩散模型的推荐框架,能够更好地捕捉用户的潜在偏好和兴趣,从而生成个性化、贴合用户需求的推荐内容。
具体而言,该框架采用隐空间扩散机制,有效清除用户表示中的噪声,无论是压缩还是密集的嵌入空间。
RecDiff通过多步扩散和噪声消除过程,展现出在不同噪声水平下均能准确识别和去除噪声的能力。
此外,扩散模块针对下游推荐任务进行了优化,以最大化其对推荐过程的增强效果。
通过广泛的实验评估,RecDiff在提高推荐准确性、训练效率以及去噪效果方面均表现出色。
研究方法
基于图协同过滤的编码器
受到简化图神经网络(GNN)成功应用的启发,图那对在社交去噪框架中采用了轻量级图卷积网络(GCN)作为图编码器。
图关系去噪模型
隐空间的社交扩散
汲取扩散模型在各个领域成功生成无噪声数据的精髓,研究团队的RecDiff框架集成了一种创新的扩散机制,用以产生净化后的社交关系数据。
面对社交图数据固有的稀疏性挑战,研究团队设计了一种策略:
在潜在空间而非直接在图数据空间中,通过正向与反向的扩散步骤,实现社交信息的高效和精准扩散。
如上图所示,该隐空间社交扩散过程可通过以下公式进行精炼表达:
正向和反向扩散
扩散损失函数
推断过程
预测和优化
利用隐空间社交扩散模块,研究者将去噪后的社交关系与编码后的交互范式结合起来,以获得预测的最终嵌入。
具体方法如下:
模型复杂性分析
本节全面分析了研究者的RecDiff与社会扩散模块在时间和空间上的复杂性。
时间复杂性
空间复杂性
实验

模型整体性能比较
团队比较了团队的模型与基线模型的整体推荐性能。
top-20和不同top-N的验证结果列于下表:
团队的RecDiff始终优于最先进的基线,展示了卓越的推荐准确性。
T检验证实了团队的结果在所有数据集和评估指标上的统计意义。
在不同的top-N设置中,RecDiff的性能优势保持一致。团队的基于扩散的社交关系去噪模块可以去除无关信息和虚假信息,从而使RecDiff有效地挖掘有价值的社交关系以增强推荐效果。
一些社交推荐方法如(DGRec、DiffNet和GraphRec)的表现比与社交信息无关的方法NGCF差。这表明,由于虚假或不相关的成分,扩散模型也能搞定社交信息推荐,港大数据智能实验室提出社交关系会对用户-商品关系建模产生负面影响。
团队的RecDiff框架通过对社交信息去噪来解决这个问题,其性能始终优于基线模型GDMSR。它能有效过滤社交关系中的噪音,识别有意义和有影响力的社交关系,准确编码用户偏好,从而实现精准推荐。
包含自监督学习(SSL)的基准方法在推荐性能上一直优于其他方法。MHCN、KCGN和SMIN等方法利用了局部-全局互信息最大化技术的变体,而DSL则采用了预测对齐自监督任务的方法。
这凸显了辅助监督信号在解决社交推荐中的数据缺陷难题(如噪声和稀疏性)方面的积极影响。
相比之下,团队的模型引入了一种基于扩散模型的多步骤去噪方法,在不同的噪声水平下生成更多的监督信号。这种强大的去噪能力带来了超越基线的卓越推荐性能。
消融实验
团队将通过一项消融研究来探讨RecDiff框架中不同子模块的影响。团队评估了通过删除或替换基本模块而获得的几个变体的性能。
超参数的影响
噪声对模型的影响
训练效率研究
与基线模型(MHCN、SMIN和KCGN)相比,团队在Ciao和Yelp数据集上优化RecDiff的效率。
RecDiff在训练和测试中都表现出了明显的效率优势。对于每个训练历时,团队都评估并记录了测试集的性能,以分析改进情况。
对RecDiff框架抗噪能力的进一步探索
团队评估了RecDiff在数据噪声情况下的鲁棒性,方法是在用户-用户图中引入随机虚假边来替代不同比例的真实社交连接。
然后使用被破坏的图对模型进行重新训练,并在真实测试集上进行评估。
具体来说,团队分析了用噪声信号替换0%、20%和50%的社交关系的效果。
比较RecDiff与MHCN和DiffNet的性能,上图(a)和(b)中的结果显示了原始评估结果,而(c)则说明了NDCG的相对性能变化。
基于这些结果,团队可以得出以下结论:
案例分析
团队探讨RecDiff在特定用户/商品案例中的去噪效果。
图中展示了四个子图案例,突出了去噪的必要性。
基线方法KCGN和MHCN无法识别错误的社交连接,导致这些错误社交邻居的相似性得分很高。
相比之下,RecDiff能有效识别这些噪声实例,显著降低相似性得分,并为虚假连接的用户生成不同的嵌入。
这些发现证明了RecDiff在不同噪声情况下的出色消噪能力。
图中还介绍了另外两种情况,即用户对共享的交互商品在类别上与用户交互的其他商品存在显著差异。
这些孤立的交互很可能存在噪声的商品,从而使相关的社交链接也变得有噪声。
RecDiff再次成功地识别并消除了这些噪音,为虚假的社交邻居分配了较低的相似性分数并生成了更独特的嵌入。
这些案例进一步体现了RecDiff方法的出色去噪效果。
结语
项目团队提出了一种名为RecDiff的新型扩散模型,旨在通过消除用户之间噪音社交链接来增强社会化推荐系统。
RecDiff采用多步噪声传播和消除的训练方式,在隐藏空间中运行,利用编码的用户表征,实现了高效和简单的设计。
通过在不同扩散步骤下对模型进行训练,RecDiff展现出了出色的噪声处理能力,能够有效应对各种类型的噪声影响。
研究图那对在真实世界数据集上评估了模型的性能,结果显示相比现有方法,RecDiff在推荐准确率方面取得了显著提升。
未来,RecDiff团队计划将RecDiff拓展到更多推荐场景中,并结合多模态信息,进一步探索该模型的潜力和应用价值。
论文:http://github.com/HKUDS/RecDiff
源代码:https://github.com/HKUDS/RecDiff
港大数据智能实验室:https://sites.google.com/view/chaoh
相关文章
-
科技与人文关怀,从52岁保姆上吊事件看社会问题背后的深层思考详细阅读
一则令人痛心的新闻引发了广泛关注——一位52岁的保姆因不堪生活重压而选择以极端方式结束自己的生命,这起悲剧不仅让我们对个体命运产生深深的同情,也促使我...
2026-03-24 5
-
探索最好的求职网站,找到你的职业新起点详细阅读
在当今这个快速发展的数字化时代,找工作的方式早已从传统的线下招聘会和报纸广告转移到了线上平台,无论是初入职场的毕业生、寻求转型的职业人士,还是希望提升...
2026-03-24 5
-
探秘封门村,孟非的镜头下,现实与传说交织的神秘之地详细阅读
封门村的神秘面纱提到“封门村”,很多人脑海中会浮现出一幅充满神秘色彩的画面——一个被废弃的小山村、破败的房屋、诡异的传闻,以及无数探险者趋之若鹜的身影...
2026-03-24 5
-
探寻丹田的位置与意义—身体的能量中心详细阅读
在中医理论、气功修炼以及武术训练中,“丹田”是一个经常被提及的概念,它不仅被视为人体的重要穴位,更是许多人追求健康和内在力量的核心所在,对于大多数人来...
2026-03-24 5
-
从清纯美女校花看青春与美的多元定义详细阅读
在我们的生活中,“清纯美女校花”是一个常被提及的话题,无论是校园里的真实人物,还是影视剧中的角色塑造,这个形象总是带着一种特别的吸引力,她可能是一个穿...
2026-03-24 5
-
EXO的成员,从音乐偶像到文化现象,他们如何影响我们的生活?详细阅读
如果你对K-pop稍有了解,EXO”这个名字一定不会陌生,这个由SM娱乐公司在2012年推出的男子组合,不仅在韩国本土掀起了一股热潮,更是在全球范围内...
2026-03-24 5
-
奥黛丽赫本的眼睛—那扇通往灵魂的窗户,如何定义了永恒之美?详细阅读
如果你问起世界上最迷人的双眼属于谁,许多人的脑海中可能会立刻浮现出一个名字:奥黛丽·赫本,她的眼睛,就像夜空中最亮的星星,既温柔又深邃,仿佛能看穿你的...
2026-03-24 6
-
科学解读,阴茎长度的正常范围与健康认知详细阅读
阴茎长度的平均数据根据多项国际医学研究,成年男性的阴茎长度(包括疲软状态和勃起状态)存在一定的范围差异,以下是基于全球大规模调查得出的一些统计数据:疲...
2026-03-24 6
