深度学习应用篇-推荐系统[12]:经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比

如题所述

在深度学习推荐系统的探索中,DeepFM模型与DSSM模型各展所长,以高效预测用户点击行为为己任。


DeepFM模型,如同一场精妙的融合,将FM(Factorization Machines)的低阶特征处理与DNN(Deep Neural Networks)的高阶非线性捕捉合二为一。它巧妙地解决了LR(Logistic Regression)中的特征交叉难题,对于处理稀疏数据和高维特征问题游刃有余。FM层聚焦于二阶特征的精确捕捉,而DNN层则负责处理复杂的非线性关系,免去了繁琐的手动特征工程,训练速度显著提升。模型的损失函数采用Binary Cross Entropy,衡量着模型的对数概率和预测精度。


至于AUC(Area Under Curve)这一评价指标,通过paddle.metric.Auc()函数调用,它在评估二分类模型的性能时扮演着重要角色。DeepFM在与高阶/低阶特征、以及特征工程的对比中,以其在Company*和Criteo数据集上的优秀表现脱颖而出,证明了其强大的预测能力。


DSSM(Deep Structured Semantic Model),则专为搜索引擎的语义理解而生,PaddleRec的实现独具匠心。它的设计包含输入层(利用英文的word hashing处理,中文则无须分词)、表示层和匹配层,通过这种简化的映射方式,减少了空间需求并增强了数据规范化。对于中文,DSSM采用单字最小粒度的1.5万维字向量,BOW(Bag of Words)策略舍弃了位置信息,而DNN则负责深化表示,生成128维的语义向量,用于计算Query-Doc的相似度。


在训练过程中,DSSM采用softmax和极大似然估计,负样本仅用于反向传播中的loss计算。这种设计的优势在于减少对切词的依赖,增强了模型的泛化性能,避免了无监督映射中的潜在误差。然而,它也面临着丧失语序和上下文信息的局限,使得预测结果的可控性受到影响。要深入了解这两种模型的详细信息,不妨关注我们的公众号“汀丶人工智能”。


综上,DeepFM与DSSM在推荐系统中各具特色,它们的优缺点及应用场景的适应性,为深度学习在个性化推荐中的应用提供了丰富的视角。深入研究这些模型,无疑将有助于我们更好地理解用户行为并提升推荐系统的精准度。

温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜