2022-PEAR-Personalized Re-ranking with Contextualized Transformer for Recommendation

Posted Mar 10, 2024

By mengyao 2 min read

Motivation

从list-wise角度捕捉item之间的相互影响
先前的工作比如GlobalRank和 DLCM使用RNN编码序列，但是RNN捕捉pairwise信息的能力有限，PRM and SetRank使用了transformer结构，但是没有充分利用个性化信息（user特征）
本文提出PEAR模型结构，从feature-level和item-level进行信息交互，使用多目标任务结构预测item的预估分和预测用户对list的满意度

模型的输入分为三个部分：用户历史行为序列\(B=[b_{1},b_{2}...b_{n}]\)，初始化item序列\(S=[s_{1},s_{2}...s_{n}]\)，用户特征

本文中提出的item-level的交互结构，不仅仅能够学习用户历史行为和初始化item两个list内部的item特征交互，还能够学习list之间的特征交互，具体步骤：

\[H_{B} = Softmax(\frac{(W_{Q}Z_{B})^T(W_{K}Z_{B})}{\sqrt{d_{h}}})(W_{V}Z_{B})^T\]

\[H_{S} = Softmax(\frac{(W_{q}Z_{S})^T[(W_{K1}H_{B}^{T},W_{k2}Z_{S}])}{\sqrt{d_{h}}})(W_{v1}H_{B}^{T},W_{v2}Z_{S})^{T}\]

单个item的损失函数：用户是否有点击目标item

\[L_{m} = \sum y_{t}log\hat{y_{t}} + (1-y_{t})log(1-\hat{y_{t}})\]

序列整体损失函数：序列中是否包含正样本

\[L_{aux} = \sum y_{aux}log\hat{y_{aux}} + (1-y_{aux})log(1-\hat{y_{aux}})\]

This post is licensed under CC BY 4.0 by the author.