根据用户对item的点击次数来判据用户对物品的打分情况
每个物品的内容特征向量,可如下表示:
d j = ( w 1 j , w 2 j , ⋯   , w n j ) d_j = (w_{1j}, w_{2j}, \cdots, w_{nj}) dj=(w1j,w2j,⋯,wnj)
每个物品可以用一个n维向量表示。其中 w n j w_{nj} wnj 表示每一维的特征权重。每一维代表了一个标签或者是一个单词等基础要素。
假如用户喜欢物品{1, 3, 7},则该用户的特征向量可以表示为: U k = ( d k 1 + d k 2 + d k 3 ) / 3 = ( u 1 k , u 2 k , ⋯   , u n k ) U_k = (d_{k1} + d_{k2} + d_{k3})/3 = (u_{1k}, u_{2k}, \cdots, u_{nk}) Uk=(dk1+dk2+dk3)/3=(u1k,u2k,⋯,unk) 那么用户k在文章t上的得分可以使用余弦公式计算得到: s c o r e = cos θ = ∑ i = 1 n ( u i k × w i t ) ∑ i = 1 n u i k 2 × ∑ i = 1 n w i t 2 score = \cos\theta = \frac{\sum_{i=1}^n (u_{ik} \times w_{it})}{ \sqrt{\sum_{i=1}^n u_{ik}^2} \times \sqrt{\sum_{i=1}^n w_{it}^2} } score=cosθ=∑i=1nuik2 ×∑i=1nwit2 ∑i=1n(uik×wit)
