LSH-局部敏感哈希是什么算法?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1663个文字,预计阅读时间需要7分钟。
假设通过用户与物品的相似度进行个性化推荐,用户和物品的Embedding都在一个(k)维的Embedding空间中,物品总数为(n),计算一个用户与所有物品向量相似度的时间复杂度是O(kn)。
假设通过用户 - 物品相似度进行个性化推荐
用户和物品的 Embedding 都在一个 \(k\) 维的 Embedding 空间中,物品总数为 \(n\),计算一个用户和所有物品向量相似度的时间复杂度是$ O(k*n)$
直觉的解决方案- 基于聚类
- 基于索引
优点:
离线计算好每个 Embedding 向量的类别,在线上我们只需要在同一个类别内的 Embedding 向量中搜索就可以。
本文共计1663个文字,预计阅读时间需要7分钟。
假设通过用户与物品的相似度进行个性化推荐,用户和物品的Embedding都在一个(k)维的Embedding空间中,物品总数为(n),计算一个用户与所有物品向量相似度的时间复杂度是O(kn)。
假设通过用户 - 物品相似度进行个性化推荐
用户和物品的 Embedding 都在一个 \(k\) 维的 Embedding 空间中,物品总数为 \(n\),计算一个用户和所有物品向量相似度的时间复杂度是$ O(k*n)$
直觉的解决方案- 基于聚类
- 基于索引
优点:
离线计算好每个 Embedding 向量的类别,在线上我们只需要在同一个类别内的 Embedding 向量中搜索就可以。

