Recommending items to more than a billion people

网络上数据的增长使得在完整数据集上使用许多机器学习算法变得更加困难。特别是对于个性化问题,数据采样通常不是一种选择,因此有必要创新分布式算法设计,以便我们可以扩展到这些不断增长的数据集。

 

协同过滤(CF)是重要的应用领域之一。 CF是一种推荐的系统技术,可帮助人们发现与其最相关的项目。在Facebook上,这可能包括页面,群组,活动,游戏等。 CF基于这样的想法,即最佳推荐来自具有相似品味的人。换句话说,它使用志同道合的人的历史项目评级来预测某人如何评估项目。