像last.fm,grooveshark,pandora这样的推荐网站背后的algorithm是什么?

我正在考虑启动一个基于build议系统的项目。 在这个看起来像networking热门话题的领域,我需要提高自己。 也想知道什么是algorithmlastfm,grooveshark,潘多拉使用他们的推荐系统。 如果您知道任何书籍,网站或任何资源这种algorithm,请通知。

看看协作过滤或推荐系统 。

一个简单的algorithm是Slope One 。

一个时髦的迟到回应:潘多拉和Grooveshark在他们使用的algorithm是非常不同的。

推荐系统基本上有两种主要的方法 – 1.协同过滤,和2.基于内容。 (和混合系统)

大多数系统都基于协作过滤。 如果我喜欢A,B,C,D,E和F项,以及其他几个用户喜欢A,B,C,D,E,F和J,系统会推荐J我基于我与这些用户分享相同口味的事实(这不是那么简单,但是这是主意)。 这里分析的主要function是项目ID和用户对这些项目投票。

基于内容的方法分析手头项目的内容,并根据我喜欢的项目内容构build我的个人档案,而不是基于其他用户喜欢的内容。

有说 – Grooveshark是基于协作过滤潘多拉是基于内容(也许与顶部的一些协作过滤层)。

关于潘多拉有趣的是内容是由人类(音乐家)而不是自动分析的。 他们称之为音乐基因组计划( http://www.pandora.com/mgp.shtml ),其中注释者用几个标签标注每首歌曲,如结构,节奏,音调,录音技术等等完整列表: http : //en.wikipedia.org/wiki/List_of_Music_Genome_Project_attributes )这就是让他们select解释和certificate推荐歌曲的理由。

编程集体智慧是一个很好的,平易近人的介绍这个领域。

有一个很好的演示video,在音乐collections的映射和可视化上有解释(和作者论文的链接)。 这种方法处理分析音乐本身的特点。 其他的方法,如NetFlix和亚马逊,依赖于来自其他用户口味相似的推荐以及基本的类别过滤。

Yehuda Koren(获得Netflix奖的团队)的大纸:Netflix大奖的BellKor解决scheme(谷歌“GrandPrize2009_BPC_BellKor.pdf” )。

情侣网站:

  • Trustlet.org
  • Jun Wang博士的协作过滤教程
  • Google: 基于项目的top-n推荐algorithm

曼宁在这方面也有两本好书。 智能networking与集体智能在行动的algorithm

这是两种截然不同的方法。 就文学而言,Google Scholar是您的朋友。

潘多拉盒子的开始只是将特定的音乐types与您input的某首歌曲进行匹配。 如果他们喜欢这首歌,或者不喜欢这首歌,就可以通过投票的方式慢慢地成长起来,消除不良歌曲,把好歌推到前面。 它也会慢慢地把你的歌曲播放列表中没有任何选票的新歌曲,以便歌曲可以得到一些选票。

不清楚列出的其他网站。

Interesting Posts