Neo4j 做推荐（9）—— 协同过滤（人群的智慧）

简单的协同过滤


1
2
3
4
5
MATCH (u:User {name: "Cynthia Freeman"})-[:RATED]->(:Movie)&lt;-[:RATED]-(o:User)

MATCH (o)-[:RATED]->(rec:Movie)

WHERE NOT EXISTS( (u)-[:RATED]->(rec) )

RETURN rec.title, rec.year, rec.plot

LIMIT 25

上面的简单的过滤方法其实存在很多问题，例如不基于流行度来进行规范或不考虑评级。

只考虑用户喜欢的类型

许多推荐系统融合了协同过滤和基于内容的方法，对于特定用户，哪些类型的评分高于平均水平？用它来评分类似的电影：


1
2
3
4
5
6
7
8
9
10
11
12
13
MATCH (u:User {name: "Andrew Freeman"})-[r:RATED]->(m:Movie)

WITH u, avg(r.rating) AS mean

 

MATCH (u)-[r:RATED]->(m:Movie)-[:IN_GENRE]->(g:Genre)

WHERE r.rating > mean

 

WITH u, g, COUNT(*) AS score

 

MATCH (g)&lt;-[:IN_GENRE]-(rec:Movie)

WHERE NOT EXISTS((u)-[:RATED]->(rec))

 

RETURN rec.title AS recommendation, rec.year AS year, COLLECT(DISTINCT g.name) AS genres, SUM(score) AS sscore

ORDER BY sscore DESC LIMIT 10

分析：

1. 用户u评过的电影的平均分

2. 找出用户u评过的高于平均分的电影的分类，并对分类计数

3. 找出这些分类的相关的电影，并且这些电影是用户u没有评过分的

4. 找出电影分类中影片数最多的前10部电影

在 “Neo4j 做推荐 （9）—— 协同过滤（人群的智慧）” 上有 1 条评论

在 “Neo4j 做推荐（9）—— 协同过滤（人群的智慧）” 上有 1 条评论