赞
踩
用这个数据集实现了一个小型的电影推荐网站,GitHub代码
数据集是MovieLens提供的ml-latest-small
https://grouplens.org/datasets/movielens/
试了几个数据集,这个数据集效果比较好
10万条评分记录,3600个用户对电影打的标签,9000部电影,600个用户
数据集的格式是这样的
link.csv :存放电影的imdb id和tmdb id
movies.csv :存放电影的id 名称 类型
ratings.csv :用户对电影的评分,范围是0.5~5
tags.csv :用户对电影打的标签
link.csv文件是这样的格式:
我刚看的时候不明白imdbID是什么意思,后面访问IMBD网站发现,这里的imdbID就是URL里面的标识符
有了link.csv文件里面的imdbID,我们就可以访问到这部电影在IMDB上面的详情页面了(这个数据集也太爽了
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。