博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习(6) MovieLens数据集
阅读量:4287 次
发布时间:2019-05-27

本文共 1391 字,大约阅读时间需要 4 分钟。

MovieLens数据集是一个关于电影评分的数据集,里面包含了从IMDB, The Movie DataBase上面得到的用户对电影的评分信息,详细请看下面的介绍。

介绍:
links.csv:
文件里面的内容是帮助你如何通过网站id在对应网站上找到对应的电影链接的。数据格式如下: 
movieId, imdbId, tmdbId 
movieId:表示这部电影在movielens上的id,可以通过链接https://movielens.org/movies/(movieId)来得到。 
imdbId:表示这部电影在imdb上的id,可以通过链接http://www.imdb.com/title/(imdbId)/ 
来得到。 
tmdbId:表示这部电影在themoviedb上的id,可以通过链接http://www.imdb.com/title/(tmdbId)/ 
来得到。

movies.csv:

movieId, title, genres 
文件里包含了一部电影的id和标题,以及该电影的类别。数据格式如下: 
movieId, title, genres 
movieId:每部电影的id 
title:电影的标题 
genres:电影的类别(详细分类见readme.txt)

ratings.csv:

文件里面的内容包含了每一个用户对于每一部电影的评分。数据格式如下: 
userId, movieId, rating, timestamp 
userId: 每个用户的id 
movieId: 每部电影的id 
rating: 用户评分,是5星制,按半颗星的规模递增(0.5 stars - 5 stars) 
timestamp: 自1970年1月1日零点后到用户提交评价的时间的秒数 
数据排序的顺序按照userId,movieId排列的。

tags.csv:

文件里面的内容包含了每一个用户对于每一个电影的分类。数据格式如下: 
userId, movieId, tag, timestamp 
userId: 每个用户的id 
movieId: 每部电影的id 
tag: 用户对电影的标签化评价 
timestamp: 自1970年1月1日零点后到用户提交评价的时间的秒数 
数据排序的顺序按照userId,movieId排列的。

README.txt

下载链接:
官网地址: https://grouplens.org/datasets/movielens/ 
ml-latest-small(1MB): http://files.grouplens.org/datasets/movielens/ml-latest-small.zip 
ml-latest(234.2MB): http://files.grouplens.org/datasets/movielens/ml-latest.zip

读取方法

利用Python的csv模块进行读取操作。

import csv

with open(file_url, 'r') as f:
     data = csv.reader(f)
     for i in data:
         print(i)
--------------------- 
原文地址:https://blog.csdn.net/GZHermit/article/details/74231557 
 

你可能感兴趣的文章
AngularJS的五个超酷特性
查看>>
现在主流的免费手机号码归属地查询api接口
查看>>
Android 的动作、广播、种别等标识大全
查看>>
源码Action
查看>>
利用Action的常用Intent跳转
查看>>
Android Permission
查看>>
Notifaction安卓通知栏
查看>>
RingtoneManager铃声设置
查看>>
WifiManager设置
查看>>
PackageManager安装包管理
查看>>
Pixel,Bitmap,Drawable,Canvas,Paint,Matrix,BitmapDrawable,BitmapFactory图相关
查看>>
SQLLite常用代码
查看>>
Fragment
查看>>
android多线程,子线程与主线程的通信,下载的文件的显示
查看>>
王垠:对博士学位说永别
查看>>
王垠:人的价值
查看>>
android-Service
查看>>
Service通信(service介绍之二)
查看>>
Android学习计划
查看>>
自己测到的Buu IP
查看>>