标签:top-k

Scala实战:求解 Top K 问题

问题描述服务器上有一个 movies.csv 文件,里面保存了每部电影的评分(为了简化和专注问题,CSV文件每一行只有两个字段:movieId和rating)。文件通过HTTP服务器发布。要求从文件内找出排名最高的10部电影。 解法1:全量排序求Top 10通过 wget、curl 等工具先将文件下载到本地,再读出文件内所有行并解析出 movieId和rating 字段,按 rating 字段排序