【论文阅读】MapReduce: Simplified Data Processing on Large Clusters
原博客链接:https://tanxinyu.work/mapreduce-thesis/ 相关背景在 20 世纪初,包括本文作者在内的 Google 的很多程序员,为了处理海量的原始数据,已经实现了数以百计的、专用的计算方法。这些计算方法用来处理大量的原始数据,比如,文档抓取(类似网络爬虫的程序)、Web 请求日志等等;也为了计算处理各种类型的衍生数据,比如倒排索引、Web 文档的图结构的各种表