借助Hadoop程序员可以轻松的编写分布式并行程序,并将其运行在计算机集群上,完成海量数据的存储于处理分析。
Hadoop是Apache(阿帕奇)软件基金会旗下的开源分布式计算平台
Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)和
MapReduce
MapReduce是针对谷歌MapReduce(论文)的开源实现
允许用户在不了解分布式系统底层细节的情况下开发并行应用程序,保证分析和处理数据的高效性
HDFS是针对谷歌文件系统GFS(论文)的开源实现
Hadoop是一个开源的,可运行于大规模集群上的分布式计算平台,它实现了MapReduce计算模型和分布式文件系统HDFS等功能。