Перевел с английского Е. Матвеев. — СПб.: Питер, 2013. — 672 с. —
(Бестселлеры O’Reilly). — ISBN 978-5-496-00662-0
Apache Hadoop — фреймворк с открытым исходным кодом, в котором
реализована вычислительная парадигма, известная как MapReduce,
позволившая Google построить свою империю.
Эта книга покажет вам, как использовать всю мощь Hadoop, чтобы создавать надежные, масштабируемые, распределенные системы и обрабатывать гигантские наборы данных. Программисты найдут здесь методики анализа, администраторы узнают, как установить и запустить кластеры Hadoop. Если вы работаете с большими массивами данных, гигабайтами или петабайтами информации, то Hadoop — это идеальное решение. «Hadoop: Подробное руководство» — книга, в которой досконально и доступно описаны все возможности Apache Hadoop. Издание охватывает последние изменения Hadoop, в том числе материалы по новой исполнительной среде MapReduce, называемой MapReduce 2, которая реализована на базе системы YARN (Yet Another Resource Negotiator) — общей системы управления ресурсами для распределенных приложений. Знакомство с Hadoop
MapReduce
HDFS
Ввод/вывод в Hadoop
Разработка приложений MapReduce
Как работает MapReduce
Типы и форматы MapReduce
Дополнительные возможности MapReduce
Создание кластера Hadoop
Администрирование Hadoop
Pig
Hive
HBase
ZooKeeper
Sqoop
Эта книга покажет вам, как использовать всю мощь Hadoop, чтобы создавать надежные, масштабируемые, распределенные системы и обрабатывать гигантские наборы данных. Программисты найдут здесь методики анализа, администраторы узнают, как установить и запустить кластеры Hadoop. Если вы работаете с большими массивами данных, гигабайтами или петабайтами информации, то Hadoop — это идеальное решение. «Hadoop: Подробное руководство» — книга, в которой досконально и доступно описаны все возможности Apache Hadoop. Издание охватывает последние изменения Hadoop, в том числе материалы по новой исполнительной среде MapReduce, называемой MapReduce 2, которая реализована на базе системы YARN (Yet Another Resource Negotiator) — общей системы управления ресурсами для распределенных приложений. Знакомство с Hadoop
MapReduce
HDFS
Ввод/вывод в Hadoop
Разработка приложений MapReduce
Как работает MapReduce
Типы и форматы MapReduce
Дополнительные возможности MapReduce
Создание кластера Hadoop
Администрирование Hadoop
Pig
Hive
HBase
ZooKeeper
Sqoop