Cluster Hadoop 3.3.1

O objetivo deste repositório é a configuração de um cluster pseudo-distribuído utilizando o Apache Hadoop para simulação e testes de algoritmos utilizando o framework MapReduce.

A arquitetura inicial do cluster possui um nó master e dois worker nodes. Se novos worker nodes forem adicionados, eles devem ser registrados no arquivo de configuração master/config/hadoop/slaves.

Build and Run

make build
docker-compose up

Parâmetros de execução de um job

Os parâmetros para execução do job devem ser especificados no arquivo submit-params.env.

INPUT_DFS - caminho para o diretório ou arquivo de entrada no HDFS (default /datasets)
OUTPUT_DFS - caminho para o diretório de saída no HDFS (default /output)
PATH_TO_JAR - caminho para o arquivo .jar 
CLASSNAME - nome da classe principal
PATH_DATASET - caminho para o diretório ou arquivo de entrada na máquina host

Submissão do job

make submit

Acesso as interfaces gráficas

Antes de acessar as páginas é necessário configurar o DNS local para utilizar os domínios master-node e worker-node-*. Essa etapa pode ser ignorada, no entanto os domínios devem ser substituídos pelos ips correspondentes nos links abaixo.

Job History - http://master-node:19888/jobhistory/
Resource Manager - http://master-node:8088/
Namenode - http://master-node:9870/dfshealth.html
NodeManager - http://master-node:8042/node
DataNode - http://master-node:9864/datanode.html

Configuração do cluster

Os arquivos de configuração do cluster estão na pasta base/config/hadoop/.

core-site.xml [core default values]
hdfs-site.xml [hdfs default values]
mapred-site.xml [mr default values]
yarn-site.xml [yarn default values]
hadoop-env.sh

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
application		application
base		base
data		data
master		master
worker		worker
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md
docker-compose.yml		docker-compose.yml
open-webapp.sh		open-webapp.sh
submit-params.env		submit-params.env

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Cluster Hadoop 3.3.1

Build and Run

Parâmetros de execução de um job

Submissão do job

Acesso as interfaces gráficas

Configuração do cluster

About

Languages

rviniciussouza/docker-hadoop

Folders and files

Latest commit

History

Repository files navigation

Cluster Hadoop 3.3.1

Build and Run

Parâmetros de execução de um job

Submissão do job

Acesso as interfaces gráficas

Configuração do cluster

About

Topics

Resources

Stars

Watchers

Forks

Languages