# **Informação Básica**

O Apache Hadoop é um framework de código aberto que suporta o armazenamento e processamento distribuído de grandes conjuntos de dados usando clusters de computadores. O armazenamento é tratado pelo Hadoop Distributed File System (HDFS) e o processamento é realizado usando o MapReduce e outras aplicações (por exemplo, Apache Storm, Flink e Spark) via YARN.

![](<../.gitbook/assets/image (139).png>)

Figura 15-1. Arquitetura do Hadoop 2.0

Você pode consultar os serviços MapReduce e HDFS usando os scripts Nmap listados na tabela a seguir (incluindo detalhes das portas padrão). No momento da escrita, o Metasploit não suporta o Hadoop.

| **Nome do Script**              | **Porta** | **Propósito**                                                     |
| ------------------------------ | -------- | ----------------------------------------------------------------- |
| hadoop-jobtracker-info         | 50030    | Recuperar informações do serviço de rastreamento de tarefas e trabalhos MapReduce |
| hadoop-tasktracker-info        | 50060    |                                                                   |
| hadoop-namenode-info           | 50070    | Recuperar informações do nó de nome HDFS                          |
| hadoop-datanode-info           | 50075    | Recuperar informações do nó de dados HDFS                          |
| hadoop-secondary-namenode-info | 50090    | Recuperar informações do nó de nome secundário HDFS                |

Clientes HDFS leves em Python e Go estão disponíveis online. O Hadoop é executado sem autenticação por padrão. Você pode configurar os serviços HDFS, YARN e MapReduce para usar o Kerberos.