# **Informação Básica** O Apache Hadoop é um framework de código aberto que suporta o armazenamento e processamento distribuído de grandes conjuntos de dados usando clusters de computadores. O armazenamento é tratado pelo Hadoop Distributed File System (HDFS) e o processamento é realizado usando o MapReduce e outras aplicações (por exemplo, Apache Storm, Flink e Spark) via YARN. ![](<../.gitbook/assets/image (139).png>) Figura 15-1. Arquitetura do Hadoop 2.0 Você pode consultar os serviços MapReduce e HDFS usando os scripts Nmap listados na tabela a seguir (incluindo detalhes das portas padrão). No momento da escrita, o Metasploit não suporta o Hadoop. | **Nome do Script** | **Porta** | **Propósito** | | ------------------------------ | -------- | ----------------------------------------------------------------- | | hadoop-jobtracker-info | 50030 | Recuperar informações do serviço de rastreamento de tarefas e trabalhos MapReduce | | hadoop-tasktracker-info | 50060 | | | hadoop-namenode-info | 50070 | Recuperar informações do nó de nome HDFS | | hadoop-datanode-info | 50075 | Recuperar informações do nó de dados HDFS | | hadoop-secondary-namenode-info | 50090 | Recuperar informações do nó de nome secundário HDFS | Clientes HDFS leves em Python e Go estão disponíveis online. O Hadoop é executado sem autenticação por padrão. Você pode configurar os serviços HDFS, YARN e MapReduce para usar o Kerberos.