1.7 KiB
Informação Básica
O Apache Hadoop é um framework de código aberto que suporta o armazenamento e processamento distribuído de grandes conjuntos de dados usando clusters de computadores. O armazenamento é tratado pelo Hadoop Distributed File System (HDFS) e o processamento é realizado usando o MapReduce e outras aplicações (por exemplo, Apache Storm, Flink e Spark) via YARN.
Figura 15-1. Arquitetura do Hadoop 2.0
Você pode consultar os serviços MapReduce e HDFS usando os scripts Nmap listados na tabela a seguir (incluindo detalhes das portas padrão). No momento da escrita, o Metasploit não suporta o Hadoop.
Nome do Script | Porta | Propósito |
---|---|---|
hadoop-jobtracker-info | 50030 | Recuperar informações do serviço de rastreamento de tarefas e trabalhos MapReduce |
hadoop-tasktracker-info | 50060 | |
hadoop-namenode-info | 50070 | Recuperar informações do nó de nome HDFS |
hadoop-datanode-info | 50075 | Recuperar informações do nó de dados HDFS |
hadoop-secondary-namenode-info | 50090 | Recuperar informações do nó de nome secundário HDFS |
Clientes HDFS leves em Python e Go estão disponíveis online. O Hadoop é executado sem autenticação por padrão. Você pode configurar os serviços HDFS, YARN e MapReduce para usar o Kerberos.