Informations de base

Apache Hadoop est un framework open source qui prend en charge le stockage et le traitement distribué de grands ensembles de données à l'aide de clusters informatiques. Le stockage est géré par le système de fichiers distribué Hadoop (HDFS) et le traitement est effectué en utilisant MapReduce et d'autres applications (par exemple, Apache Storm, Flink et Spark) via YARN.

Figure 15-1. Architecture Hadoop 2.0

Vous pouvez interroger les services MapReduce et HDFS en utilisant les scripts Nmap répertoriés dans le tableau suivant (y compris les détails des ports par défaut). Au moment de la rédaction, Metasploit ne prend pas en charge Hadoop.

Nom du script	Port	Objectif
hadoop-jobtracker-info	50030	Récupérer des informations à partir des services de suivi de tâches et de travaux MapReduce
hadoop-tasktracker-info	50060
hadoop-namenode-info	50070	Récupérer des informations à partir du nœud de nom HDFS
hadoop-datanode-info	50075	Récupérer des informations à partir du nœud de données HDFS
hadoop-secondary-namenode-info	50090	Récupérer des informations à partir du nœud de nom secondaire HDFS

Des clients HDFS légers en Python et en Go sont disponibles en ligne. Hadoop s'exécute sans authentification par défaut. Vous pouvez configurer les services HDFS, YARN et MapReduce pour utiliser Kerberos.

1.8 KiB Raw Blame History

Informations de base

1.8 KiB

Raw Blame History