23 KiB
macOS Universal binaries & Mach-O Format
{% hint style="success" %}
Learn & practice AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE)
Learn & practice GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)
Support HackTricks
- Check the subscription plans!
- Join the 💬 Discord group or the telegram group or follow us on Twitter 🐦 @hacktricks_live.
- Share hacking tricks by submitting PRs to the HackTricks and HackTricks Cloud github repos.
Basic Information
Os binários do Mac OS geralmente são compilados como binários universais. Um binário universal pode suportar múltiplas arquiteturas no mesmo arquivo.
Esses binários seguem a estrutura Mach-O, que é basicamente composta por:
- Cabeçalho
- Comandos de Carregamento
- Dados
Fat Header
Procure pelo arquivo com: mdfind fat.h | grep -i mach-o | grep -E "fat.h$"
#define FAT_MAGIC 0xcafebabe
#define FAT_CIGAM 0xbebafeca /* NXSwapLong(FAT_MAGIC) */
struct fat_header {
uint32_t magic; /* FAT_MAGIC ou FAT_MAGIC_64 */
uint32_t nfat_arch; /* número de structs que seguem */
};
struct fat_arch {
cpu_type_t cputype; /* especificador de cpu (int) */
cpu_subtype_t cpusubtype; /* especificador de máquina (int) */
uint32_t offset; /* deslocamento do arquivo para este arquivo objeto */
uint32_t size; /* tamanho deste arquivo objeto */
uint32_t align; /* alinhamento como uma potência de 2 */
};
O cabeçalho tem os bytes mágicos seguidos pelo número de arquiteturas que o arquivo contém (nfat_arch
) e cada arquitetura terá uma struct fat_arch
.
Verifique com:
% file /bin/ls
/bin/ls: Mach-O universal binary with 2 architectures: [x86_64:Mach-O 64-bit executable x86_64] [arm64e:Mach-O 64-bit executable arm64e]
/bin/ls (para arquitetura x86_64): Mach-O 64-bit executable x86_64
/bin/ls (para arquitetura arm64e): Mach-O 64-bit executable arm64e
% otool -f -v /bin/ls
Fat headers
fat_magic FAT_MAGIC
nfat_arch 2
arquitetura x86_64
cputype CPU_TYPE_X86_64
cpusubtype CPU_SUBTYPE_X86_64_ALL
capabilities 0x0
offset 16384
size 72896
align 2^14 (16384)
arquitetura arm64e
cputype CPU_TYPE_ARM64
cpusubtype CPU_SUBTYPE_ARM64E
capabilities PTR_AUTH_VERSION USERSPACE 0
offset 98304
size 88816
align 2^14 (16384)
ou usando a ferramenta Mach-O View:
Como você pode estar pensando, geralmente um binário universal compilado para 2 arquiteturas dobra o tamanho de um compilado para apenas 1 arquitetura.
Mach-O Header
O cabeçalho contém informações básicas sobre o arquivo, como bytes mágicos para identificá-lo como um arquivo Mach-O e informações sobre a arquitetura alvo. Você pode encontrá-lo em: mdfind loader.h | grep -i mach-o | grep -E "loader.h$"
#define MH_MAGIC 0xfeedface /* the mach magic number */
#define MH_CIGAM 0xcefaedfe /* NXSwapInt(MH_MAGIC) */
struct mach_header {
uint32_t magic; /* mach magic number identifier */
cpu_type_t cputype; /* cpu specifier (e.g. I386) */
cpu_subtype_t cpusubtype; /* machine specifier */
uint32_t filetype; /* type of file (usage and alignment for the file) */
uint32_t ncmds; /* number of load commands */
uint32_t sizeofcmds; /* the size of all the load commands */
uint32_t flags; /* flags */
};
#define MH_MAGIC_64 0xfeedfacf /* the 64-bit mach magic number */
#define MH_CIGAM_64 0xcffaedfe /* NXSwapInt(MH_MAGIC_64) */
struct mach_header_64 {
uint32_t magic; /* mach magic number identifier */
int32_t cputype; /* cpu specifier */
int32_t cpusubtype; /* machine specifier */
uint32_t filetype; /* type of file */
uint32_t ncmds; /* number of load commands */
uint32_t sizeofcmds; /* the size of all the load commands */
uint32_t flags; /* flags */
uint32_t reserved; /* reserved */
};
Tipos de Arquivos Mach-O
Existem diferentes tipos de arquivos, que podem ser encontrados definidos no código-fonte, por exemplo aqui. Os mais importantes são:
MH_OBJECT
: Arquivo objeto relocável (produtos intermediários da compilação, ainda não executáveis).MH_EXECUTE
: Arquivos executáveis.MH_FVMLIB
: Arquivo de biblioteca VM fixa.MH_CORE
: Dumps de código.MH_PRELOAD
: Arquivo executável pré-carregado (não mais suportado no XNU).MH_DYLIB
: Bibliotecas dinâmicas.MH_DYLINKER
: Linker dinâmico.MH_BUNDLE
: "Arquivos de plugin". Gerados usando -bundle no gcc e carregados explicitamente porNSBundle
oudlopen
.MH_DYSM
: Arquivo companheiro.dSym
(arquivo com símbolos para depuração).MH_KEXT_BUNDLE
: Extensões do Kernel.
# Checking the mac header of a binary
otool -arch arm64e -hv /bin/ls
Mach header
magic cputype cpusubtype caps filetype ncmds sizeofcmds flags
MH_MAGIC_64 ARM64 E USR00 EXECUTE 19 1728 NOUNDEFS DYLDLINK TWOLEVEL PIE
Ou usando Mach-O View:
Flags Mach-O
O código-fonte também define várias flags úteis para carregar bibliotecas:
MH_NOUNDEFS
: Sem referências indefinidas (totalmente vinculado)MH_DYLDLINK
: Vinculação DyldMH_PREBOUND
: Referências dinâmicas pré-vinculadas.MH_SPLIT_SEGS
: Arquivo divide segmentos r/o e r/w.MH_WEAK_DEFINES
: O binário tem símbolos definidos fracosMH_BINDS_TO_WEAK
: O binário usa símbolos fracosMH_ALLOW_STACK_EXECUTION
: Torna a pilha executávelMH_NO_REEXPORTED_DYLIBS
: Biblioteca não possui comandos LC_REEXPORTMH_PIE
: Executável Independente de PosiçãoMH_HAS_TLV_DESCRIPTORS
: Há uma seção com variáveis locais de threadMH_NO_HEAP_EXECUTION
: Sem execução para páginas de heap/dadosMH_HAS_OBJC
: O binário tem seções oBject-CMH_SIM_SUPPORT
: Suporte a simuladorMH_DYLIB_IN_CACHE
: Usado em dylibs/frameworks no cache de biblioteca compartilhada.
Comandos de carregamento Mach-O
O layout do arquivo na memória é especificado aqui, detalhando a localização da tabela de símbolos, o contexto da thread principal no início da execução e as bibliotecas compartilhadas necessárias. Instruções são fornecidas ao carregador dinâmico (dyld) sobre o processo de carregamento do binário na memória.
O utiliza a estrutura load_command, definida no mencionado loader.h
:
struct load_command {
uint32_t cmd; /* type of load command */
uint32_t cmdsize; /* total size of command in bytes */
};
Existem cerca de 50 tipos diferentes de comandos de carregamento que o sistema trata de maneira diferente. Os mais comuns são: LC_SEGMENT_64
, LC_LOAD_DYLINKER
, LC_MAIN
, LC_LOAD_DYLIB
e LC_CODE_SIGNATURE
.
LC_SEGMENT/LC_SEGMENT_64
{% hint style="success" %} Basicamente, este tipo de Comando de Carregamento define como carregar o __TEXT (código executável) e __DATA (dados para o processo) segmentos de acordo com os offsets indicados na seção de Dados quando o binário é executado. {% endhint %}
Esses comandos definem segmentos que são mapeados no espaço de memória virtual de um processo quando ele é executado.
Existem diferentes tipos de segmentos, como o __TEXT segmento, que contém o código executável de um programa, e o __DATA segmento, que contém dados usados pelo processo. Esses segmentos estão localizados na seção de dados do arquivo Mach-O.
Cada segmento pode ser ainda dividido em múltiplas seções. A estrutura do comando de carregamento contém informações sobre essas seções dentro do respectivo segmento.
No cabeçalho, primeiro você encontra o cabeçalho do segmento:
struct segment_command_64 { /* para arquiteturas de 64 bits */
uint32_t cmd; /* LC_SEGMENT_64 */
uint32_t cmdsize; /* inclui sizeof section_64 structs */
char segname[16]; /* nome do segmento */
uint64_t vmaddr; /* endereço de memória deste segmento */
uint64_t vmsize; /* tamanho da memória deste segmento */
uint64_t fileoff; /* deslocamento do arquivo deste segmento */
uint64_t filesize; /* quantidade a mapear do arquivo */
int32_t maxprot; /* proteção máxima da VM */
int32_t initprot; /* proteção inicial da VM */
uint32_t nsects; /* número de seções no segmento */
uint32_t flags; /* flags */
};
Exemplo de cabeçalho de segmento:
Este cabeçalho define o número de seções cujos cabeçalhos aparecem depois dele:
struct section_64 { /* for 64-bit architectures */
char sectname[16]; /* name of this section */
char segname[16]; /* segment this section goes in */
uint64_t addr; /* memory address of this section */
uint64_t size; /* size in bytes of this section */
uint32_t offset; /* file offset of this section */
uint32_t align; /* section alignment (power of 2) */
uint32_t reloff; /* file offset of relocation entries */
uint32_t nreloc; /* number of relocation entries */
uint32_t flags; /* flags (section type and attributes)*/
uint32_t reserved1; /* reserved (for offset or index) */
uint32_t reserved2; /* reserved (for count or sizeof) */
uint32_t reserved3; /* reserved */
};
Exemplo de cabeçalho de seção:
Se você adicionar o offset da seção (0x37DC) + o offset onde a arquitetura começa, neste caso 0x18000
--> 0x37DC + 0x18000 = 0x1B7DC
Também é possível obter informações de cabeçalhos a partir da linha de comando com:
otool -lv /bin/ls
Comuns segmentos carregados por este cmd:
__PAGEZERO
: Instruções para o kernel mapear o endereço zero para que não possa ser lido, escrito ou executado. As variáveis maxprot e minprot na estrutura são definidas como zero para indicar que não há direitos de leitura-gravação-execução nesta página.- Esta alocação é importante para mitigar vulnerabilidades de desreferência de ponteiro NULL. Isso ocorre porque o XNU impõe uma página zero rígida que garante que a primeira página (apenas a primeira) da memória seja inacessível (exceto em i386). Um binário poderia atender a esses requisitos criando um pequeno __PAGEZERO (usando o
-pagezero_size
) para cobrir os primeiros 4k e tendo o restante da memória de 32 bits acessível tanto em modo de usuário quanto em modo kernel. __TEXT
: Contém código executável com permissões de leitura e execução (sem permissões de escrita). Seções comuns deste segmento:__text
: Código binário compilado__const
: Dados constantes (somente leitura)__[c/u/os_log]string
: Constantes de string C, Unicode ou logs do os__stubs
e__stubs_helper
: Envolvidos durante o processo de carregamento da biblioteca dinâmica__unwind_info
: Dados de desempilhamento.- Note que todo esse conteúdo é assinado, mas também marcado como executável (criando mais opções para exploração de seções que não necessariamente precisam desse privilégio, como seções dedicadas a strings).
__DATA
: Contém dados que são legíveis e graváveis (sem executável).__got:
Tabela de Deslocamento Global__nl_symbol_ptr
: Ponteiro de símbolo não preguiçoso (vinculado no carregamento)__la_symbol_ptr
: Ponteiro de símbolo preguiçoso (vinculado no uso)__const
: Deveria ser dados somente leitura (não é realmente)__cfstring
: Strings do CoreFoundation__data
: Variáveis globais (que foram inicializadas)__bss
: Variáveis estáticas (que não foram inicializadas)__objc_*
(__objc_classlist, __objc_protolist, etc): Informações usadas pelo runtime do Objective-C__DATA_CONST
: __DATA.__const não é garantido que seja constante (permissões de escrita), nem outros ponteiros e a GOT. Esta seção torna__const
, alguns inicializadores e a tabela GOT (uma vez resolvida) somente leitura usandomprotect
.__LINKEDIT
: Contém informações para o linker (dyld), como entradas de tabela de símbolos, strings e relocação. É um contêiner genérico para conteúdos que não estão em__TEXT
ou__DATA
e seu conteúdo é descrito em outros comandos de carregamento.- Informações do dyld: Rebase, opcodes de vinculação não preguiçosa/preguiçosa/fraca e informações de exportação
- Inícios de funções: Tabela de endereços de início de funções
- Dados em Código: Ilhas de dados em __text
- Tabela de Símbolos: Símbolos no binário
- Tabela de Símbolos Indiretos: Símbolos de ponteiro/stub
- Tabela de Strings
- Assinatura de Código
__OBJC
: Contém informações usadas pelo runtime do Objective-C. Embora essas informações também possam ser encontradas no segmento __DATA, dentro de várias seções em __objc_*.__RESTRICT
: Um segmento sem conteúdo com uma única seção chamada__restrict
(também vazia) que garante que, ao executar o binário, ele ignorará variáveis ambientais DYLD.
Como foi possível ver no código, os segmentos também suportam flags (embora não sejam muito utilizados):
SG_HIGHVM
: Apenas núcleo (não utilizado)SG_FVMLIB
: Não utilizadoSG_NORELOC
: O segmento não tem relocaçãoSG_PROTECTED_VERSION_1
: Criptografia. Usado, por exemplo, pelo Finder para criptografar o segmento__TEXT
.
LC_UNIXTHREAD/LC_MAIN
LC_MAIN
contém o ponto de entrada no atributo entryoff. No momento do carregamento, dyld simplesmente adiciona esse valor à (em memória) base do binário, então salta para essa instrução para iniciar a execução do código do binário.
LC_UNIXTHREAD
contém os valores que o registrador deve ter ao iniciar a thread principal. Isso já foi descontinuado, mas dyld
ainda o utiliza. É possível ver os valores dos registradores definidos por isso com:
otool -l /usr/lib/dyld
[...]
Load command 13
cmd LC_UNIXTHREAD
cmdsize 288
flavor ARM_THREAD_STATE64
count ARM_THREAD_STATE64_COUNT
x0 0x0000000000000000 x1 0x0000000000000000 x2 0x0000000000000000
x3 0x0000000000000000 x4 0x0000000000000000 x5 0x0000000000000000
x6 0x0000000000000000 x7 0x0000000000000000 x8 0x0000000000000000
x9 0x0000000000000000 x10 0x0000000000000000 x11 0x0000000000000000
x12 0x0000000000000000 x13 0x0000000000000000 x14 0x0000000000000000
x15 0x0000000000000000 x16 0x0000000000000000 x17 0x0000000000000000
x18 0x0000000000000000 x19 0x0000000000000000 x20 0x0000000000000000
x21 0x0000000000000000 x22 0x0000000000000000 x23 0x0000000000000000
x24 0x0000000000000000 x25 0x0000000000000000 x26 0x0000000000000000
x27 0x0000000000000000 x28 0x0000000000000000 fp 0x0000000000000000
lr 0x0000000000000000 sp 0x0000000000000000 pc 0x0000000000004b70
cpsr 0x00000000
[...]
LC_CODE_SIGNATURE
Contém informações sobre a assinatura de código do arquivo Macho-O. Ele contém apenas um offset que aponta para o blob de assinatura. Isso geralmente está no final do arquivo.
No entanto, você pode encontrar algumas informações sobre esta seção em este post de blog e neste gists.
LC_ENCRYPTION_INFO[_64]
Suporte para criptografia binária. No entanto, é claro que, se um atacante conseguir comprometer o processo, ele poderá despejar a memória sem criptografia.
LC_LOAD_DYLINKER
Contém o caminho para o executável do linker dinâmico que mapeia bibliotecas compartilhadas no espaço de endereço do processo. O valor é sempre definido como /usr/lib/dyld
. É importante notar que no macOS, o mapeamento de dylib acontece em modo de usuário, não em modo de kernel.
LC_IDENT
Obsoleto, mas quando configurado para gerar dumps em caso de pânico, um core dump Mach-O é criado e a versão do kernel é definida no comando LC_IDENT
.
LC_UUID
UUID aleatório. É útil para qualquer coisa diretamente, mas o XNU o armazena em cache com o resto das informações do processo. Pode ser usado em relatórios de falhas.
LC_DYLD_ENVIRONMENT
Permite indicar variáveis de ambiente para o dyld antes que o processo seja executado. Isso pode ser muito perigoso, pois pode permitir a execução de código arbitrário dentro do processo, então este comando de carga é usado apenas em builds do dyld com #define SUPPORT_LC_DYLD_ENVIRONMENT
e restringe ainda mais o processamento apenas para variáveis da forma DYLD_..._PATH
especificando caminhos de carga.
LC_LOAD_DYLIB
Este comando de carga descreve uma dependência de biblioteca dinâmica que instrui o loader (dyld) a carregar e vincular a referida biblioteca. Há um comando de carga LC_LOAD_DYLIB
para cada biblioteca que o binário Mach-O requer.
- Este comando de carga é uma estrutura do tipo
dylib_command
(que contém uma struct dylib, descrevendo a biblioteca dinâmica dependente real):
struct dylib_command {
uint32_t cmd; /* LC_LOAD_{,WEAK_}DYLIB */
uint32_t cmdsize; /* includes pathname string */
struct dylib dylib; /* the library identification */
};
struct dylib {
union lc_str name; /* library's path name */
uint32_t timestamp; /* library's build time stamp */
uint32_t current_version; /* library's current version number */
uint32_t compatibility_version; /* library's compatibility vers number*/
};
Você também pode obter essas informações pelo cli com:
otool -L /bin/ls
/bin/ls:
/usr/lib/libutil.dylib (compatibility version 1.0.0, current version 1.0.0)
/usr/lib/libncurses.5.4.dylib (compatibility version 5.4.0, current version 5.4.0)
/usr/lib/libSystem.B.dylib (compatibility version 1.0.0, current version 1319.0.0)
Algumas bibliotecas relacionadas a malware potenciais são:
- DiskArbitration: Monitoramento de drives USB
- AVFoundation: Captura de áudio e vídeo
- CoreWLAN: Scans de Wifi.
{% hint style="info" %}
Um binário Mach-O pode conter um ou mais construtores, que serão executados antes do endereço especificado em LC_MAIN.
Os offsets de quaisquer construtores são mantidos na seção __mod_init_func do segmento __DATA_CONST.
{% endhint %}
Dados Mach-O
No núcleo do arquivo está a região de dados, que é composta por vários segmentos conforme definido na região de comandos de carregamento. Uma variedade de seções de dados pode ser hospedada dentro de cada segmento, com cada seção contendo código ou dados específicos a um tipo.
{% hint style="success" %} Os dados são basicamente a parte que contém todas as informações que são carregadas pelos comandos de carregamento LC_SEGMENTS_64 {% endhint %}
Isso inclui:
- Tabela de funções: Que contém informações sobre as funções do programa.
- Tabela de símbolos: Que contém informações sobre a função externa usada pelo binário
- Também pode conter nomes de funções internas, variáveis e mais.
Para verificar, você pode usar a ferramenta Mach-O View:
Ou a partir da linha de comando:
size -m /bin/ls
Seções Comuns do Objetive-C
No segmento __TEXT
(r-x):
__objc_classname
: Nomes das classes (strings)__objc_methname
: Nomes dos métodos (strings)__objc_methtype
: Tipos de métodos (strings)
No segmento __DATA
(rw-):
__objc_classlist
: Ponteiros para todas as classes Objetive-C__objc_nlclslist
: Ponteiros para classes Objetive-C Não-Lazy__objc_catlist
: Ponteiro para Categorias__objc_nlcatlist
: Ponteiro para Categorias Não-Lazy__objc_protolist
: Lista de Protocolos__objc_const
: Dados constantes__objc_imageinfo
,__objc_selrefs
,objc__protorefs
...
Swift
_swift_typeref
,_swift3_capture
,_swift3_assocty
,_swift3_types, _swift3_proto
,_swift3_fieldmd
,_swift3_builtin
,_swift3_reflstr
{% hint style="success" %}
Learn & practice AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE)
Learn & practice GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)
Support HackTricks
- Check the subscription plans!
- Join the 💬 Discord group or the telegram group or follow us on Twitter 🐦 @hacktricks_live.
- Share hacking tricks by submitting PRs to the HackTricks and HackTricks Cloud github repos.