ABI do RV32 e Tipos de Dados em C: Tamanhos, Alinhamento e Layout

Author: Marcos Azevedo

Date: 2026-01-20

Last Modified: 2026-01-25

Reading Time: 10 mins

Section: Series

TL;DR

Você vai aprender as regras do ABI RV32 ILP32 (Application Binary Interface) que fazem o C e o assembly “concordarem” sobre:
- uso de registradores,
- passagem de parâmetros,
- valores de retorno,
- alinhamento da pilha,
- e layout de dados.
Você vai medir e verificar tamanhos de tipos, padding de structs e endianness no RV32.
Você vai produzir pequenos experimentos que pode inspecionar tanto em C quanto em assembly.

O ABI é o contrato. Se você violá-lo (mesmo sem querer), surgem “bugs estranhos” que parecem corrupção de pilha, ponteiros ruins ou travamentos aleatórios.

1. RV32 em uma frase

RV32: registradores e endereços são 32-bit.
ABI mais comum em ensino: ILP32 (Integer/Long/Pointer são 32-bit).

Flags típicas do compilador

-march=rv32im (RV32I + multiply/divide)
-mabi=ilp32

2. Funções dos registradores (a parte que você precisa memorizar)

RISC-V tem 32 registradores inteiros: x0..x31.

x0: sempre zero
x1: ra (Return Address)
x2: sp (Stack Pointer)
x3: gp (Global Pointer)
x4: tp (Thread Pointer)
x5..x7: t0..t2 (Temporários)
x8: s0/fp (Saved / Frame Pointer)
x9: s1 (Saved)
x10..x17: a0..a7 (Argumentos / retornos)
x18..x27: s2..s11 (Saved)
x28..x31: t3..t6 (Temporários)

2.1. Quem preserva o quê? (A regra da “responsabilidade”)

Caller-saved (registradores temporários t*, argumentos a*): São como “rascunho”. Se você (o caller) tem algo importante neles e chama outra função, você precisa salvá-los primeiro. A função chamada pode sobrescrevê-los sem pedir licença.
Callee-saved (registradores salvos s*): São como “ferramentas emprestadas”. Se a função (o callee) quiser usá-los, ela deve devolvê-los exatamente como encontrou antes de retornar.
Valor de retorno: Por convenção, o resultado vai em a0 (e a1 se for 64-bit).

Tip

Quando você lê um disassembly, a primeira pergunta é sempre: “este registrador deveria sobreviver a uma chamada?”

3. Regras da pilha (a segunda parte que você precisa memorizar)

3.1. A pilha cresce para baixo

1
2
3
4
5
6
high addresses
   ...
   registradores salvos
   variáveis locais
sp → topo atual da pilha
low addresses

3.2. Alinhamento

O ABI exige que o ponteiro de pilha (sp) esteja alinhado a 16 bytes sempre que você chamar uma função.

Por que 16 bytes? Por que não só 4? Pense na pilha como um caminhão de entrega.

Eficiência: a CPU muitas vezes move dados em blocos de 128-bit (16 bytes) (para SIMD - Single Instruction, Multiple Data - operações vetoriais ou tipos long double). Se você estacionar o caminhão torto (desalinhado), a empilhadeira não consegue carregar o pallet de uma vez; ela precisa fazer duas cargas parciais.
Prevenção de travamento: algumas instruções crasham se o endereço não for múltiplo de 16.

“Nos limites de chamada” significa: Antes de saltar para uma nova função, você precisa garantir que sp seja múltiplo de 16. Se você empilhar 1 word (4 bytes), precisa adicionar 12 bytes de padding para que a próxima função comece alinhada em 16 bytes.

4. Tamanhos de tipos C no RV32 (ILP32)

Estes são os tamanhos típicos (confirme na sua toolchain):

Tipo C	Bytes típicos (RV32 ILP32)
`char`	1
`short`	2
`int`	4
`long`	4
`long long`	8
`void*`	4
`size_t`	4
`float`	4
`double`	8

Note

O padrão C não garante tamanhos exatos para muitos tipos (exceto mínimos). O ABI + convenção da plataforma determinam os tamanhos típicos.

5. Na prática: medir tamanhos e alinhamento

Crie:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
// src/types.c
#include "types.h"
#include "uart.h"

// Compute the byte offset of a member inside a struct type.
// This does not access memory; it just uses the member's address from a null base.
#define OFFSETOF(type, member) ((u32)(usize)&(((type *)0)->member))

static void show_type(const char *name, u32 size, u32 align) {
  // Print a "name size=... align=..." line for one type.
  uart_puts(name);
  uart_puts(" size=");
  uart_putdec(size);
  uart_puts(" align=");
  uart_putdec(align);
  uart_puts("\n");
}

// Convenience macro: stringize the type name and show its size and alignment.
#define SHOW(T) show_type(#T, (u32)sizeof(T), (u32)_Alignof(T))

struct A {
  // Likely introduces padding between fields due to alignment.
  u8  a;
  u32 b;
  u16 c;
};

struct B {
  // Same fields as A but reordered to reduce padding.
  u32 b;
  u16 c;
  u8  a;
};

int main(void) {
  // Show basic scalar sizes/alignments for this target/compiler.
  SHOW(char);
  SHOW(short);
  SHOW(int);
  SHOW(long);
  SHOW(long long);
  SHOW(void *);
  SHOW(float);
  SHOW(double);

  // Compare layout of two structs with the same fields in different orders.
  uart_puts("\nstruct A size=");
  uart_putdec((u32)sizeof(struct A));
  uart_puts(" off(a)=");
  uart_putdec(OFFSETOF(struct A, a));
  uart_puts(" off(b)=");
  uart_putdec(OFFSETOF(struct A, b));
  uart_puts(" off(c)=");
  uart_putdec(OFFSETOF(struct A, c));
  uart_puts("\n");

  uart_puts("\nstruct B size=");
  uart_putdec((u32)sizeof(struct B));
  uart_puts(" off(b)=");
  uart_putdec(OFFSETOF(struct B, b));
  uart_puts(" off(c)=");
  uart_putdec(OFFSETOF(struct B, c));
  uart_puts(" off(a)=");
  uart_putdec(OFFSETOF(struct B, a));
  uart_puts("\n");

  return 0;
}

Compile e rode no QEMU:

1
2
3
4
5
riscv64-unknown-elf-gcc -O0 -g -ffreestanding -nostdlib \
  -march=rv32im -mabi=ilp32 -T src/link.ld \
  src/start.s src/uart.c src/types.c -o build/types_rv32.elf

qemu-system-riscv32 -M virt -nographic -bios none -kernel build/types_rv32.elf

5.1. O que você deve observar

A tabela de size deve bater com as expectativas ILP32.
struct A geralmente tem padding entre a e b para que b fique alinhado em 4 bytes.
Reordenar campos (struct B) costuma reduzir padding.

5.2. Mergulho profundo: alinhamento de tipo vs. alinhamento da pilha

Você observou double align=8, mas o ABI exige que sp esteja alinhado em 16 bytes. Essa confusão é comum. Vamos separar o Conteúdo do Contêiner.

5.2.1. A regra do conteúdo (alinhamento de tipo)

Cada variável tem um “alinhamento natural”.

char (1 byte) pode morar em qualquer lugar (endereço divisível por 1).
int (4 bytes) precisa morar em um endereço divisível por 4 (0x1000, 0x1004…).
double (8 bytes) precisa morar em um endereço divisível por 8 (0x1000, 0x1008…).

Se você violar isso, a CPU gera uma exceção de acesso desalinhado (ou faz uma leitura em duas partes, mais lenta).

5.2.2. A regra do contêiner (alinhamento da pilha)

O stack frame é o contêiner para todas essas variáveis locais. Para ser um “contêiner universal”, a pilha precisa estar alinhada ao requisito mais estrito de qualquer variável que possa guardar.

Se a pilha estivesse alinhada só em 4 bytes, ela poderia começar em 0x1004.
Se você tentasse colocar um double (precisa de alinhamento 8) na pilha, poderia ser forçado a colocá-lo em 0x1004 relativo à memória 0, o que é ilegal para double.

A solução: O ABI do RISC-V força a pilha a estar alinhada em 16 bytes (divisível por 16). Como 16 é divisível por 1, 2, 4 e 8, um stack frame novo é garantido como ponto de partida seguro para qualquer tipo de dado padrão, incluindo vetores SIMD de 128-bit (float128 ou v128), sem ajustes complexos.

6. Padding em structs explicado (com diagrama)

6.1. Exemplo: struct A

1
2
3
4
5
struct A {
  uint8_t  a; // 1 byte
  uint32_t b; // precisa de alinhamento 4 bytes
  uint16_t c; // 2 bytes
};

Um layout comum em RV32:

Pense na memória como uma grade de palavras de 4 bytes (32-bit).

Offset	Byte 0	Byte 1	Byte 2	Byte 3	Conteúdo
+0	`a`	pad	pad	pad	`a` ocupa 1 byte. Pulamos 3 bytes para a próxima linha começar alinhada.
+4	`b`	`b`	`b`	`b`	`b` (4 bytes) encaixa perfeitamente em uma nova palavra.
+8	`c`	`c`	pad	pad	`c` (2 bytes) fica aqui. Preenchemos o final para alinhar o tamanho total da struct.

6.2. Exemplo complexo: misturando char, int, long, long long, double

Vamos ver uma struct usando todos os tipos que você perguntou, distinguindo long (32-bit) de long long (64-bit).

1
2
3
4
5
6
7
struct Mixed {
  char c;       // 1 byte
  int i;        // 4 bytes
  long l;       // 4 bytes (no RV32)
  long long ll; // 8 bytes (precisa de alinhamento 8)
  double d;     // 8 bytes (precisa de alinhamento 8)
};

Análise de layout:

c fica em +0.
i precisa de alinhamento 4. O próximo slot disponível é +1, então pulamos 3 bytes. i começa em +4.
l precisa de alinhamento 4. Ele encaixa perfeitamente em +8. Termina em +12.
ll precisa de alinhamento 8. +12 não é divisível por 8 (12 % 8 = 4). Precisamos de 4 bytes de padding. ll começa em +16.
d precisa de alinhamento 8. ll termina em +24. 24 é divisível por 8. d começa em +24 imediatamente.

Grade de memória:

Offset	Byte 0	Byte 1	Byte 2	Byte 3	Conteúdo
+0	`c`	pad	pad	pad	Alinhando para `i`
+4	`i`	`i`	`i`	`i`
+8	`l`	`l`	`l`	`l`	`long` tem 4 bytes no RV32
+12	pad	pad	pad	pad	Alinhando para `ll` (precisa ser % 8)
+16	`ll` (lo)	`ll`	`ll`	`ll`	`long long` (primeira metade)
+20	`ll` (hi)	`ll`	`ll`	`ll`	`long long` (segunda metade)
+24	`d` (lo)	`d`	`d`	`d`	`double` (primeira metade)
+28	`d` (hi)	`d`	`d`	`d`	`double` (segunda metade)

Tamanho total: 32 bytes.

Por que o padding existe:

Muitas CPUs carregam/armazenam de forma mais eficiente (ou só corretamente) quando alinhado.
O ABI escolhe regras que equilibram desempenho e compatibilidade.

Important

Padding não é “espaço desperdiçado sem motivo”. É um contrato de desempenho + correção entre compilador e hardware.

7. Endianness e o que isso significa para C

A maioria dos alvos RV32 é little-endian.

Se você armazenar 0x11223344 na memória, os bytes aparecem como:


address	+0	+1	+2	+3
bytes	44	33	22	11

7.1. Na prática: confirmar endianness

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
// src/endian.c
#include "types.h"
#include "uart.h"

static void puthex8(u8 v) {
  // Print one byte as two lowercase hex digits.
  const char *digits = "0123456789abcdef";
  uart_putc(digits[(v >> 4) & 0x0f]);
  uart_putc(digits[v & 0x0f]);
}

int main(void) {
  // Store a known 32-bit pattern and examine its byte order in memory.
  u32 x = 0x11223344u;
  u8 *p = (u8 *)&x;
  // Emit the four bytes to reveal endianness (LSB first on little-endian).
  puthex8(p[0]); uart_putc(' ');
  puthex8(p[1]); uart_putc(' ');
  puthex8(p[2]); uart_putc(' ');
  puthex8(p[3]); uart_putc('\n');
  return 0;
}

Compile/rode:

1
2
3
4
5
riscv64-unknown-elf-gcc -O0 -g -ffreestanding -nostdlib \
  -march=rv32im -mabi=ilp32 -T src/link.ld \
  src/start.s src/uart.c src/endian.c -o build/endian_rv32.elf

qemu-system-riscv32 -M virt -nographic -bios none -kernel build/endian_rv32.elf

8. ABI encontra o assembly: parâmetros e valores de retorno

Considere:

1
uint32_t add_u32(uint32_t a, uint32_t b) { return a + b; }

No nível do ABI:

a chega em a0
b chega em a1
valor de retorno volta em a0

No disassembly, você costuma ver:

cálculo em um registrador
garantir que o resultado termine em a0
retorno via jalr usando ra

9. Exercícios

Altere struct A adicionando um uint8_t d; no final. Preveja o novo tamanho antes de compilar.

Crie uma versão empacotada:

1
struct __attribute__((packed)) P { u8 a; u32 b; };

Compare sizeof(struct P) com a versão não empacotada.
Escreva uma função que retorne um u64. Observe quais registradores carregam o valor de retorno.

Warning

__attribute__((packed)) pode causar acessos desalinhados. Algumas CPUs lidam com isso lentamente; outras podem falhar. Use structs empacotadas só quando você controla todo acesso e precisa de um layout exato (ex.: formatos de rede).

9.1. Como testar suas respostas

Verifique tamanhos e offsets usando sizeof e o padrão do macro OFFSETOF.
Use objdump -d -M numeric,no-aliases para confirmar quais registradores são usados.

10. Resumo

Você aprendeu o “contrato” do ABI RV32 ILP32: funções dos registradores, regras da pilha e como tipos C mapeiam para bytes.

A seguir: C → assembly + otimizações - você vai ver como -O muda o que aparece no disassembly, e como volatile realmente afeta o código gerado.