Vitalik sobre o possível futuro do Ethereum (Parte Seis): The Splurge

Vitalik Buterin2025/10/29 17:26

Mostrar original

Por:Vitalik Buterin

No design do protocolo Ethereum, cerca de metade do conteúdo envolve diferentes tipos de melhorias do EVM, enquanto o restante é composto por vários temas de nicho, e é isso que representa a “prosperidade”.

No design do protocolo Ethereum, cerca de metade do conteúdo envolve diferentes tipos de melhorias na EVM, enquanto o restante é composto por vários temas de nicho, e é isso que significa "The Splurge" (A Prosperidade).

Título original: 《Possible futures of the Ethereum protocol, part 6: The Splurge》

Autor: Vitalik Buterin

Tradução: zhouzhou, BlockBeats

O conteúdo a seguir é do texto original (editado para facilitar a leitura e compreensão):

Algumas coisas são difíceis de categorizar em apenas uma classe; no design do protocolo Ethereum, há muitos "detalhes" que são extremamente importantes para o sucesso do Ethereum. Na prática, cerca de metade do conteúdo envolve diferentes tipos de melhorias na EVM, enquanto o restante é composto por vários temas de nicho, e é isso que significa "The Splurge" (A Prosperidade).

Roteiro de 2023: The Splurge

The Splurge: Objetivos-chave

Tornar a EVM de alto desempenho e estável como "estado final"
Introduzir abstração de contas no protocolo, permitindo que todos os usuários desfrutem de contas mais seguras e convenientes
Explorar criptografia avançada para melhorar significativamente o Ethereum a longo prazo

Melhorias na EVM

Que problema resolve?

Atualmente, a EVM é difícil de analisar estaticamente, o que dificulta a criação de implementações eficientes, a verificação formal do código e a expansão adicional. Além disso, a eficiência da EVM é baixa, tornando difícil implementar muitas formas de criptografia avançada, a menos que haja suporte explícito via pré-compilados.

O que é e como funciona?

O primeiro passo do roteiro atual de melhorias da EVM é o EVM Object Format (EOF), planejado para ser incluído no próximo hard fork. O EOF é uma série de EIPs que especificam uma nova versão do código da EVM, com várias características únicas, das quais as mais notáveis são:

Separação entre código (executável, mas não pode ser lido pela EVM) e dados (legíveis, mas não executáveis)
Proibição de saltos dinâmicos, permitindo apenas saltos estáticos
O código da EVM não pode mais observar informações relacionadas ao gás
Adição de um novo mecanismo explícito de sub-rotinas

Estrutura do código EOF

The Splurge: Melhorias na EVM (continuação)

Contratos antigos continuarão existindo e poderão ser criados, embora eventualmente possam ser descontinuados (ou até mesmo forçados a serem convertidos em código EOF). Contratos novos se beneficiarão do aumento de eficiência trazido pelo EOF — primeiro, por meio do recurso de sub-rotinas que reduz levemente o bytecode, e depois por novas funcionalidades específicas do EOF ou custos de gás reduzidos.

Após a introdução do EOF, futuras atualizações se tornam mais fáceis. Atualmente, a mais desenvolvida é a EVM Modular Arithmetic eXtension (EVM-MAX). O EVM-MAX cria um conjunto de operações voltadas para aritmética modular e as coloca em um novo espaço de memória inacessível por outros opcodes, permitindo otimizações como multiplicação de Montgomery.

Uma ideia mais recente é combinar EVM-MAX com Single Instruction Multiple Data (SIMD). O conceito de SIMD existe há muito tempo no Ethereum, proposto inicialmente por Greg Colvin no EIP-616. SIMD pode ser usado para acelerar várias formas de criptografia, incluindo funções hash, STARKs de 32 bits e criptografia baseada em reticulados. A combinação de EVM-MAX e SIMD faz dessas duas extensões orientadas à performance um par natural.

Um design aproximado de EIP combinado começaria com o EIP-6690 e, então:

Permitir (i) qualquer número ímpar ou (ii) qualquer potência de 2 até 2768 como módulo
Para cada opcode EVM-MAX (adição, subtração, multiplicação), adicionar uma versão que não usa mais 3 números imediatos x, y, z, mas sim 7: x_start, x_skip, y_start, y_skip, z_start, z_skip, count. Em Python, esses opcodes funcionariam assim:

for i in range(count):

mem[z_start + z_skip * count] = op(

mem[x_start + x_skip * count],

mem[y_start + y_skip * count]

)

Na implementação real, isso seria processado em paralelo.

Pode-se adicionar XOR, AND, OR, NOT e SHIFT (incluindo circular e não circular), pelo menos para módulos potência de 2. Também adicionar ISZERO (que empurra a saída para a pilha principal da EVM), o que é suficientemente poderoso para implementar criptografia de curva elíptica, criptografia de campo pequeno (como Poseidon, Circle STARKs), funções hash tradicionais (como SHA256, KECCAK, BLAKE) e criptografia baseada em reticulados. Outras atualizações da EVM também podem ser implementadas, mas até agora receberam menos atenção.

Links de pesquisas existentes

EOF:
EVM-MAX:
SIMD:

Trabalho restante e trade-offs

Atualmente, o EOF está planejado para ser incluído no próximo hard fork. Embora sempre haja a possibilidade de ser removido no último minuto — funções já foram removidas temporariamente em hard forks anteriores — isso seria um grande desafio. Remover o EOF significaria que futuras atualizações da EVM teriam que ser feitas sem o EOF, o que é possível, mas provavelmente mais difícil.

O principal trade-off da EVM é a complexidade do L1 versus a complexidade da infraestrutura. O EOF é uma grande quantidade de código a ser adicionada à implementação da EVM, e a verificação estática do código também é relativamente complexa. No entanto, em troca, podemos simplificar linguagens de alto nível, simplificar a implementação da EVM e obter outros benefícios. Pode-se argumentar que um roteiro que priorize melhorias contínuas no L1 do Ethereum deve incluir e se basear no EOF.

Um trabalho importante a ser feito é implementar recursos semelhantes ao EVM-MAX + SIMD e fazer benchmarks do consumo de gás para várias operações criptográficas.

Como interage com outras partes do roteiro?

O L1 ajustando sua EVM facilita que o L2 também faça ajustes correspondentes; se ambos não se ajustarem em sincronia, pode haver incompatibilidades e impactos negativos. Além disso, EVM-MAX e SIMD podem reduzir o custo de gás de muitos sistemas de prova, tornando o L2 mais eficiente. Também facilita substituir mais pré-compilados por código EVM capaz de executar as mesmas tarefas, sem grande impacto na eficiência.

Abstração de contas

Que problema resolve?

Atualmente, as transações só podem ser validadas de uma maneira: assinatura ECDSA. Inicialmente, a abstração de contas visava ir além disso, permitindo que a lógica de validação da conta fosse qualquer código EVM. Isso pode habilitar uma série de aplicações:

Migração para criptografia resistente a quânticos
Rotação de chaves antigas (amplamente considerada uma prática recomendada de segurança)
Carteiras multiassinatura e carteiras de recuperação social
Usar uma chave para operações de baixo valor e outra (ou um conjunto de chaves) para operações de alto valor

Permitir que protocolos de privacidade funcionem sem relays, reduzindo significativamente sua complexidade e eliminando um ponto central de dependência

Desde que a abstração de contas foi proposta em 2015, seus objetivos também se expandiram para incluir muitos "objetivos de conveniência", como permitir que uma conta sem ETH, mas com algum ERC20, pague o gás com ERC20. Veja abaixo um gráfico resumindo esses objetivos:

MPC (Computação Multi-Party) é uma tecnologia existente há 40 anos, usada para dividir uma chave em várias partes e armazená-las em vários dispositivos, usando técnicas criptográficas para gerar assinaturas sem combinar diretamente essas partes da chave.

EIP-7702 é uma proposta planejada para ser introduzida no próximo hard fork. O EIP-7702 é resultado do reconhecimento crescente da necessidade de fornecer conveniência de abstração de contas para todos os usuários (incluindo usuários EOA), visando melhorar a experiência de todos no curto prazo e evitar a divisão em dois ecossistemas.

Esse trabalho começou com o EIP-3074 e, finalmente, resultou no EIP-7702. O EIP-7702 fornece as "funções de conveniência" da abstração de contas para todos os usuários, incluindo os EOAs de hoje (contas controladas por assinatura ECDSA).

Como pode ser visto no gráfico, embora alguns desafios (especialmente os de "conveniência") possam ser resolvidos por tecnologias progressivas como MPC ou EIP-7702, os principais objetivos de segurança que motivaram a proposta original de abstração de contas só podem ser alcançados voltando e resolvendo o problema original: permitir que código de contrato inteligente controle a validação de transações. Até agora, isso não foi realizado devido ao desafio de implementá-lo com segurança.

O que é e como funciona?

O núcleo da abstração de contas é simples: permitir que contratos inteligentes iniciem transações, não apenas EOAs. Toda a complexidade vem de implementar isso de uma forma amigável à manutenção de uma rede descentralizada e resistente a ataques de negação de serviço.

Um desafio típico é o problema de múltiplas invalidações:

Se 1000 contas tiverem funções de validação que dependem de um único valor S, e o valor atual de S faz com que as transações no mempool sejam válidas, então uma única transação que altera S pode invalidar todas as outras transações no mempool. Isso permite que um atacante envie transações lixo ao mempool a baixo custo, congestionando os recursos dos nós da rede.

Após anos de trabalho para expandir funcionalidades enquanto limita o risco de DoS, chegou-se à solução para implementar a "abstração de contas ideal": ERC-4337.

O ERC-4337 funciona dividindo o processamento das operações do usuário em duas fases: verificação e execução. Todas as verificações são processadas primeiro, seguidas de todas as execuções. No mempool, apenas operações de usuário cuja fase de verificação envolva apenas sua própria conta e não leia variáveis de ambiente são aceitas. Isso previne ataques de múltiplas invalidações. Além disso, limites rígidos de gás são impostos à etapa de verificação.

O ERC-4337 foi projetado como um padrão de protocolo adicional (ERC), pois, na época, os desenvolvedores do cliente Ethereum estavam focados no Merge e não tinham recursos para outras funcionalidades. Por isso, o ERC-4337 usa objetos chamados operações de usuário, em vez de transações regulares. No entanto, recentemente percebemos a necessidade de incorporar pelo menos parte disso ao protocolo.

Dois motivos principais são:

EntryPoint como contrato é inerentemente ineficiente: cada bundle tem uma sobrecarga fixa de cerca de 100.000 gás, além de milhares de gás extras por operação de usuário.
Necessidade de garantir propriedades do Ethereum: como as garantias de inclusão criadas pela inclusion list precisam ser transferidas para usuários de abstração de contas.

Além disso, o ERC-4337 expande dois recursos:

Paymasters: permite que uma conta pague taxas em nome de outra, o que viola a regra de que a verificação só pode acessar a conta do remetente, então um tratamento especial é necessário para garantir a segurança do mecanismo.
Aggregators: suporte à agregação de assinaturas, como agregação BLS ou baseada em SNARK. Isso é necessário para máxima eficiência de dados em Rollups.