GPT-5.1: O Melhor Modelo Para Código e Benchmark em 2026? Testes Reais com Daytona e T3Chat