Logística

June 1, 2026

Redução de 45% no esforço de migração de SSIS para Databricks com IA

Uma das maiores empresas de logística ferroviária do Brasil solicitou o nosso apoio para migrar toda a sua infraestrutura de integração de dados do SQL SSIS para Databricks em larga escala

Grandes projetos de modernização de dados têm falhado por conta da execução. Quando o volume de legado é muito grande, os prazos apertam e as estimativas de esforço assustam, até mesmo as iniciativas mais bem planejadas perdem tração.

Ao se deparar com essa situação, uma das maiores empresas de logística ferroviária do Brasil solicitou o nosso apoio. A organização havia tomado a decisão de migrar toda a sua infraestrutura de integração de dados do SQL Server Integration Services (SSIS) para o Databricks, consolidando sua plataforma de dados em um ambiente mais escalável e governado. O problema era o volume de trabalho à frente.

O desafio

O legado da empresa era extenso: aproximadamente 2 mil pacotes de SSIS desenvolvidos ao longo de anos, cada um contendo fluxos ETL com suas particularidades, dependências e complexidades. Migrar esse volume é uma operação de engenharia de precisão que exige leitura de código, compreensão de regras de negócio, reescrita em PySpark e validação em ambiente de produção.

A estimativa inicial feita pela própria equipe do cliente chegou a 30 mil horas de trabalho para uma migração completa de forma manual. Um número que, na prática, inviabilizaria o projeto dentro de qualquer janela de tempo razoável.

Diante desse cenário, conseguimos apresentar uma abordagem que combinava eficiência real com viabilidade de prazo e custo.

A solução

Nossa iniciativa partiu da premissa de que se o problema é repetição em escala, a resposta é automação inteligente. Em vez de escalar o time de engenharia linearmente para dar conta do volume, utilizamos a IA nativa da própria Databricks (sem ferramentas externas, sem custo adicional de licenciamento e sem dependência de plataformas de terceiros) como acelerador.

O núcleo da solução é o Genie. Para que ele atuasse como um engenheiro de dados experiente, investimos na construção de um prompt especializado com cerca de 100 linhas de instrução refinadas iterativamente. Esse prompt ensina o agente a compreender a lógica dos pacotes SSIS, mapear os fluxos ETL, tratar exceções e produzir código PySpark idiomático e pronto para revisão.

O fluxo de trabalho funciona assim:

• Os 2 mil pacotes SSIS (arquivos .dtsx) são carregados em um volume Databricks dentro do Unity Catalog, centralizando o acervo em um repositório único e governado.

• O Genie é acionado para ler cada pacote armazenado no volume e executar a refatoração automática dos fluxos ETL para código PySpark otimizado. Tudo isso em cerca de 5 minutos por pacote.

O resultado são Notebooks Databricks gerados automaticamente, prontos para validação e execução. A revisão humana foca nos ajustes necessários após a geração automatizada dos notebooks. A solução já foi validada tecnicamente com pacotes em ambiente de produção, confirmando tanto a qualidade do código gerado quanto a aderência às regras de negócio da empresa.

A solução já foi validada tecnicamente com pacotes em ambiente de produção, confirmando tanto a qualidade do código gerado quanto a aderência às regras de negócio da empresa.

Os resultados

A solução proporcionou uma redução de aproximadamente 45% no esforço das migrações utilizando IA. Na prática, os projetos passam a consumir cerca de 55% do esforço originalmente estimado.

A produtividade dos engenheiros aumentou significativamente com o apoio da IA, reduzindo o esforço necessário para a execução das migrações e acelerando a entrega dos projetos. Agora, cada refatoração automática leva, em média, 5 minutos. Com isso, os engenheiros são liberados para outras tarefas que exigem o julgamento humano.

O modelo de revisão inverteu a lógica tradicional, o que significa que, em vez de escrever tudo e revisar pontualmente, o time recebe os notebooks prontos e ajusta o que for necessário.

A inteligência na abordagem transforma uma migração que poderia durar anos em uma que entrega resultados em meses, independentemente do tamanho do time. Ao utilizar a IA como aceleradora dentro da própria plataforma do cliente, eliminamos fricção, reduzimos dependências externas e criamos um ativo que pode ser refinado e expandido ao longo de todo o projeto. Enquanto o prompt evolui a cada ciclo, o agente aprende com os ajustes e o processo fica mais preciso com o tempo.

Entregamos para o cliente uma iniciativa com escopo controlado, prazo viável e custo previsível.

Quer entender como essa abordagem pode ser aplicada ao seu projeto de dados? Entre em contato conosco!

Compartilhar conteúdo

Para saber como podemos ajudar a sua empresa

Entre em contato

Nossas últimas cases

Ver todos os cases
Financeiro

Soluções para pagamento com débito automático e Pix Troco

Saúde

Soluções tecnológicas que oferecem agilidade e eficiência a saúde

Tecnologia da Informação

Promovendo dados mais assertivos e qualificados