simple_mapping – Arruda – Data Consulting https://modelo6.augustomello.com.br Sat, 02 Mar 2024 10:39:13 +0000 pt-BR hourly 1 https://wordpress.org/?v=6.8.3 https://modelo6.augustomello.com.br/wp-content/uploads/2025/08/cropped-Logo-Arruda-Consulting-2025-Picto-1b-32x32.png simple_mapping – Arruda – Data Consulting https://modelo6.augustomello.com.br 32 32 Aumenta a produtividade do teu ETL com Apache Hop https://modelo6.augustomello.com.br/como-utilizar-um-mesmo-etl-diversas-vezes-no-seu-projeto/ https://modelo6.augustomello.com.br/como-utilizar-um-mesmo-etl-diversas-vezes-no-seu-projeto/#comments Sat, 02 Mar 2024 10:39:13 +0000 https://arrudaconsulting.com.br/?p=5564 Imagina que o sistema da tua empresa guarda os dados de pessoa em duas colunas, nome e sobre-nome.

E ao criar um DW, provavelmente que iremos ter esse tratamento de dados em alguns etl, como nas seguintes dimensões:

  • Dim_Funcionarios.
  • Dim_Clientes.
  • Dim_Leads.

Em todas dimensões mencionadas acima teriamos que fazer um mesmo tratamento, que é concatenar as colunas: First_Name e Last_Name.

O objetivo deste artigo é compartilhar uma funcionalidade que aprendi esses dias, que basicamente teríamos um etl para fazer este procedimento e chamaríamos este etl nas três dimensões informadas no início do artigo.

Então vamos para o nosso Hand-ons.

Primeiro, iremos criar o pipeline que as dimensões irá chamar.


Então com Mapping Input iremos informar exatamente os mesmos campos que são utilizados nas dimensões:


Com o Concat fields, criamos uma nova coluna, concatenando as duas colunas mencionadas acima numa nova coluna chamada name.

Importante utilizarmos um espaço, como separador.


E finalizamos este pipeline com o Mapping Output, não é necessário fazer nenhuma configuração neste step.

Agora salvamos este pipeline, e iremos começar o etl que irá chamar este pipeline que acabamos de criar.

Neste ETL iremos ler uma tabela de funcionários, e iremos chamar o pipeline que criamos para ler os dados de first_name e last_name e fazer o concat pra nós.


No Simple Mapping informamos o pipeline que criamos anteriormente e temos a opção de trabalhar com:

  • Variáveis.
  • Campos de entrada.
  • Campos de saída.

Neste exemplo só iremos informar o pipeline mesmo, e agora iremos executar o nosso ETL.

É dessa forma que podemos utilizar um mesmo ETL diversas vezes, otimizando o tempo de desenvolvimento do seu projeto.
Uma vez testado o seu ETL e quiser automatizar a sua carga temos um artigo com um tutorial para automatizar o seu etl.

Muito Obrigado e até o próximo artigo!!

]]>
https://modelo6.augustomello.com.br/como-utilizar-um-mesmo-etl-diversas-vezes-no-seu-projeto/feed/ 2