Engenheiro de dados
Síntese de Qualificações
- Desenvolvimento e manutenção de pipelines de dados na plataforma Azure, utilizando Azure Data Factory e Azure Databricks para ingestão, processamento e disponibilização de dados.
- Implementação da arquitetura Medallion (Bronze, Silver e Gold), garantindo qualidade, governança e organização dos dados ao longo das camadas.
- Ingestão de dados a partir de múltiplas fontes, incluindo APIs REST, bancos de dados (Oracle, Cosmos DB) e integrações com sistemas como Salesforce.
- Processamento de grandes volumes de dados utilizando PySpark, com foco em escalabilidade, performance e confiabilidade.
- Criação e otimização de tabelas Delta Lake, melhorando o desempenho de consultas e o consumo analítico dos dados.
- Implementação de cargas incrementais e controle de versionamento de dados com Delta Lake.
- Orquestração e automação de pipelines com Azure Data Factory e Logic Apps, garantindo eficiência e redução de processos manuais.
- Monitoramento e sustentação de Data Lake, atuando na correção de falhas, melhoria contínua e garantia de disponibilidade dos dados.
- Aplicação de práticas de Data Quality, incluindo tratamento de inconsistências, duplicidades e validação de dados.
- Desenvolvimento de notebooks no Databricks para ingestão e transformação de dados via APIs (Python / Spark).
- Desenvolvimento de consultas SQL e estruturação de dados para construção de indicadores e relatórios estratégicos.
- Utilização de Azure DevOps para versionamento, controle de deploys e gestão de pipelines.
- Implementação de governança de dados utilizando Unity Catalog.
- Participação em projetos com foco em dados para iniciativas de Inteligência Artificial.
- Mapeamento de fluxos de negócio e levantamento de requisitos junto às áreas de negócio.
- Colaboração com times de analytics para entrega de dados confiáveis e suporte à tomada de decisão.
Experiência Profissional
-
Engenheiro de dados
- Desenvolvimento e manutenção de pipelines de dados na plataforma Azure, utilizando Azure Data Factory e Azure Databricks para ingestão, processamento e disponibilização de dados.
- Implementação da arquitetura Medallion (Bronze, Silver e Gold), garantindo qualidade, governança e organização dos dados ao longo das camadas.
- Ingestão de dados a partir de múltiplas fontes, incluindo APIs REST, bancos de dados (Oracle, Cosmos DB) e integrações com sistemas como Salesforce.
- Processamento de grandes volumes de dados utilizando PySpark, com foco em escalabilidade, performance e confiabilidade.
- Criação e otimização de tabelas Delta Lake, melhorando o desempenho de consultas e o consumo analítico dos dados.
- Implementação de cargas incrementais e controle de versionamento de dados com Delta Lake.
- Orquestração e automação de pipelines com Azure Data Factory e Logic Apps, garantindo eficiência e redução de processos manuais.
- Monitoramento e sustentação de Data Lake, atuando na correção de falhas, melhoria contínua e garantia de disponibilidade dos dados.
- Aplicação de práticas de Data Quality, incluindo tratamento de inconsistências, duplicidades e validação de dados.
- Desenvolvimento de notebooks no Databricks para ingestão e transformação de dados via APIs (Python / Spark).
- Desenvolvimento de consultas SQL e estruturação de dados para construção de indicadores e relatórios estratégicos.
- Utilização de Azure DevOps para versionamento, controle de deploys e gestão de pipelines.
- Implementação de governança de dados utilizando Unity Catalog.
- Participação em projetos com foco em dados para iniciativas de Inteligência Artificial.
- Mapeamento de fluxos de negócio e levantamento de requisitos junto às áreas de negócio.
- Colaboração com times de analytics para entrega de dados confiáveis e suporte à tomada de decisão.
Formação Acadêmica
-
Superior (2/2017 a 11/2020)
Ciência da computação - Universidade Cruzeiro do Sul -
Ensino Médio (1/2016 a 12/2016)
Ensino Médio - Colégio Atheneu
Cursos e Certificações
Microsoft AI Hack - Microsoft Conclusão:Abril/2024
Fundamentals of the Databricks Lakehouse Platform Accreditation - Databricks Conclusão: Setembro/2022
Introdução à Ciência de Dados 2.0 - Data Science Academy Conclusão: Maio/2021
Workshop Microsoft Power BI - Microsoft Conclusão: Maio/2021
Big Data Fundamentos 2.0 - Data Science Academy Conclusão: Junho/2022
Reward Idiomas Conclusão: Dezembro/2026