Engenheiro de Dados
Síntese de Qualificações
Prezado(a) recrutador(a),
Sou Engenheiro de Software desde 2010 e Engenheiro de Dados desde 2018, com mais de 15 anos de experiência em desenvolvimento de sistemas, pipelines de dados e arquiteturas de processamento em larga escala.
Tenho sólida experiência com Python, Spark/PySpark, Airflow, SQL e cloud, especialmente AWS. Atuei na construção de soluções voltadas a produtos analíticos, automação, integração de múltiplas fontes e processamento distribuído, sempre com foco em escalabilidade, confiabilidade e performance.
Nos últimos anos, trabalhei como Engenheiro de Dados Especialista na Serasa Experian, desenvolvendo pipelines ETL/ELT em larga escala, crawlers distribuídos para coleta massiva de dados web, APIs de dados e datasets analíticos para iniciativas estratégicas da companhia. Também participei de projetos de RD relacionados à automação, qualidade e escalabilidade de plataformas de dados.
Minha experiência inclui Data Lakes e Lakehouses, Spark distribuído, modelagem dimensional, microsserviços, integração de APIs e infraestrutura como código com Terraform e CloudFormation. Também possuo familiaridade com AWS, Azure e GCP, além de conhecimentos em IA aplicada, RAG, embeddings e sistemas baseados em LLMs.
Acredito que minha experiência técnica e visão arquitetural me permitem contribuir de forma consistente em projetos de alta complexidade e impacto.
Atenciosamente,
Taylor Lewis
Experiência Profissional
-
Engenheiro de Dados - Serasa Experian (10/2021 a 1/2026)
Desenvolvimento de crawlers distribuídos para coleta massiva de dados web, integrados a pipelines de ingestão de dados.
Implementação de pipelines ETL escaláveis em Python (Airflow AWS), com alta confiabilidade e performance.
Desenvolvimento de soluções avançadas de bypass (captcha solving, proxy rotation, fingerprinting), aumentando a eficiência de coleta.
Modelagem, transformação e organização de dados para construção de datasets analíticos.
Desenvolvimento de APIs para disponibilização de dados para múltiplos sistemas internos.
Participação em iniciativas de RD voltadas à escalabilidade, qualidade e automação. -
Taki Pay - Taki Pagamentos (11/2019 a 10/2021)
Responsável pela construção da arquitetura de dados e pipelines de processamento para plataformas analíticas e operacionais.
Desenvolvimento de pipelines ETL em Python e Alteryx para ingestão e transformação de dados.
Orquestração de pipelines com Airflow e Alteryx Server.
Estruturação da arquitetura de Data Lake corporativo.
Processamento de grandes volumes de dados com Spark / PySpark.
Integração de múltiplas fontes de dados e modelagem analítica.
Desenvolvimento de APIs de dados para consumo interno. -
Backend Developer Sênior - Brasilprev (11/2018 a 11/2019)
Atuação no desenvolvimento de sistemas backend e pipelines de dados para relatórios e análises corporativas.
Construção de pipelines de ingestão e transformação de dados.
Desenvolvimento de APIs utilizando Django e Flask.
Processamento de dados com PySpark.
Integração de múltiplas fontes internas e externas.
Implantação de aplicações em ambiente AWS.
Formação Acadêmica
-
Pós-graduação (1/2017 a 12/2018)
Business Intelligence e Big Data - Faculdade Impacta de Tecnologia -
Superior (3/2003 a 12/2007)
Artes Visuais - Multimídia e Intermídia - Universidade de São Paulo (USP)
Conhecimentos Gerais
Sou Engenheiro de Software desde 2010 e Engenheiro de Dados desde 2018, totalizando mais de 15 anos de experiência no desenvolvimento de sistemas, pipelines de dados e arquiteturas de processamento em larga escala.
Especialista em Python, Spark, Airflow e cloud (AWS), com forte atuação em coleta automatizada de dados, processamento massivo, modelagem de dados e construção de APIs.
Experiência em criação de pipelines ETL/ELT escaláveis, data lakes, sistemas distribuídos e integração com múltiplas fontes de dados, suportando produtos analíticos e decisões estratégicas.