Olá, tudo bem?

Meu nome é Nórton Vanz

Tecnólogo em Sistemas para Internet - IFRS.

Especialista em Gerenciamento de Projetos - FGV.

Mais de 15 anos de experiência em TI.

Perfil proativo, organizado e adaptável.

Atleta de corrida e apreciador de boa música.

Gaúcho, residente em Curitiba PR.

Cientista de Dados em constante evolução.

Transformo dados brutos em soluções de negócio.

Experiências Profissionais

Cientista de Dados

Banco Bradesco (Jump Solutions | início 11/23)
- Área: Inteligência de Dados / Centro de Excelência do Cliente.
- Foco: estudos quantitativos de NPS, envolvendo transações e meios de pagamento.

Varejista C&A (Jump Solutions | 04 - 11/23)
- Área: Customer Analytics / Marketing e CRM.
- Foco: estudos quantitativos de clientes, testes A/B, e modelos de segmentação de clientes.

Analista de Dados

Agritech Aliare. (02/22 - 04/23)
- Área: Business Intelligence.
- Foco: criação e manutenção de ETLs e paineis em solução de BI proprietária.

E-commerce Mahalo. (06/19 - 03/22)
- Área: Tecnologia da informação.
- Foco: criação, manutenção e evolução em Google Sheets e painéis analíticos gerenciais.

Maiores detalhes em meu LinkedIn.

Habilidades / Ferramentas

Manipulação e Visualização de Dados

Python com foco em análise de dados
PySpark / Hive para análise / process. distrib. big data
Bibliotecas Pandas, Matplotlib, Seaborn, Plotly
Google Sheets avançado e Apps Script
Web Scraping com Python
Metabase data viz

Estatística e Machine Learning

Estatística Descritiva (localização, dispersão, assimetria)
Algoritmos de Classificação, Regressão e Clusterização
Técnicas de Sel. Atributos e Embedding
Métricas de Performance diversas
Pacotes de ML Sklearn, XGBoost

Engenharia de Software

Git, Github, Gitlab, Virtual Environments
Streamlit, Heroku Cloud
Flask, Python API's, Papermill
Serviços Cloud AWS S3, EC2, RDS

Bancos de Dados

SQL avançado para extração de dados
Bancos de Dados SQLite, PostgreSQL, SQL Server, Oracle, Teradata

Projetos de Ciência de Dados

Abaixo, serão apresentados 3 projetos completos.
São focados na resolução de problemas de negócio reais.
Eles tem como saída, modelos de aprendizado de máquina.

Projetos de Machine Learning

Programa de Fidelidade para Clientes de E-Commerce

Objetivo:

Agrupar os mais de 5000 clientes por perfil de consumo, e identificar os valiosos, criando um programa de fidelidade.

Execução:

Implementei uma infraestrutura em cloud AWS, que recebe, classifica, e inclui os novos clientes no grupo correspondente ao seu perfil de consumo. Um dashboard no Metabase detalha cada perfil, e monitora sua performance.

Ferramentas utilizadas:

Python com pacotes de Machine Learning: sklearn, scipy e yellowbrick.
Serviços AWS: S3 (armazenamento), EC2 (servidor) e RDS (banco de dados).
Jupyter Notebook, Git e Github.
Crontab e Papermill
Pandas Profiling, Metabase.
Algoritmos de Clusterização e Redução de Dimensionalidade:

K-Means, Gaussian Mixture Model, Hierarchical Clustering e DBScan.
PCA, UMAP, t-SNE e Tree-Based Embedding

Resultados financeiros:

Expectativa de 10% de aumento no número de clientes mais valiosos no programa de fidelidade "Loyals" no próximo ano.
Em números, expectativa de incremento de faturamento de $280 mil no próximo ano.

Detalhes (Github)

Sistema de Recomendação para Cross-selling de Seguros

Objetivo:

Criar um algoritmo de rankeamento de interesse em seguro veicular para novos clientes, a partir de dados de pesquisa de interesse realizada com clientes antigos.

Execução:

Criei uma funcionalidade em Google Sheets, que a partir de uma lista de clientes, consulta o algoritmo via API, e retorna em tempo real a lista ordenada destes clientes por interesse em aquisição de seguro veicular.

Ferramentas utilizadas:

Python com pacotes de Machine Learning: sklearn e xgboost.
Jupyter Notebook, Git, Github e Gitlab.
Google Apps Script.
Técnicas de seleção de atributos e redução de dimensionalidade.
Heroku Cloud, Flask e Python API's.
Algoritmos de Classificação e Regressão:

KNN Classifier, ExtraTrees Classifier, XGBboost Classifier e Logistic Regression.

Resultados financeiros:

Realizando 20 mil ligações, incremento previsto de 170% na receita com seguro veicular: US$ 131 milhões.
Realizando 40 mil ligações, incremento previsto de 90% na receita com seguro veicular: US$ 139 milhões.

Previsão de Vendas de Rede Farmacêutica

Objetivo:

Criar um algoritmo de previsão de vendas para 1115 lojas, e disponibilizá-lo para acesso 24/7, via smartphone.

Execução:

Criei um robô no aplicativo de mensagens Telegram, que recebe o código da loja, consulta o algoritmo via API, e retorna em tempo real qual a previsão de vendas (faturamento) daquela loja para as próximas 6 semanas.

Ferramentas utilizadas:

Python com pacotes de Machine Learning: sklearn e scipy.
Jupyter Notebook, Git e Github.
Técnicas de seleção de atributos e redução de dimensionalidade.
Heroku Cloud, Flask e Python API's.
Algoritmos de Classificação e Regressão:

Linear Regressor, Linear Regressor Regularized, Random Forest e XGBoost Classifier.

Resultados financeiros:

Redução da taxa média de erros das previsões de vendas de toda a rede de 36% para 4,65% em média (-31%).
Após o 1º semestre da implantação, aumento de 1.9% no lucro líquido semestral da Rossmann.
Em números, considerando o faturamento de 2020 de €10 bilhões, o projeto traz um resultado líquido semestral aproximado de €114 milhões.

Projetos de Insights

Abaixo, serão apresentados 2 projetos de análise de dados.
Geram insights como saída, sugerindo ações para tomada de decisão.

Insights para Maximização de Lucro de Imobiliária

Objetivo:

Responder duas questões chaves do negócio:

Quais são os imóveis que deveríamos comprar, dos mais de 20 mil disponíveis?
Uma vez o imóvel comprado, qual a melhor sazonalidade para vendê-lo, e por qual preço?

Execução:

Respondi as questões através de uma análise exploratória de dados em Python. Para isto, construí um dashboard interativo acessível via navegador, que serve de base para a tomada de decisão do time de negócio. Ele contém:

Métricas descritivas dos dados.
Mapa de densidade dos imóveis e de preços por região.
Gráficos variados de distribuição de preço e atributos dos imóveis.
Relatório e mapa de imóveis recomendados para compra.
Relatório contendo a melhor sazonalidade para venda, e preço de venda recomendado.

Ferramentas utilizadas:

Python, Pandas, Numpy e Seaborn.
Pycharm e Google Colab.
Git e Github.
Mapas interativos com Plotly e Folium.
Streamlit Web App.
Heroku Cloud.

Resultados financeiros:

Respeitando o alto padrão de qualidade exigido, apenas 5 imóveis foram sugeridos para a compra e revenda nesta primeira versão do projeto.
Caso implementada, a solução traria uma margem de aproximadamente 30% de lucro, equivalente a $544 mil dólares para a empresa.

Detalhes (Github)

Insights para Análise de Performance de E-Commerce

Objetivo:

Avaliar a performance de um e-commerce real (Mahalo Holding), realizando uma análise exploratória nos seus dados de vendas (2019-2022). Para isto:

Quatro hipóteseses foram validadas, gerando insights sobre ticket médio, representatividade e lucro por UF e fornecedor.
Nove questões de negócio foram respondidas, envolvendo volume de vendas, faturamento e lucro por marketplace, fornecedor, UF, região do Brasil, mês, trimestre, entre outros.

Execução:

Realizei o planejamento do projeto, coletei dados do Google Sheets anonimizando os sensíveis, e realizei sua limpeza e padronização.
Apliquei estatística descritiva, criei 6 novas features (atributos dos dados) e iniciei a análise exploratória com a ferramenta de visualização Sweetviz.
Validei as 4 hipóteses e respondi as 9 questões de negócio.
Apresentei resultados aos sócios, compartilhando insights e lições aprendidas.

Ferramentas utilizadas:

Python, Pandas, Matplotlib e Seaborn.
Jupyter Notebook, Git e Github.
Anonimização de dados com Hashlib.
Limpeza e padronização nos dados com RegEx.
Data Viz com Sweetviz.

Resultados:

Foram validadas as hipóteses dos sócios da empresa, e respondidas as suas questões de negócio.
A partir disso, poderão ter uma visão mais assertiva do business, e extrair lições aprendidas valiosas para o futuro.

Detalhes (Github)

Portfólio de
Ciência de Dados

Aqui você encontra:

Olá, tudo bem?

Meu nome é Nórton Vanz

Experiências Profissionais

Cientista de Dados

Analista de Dados

Habilidades / Ferramentas

Manipulação e Visualização de Dados

Estatística e Machine Learning

Engenharia de Software

Bancos de Dados

Projetos de Ciência de Dados

Programa de Fidelidade para Clientes de E-Commerce

Objetivo:

Execução:

Ferramentas utilizadas:

Resultados financeiros:

Sistema de Recomendação para Cross-selling de Seguros

Objetivo:

Execução:

Ferramentas utilizadas:

Resultados financeiros:

Previsão de Vendas de Rede Farmacêutica

Objetivo:

Execução:

Ferramentas utilizadas:

Resultados financeiros:

Insights para Maximização de Lucro de Imobiliária

Objetivo:

Execução:

Ferramentas utilizadas:

Resultados financeiros:

Insights para Análise de Performance de E-Commerce

Objetivo:

Execução:

Ferramentas utilizadas:

Resultados:

Contato

Vamos conversar? Aguardo o seu contato: