Olá, tudo bem?

Meu nome é Nórton Vanz

  • Tecnólogo em Sistemas para Internet - IFRS.
  • Especialista em Gerenciamento de Projetos - FGV.
  • Mais de 15 anos de experiência em TI.

  • Perfil proativo, organizado e adaptável.
  • Corredor de rua e apreciador de boa música.
  • Gaúcho, residente em Curitiba PR.

  • Cientista de Dados em constante evolução.
  • Transformo dados brutos em soluções de negócio.
  • Experiências Profissionais

    Cientista de Dados

    Banco Bradesco (Jump Solutions | início 11/23)
    - Área: Inteligência de Dados / Centro de Excelência do Cliente.
    - Foco: estudos quantitativos de NPS, envolvendo transações e meios de pagamento.

    Varejista C&A (Jump Solutions | 04 - 11/23)
    - Área: Customer Analytics / Marketing e CRM.
    - Foco: estudos quantitativos de clientes, testes A/B, e modelos de segmentação de clientes.

    Analista de Dados

    Agritech Aliare. (02/22 - 04/23)
    - Área: Business Intelligence.
    - Foco: criação e manutenção de ETLs e paineis em solução de BI proprietária.

    E-commerce Mahalo. (06/19 - 03/22)
    - Área: Tecnologia da informação.
    - Foco: criação, manutenção e evolução em Google Sheets e painéis analíticos gerenciais.

    Maiores detalhes em meu LinkedIn.

    Habilidades / Ferramentas

    Manipulação e Visualização de Dados

    • Python com foco em análise de dados
    • PySpark / Hive para análise / process. distrib. big data
    • Bibliotecas Pandas, Matplotlib, Seaborn, Plotly
    • Google Sheets avançado e Apps Script
    • Web Scraping com Python
    • Metabase data viz

    Estatística e Machine Learning

    • Estatística Descritiva (localização, dispersão, assimetria)
    • Algoritmos de Classificação, Regressão e Clusterização
    • Técnicas de Sel. Atributos e Embedding
    • Métricas de Performance diversas
    • Pacotes de ML Sklearn, XGBoost

    Engenharia de Software

    • Git, Github, Gitlab, Virtual Environments
    • Streamlit, Heroku Cloud
    • Flask, Python API's, Papermill
    • Serviços Cloud AWS S3, EC2, RDS

    Bancos de Dados

    • SQL avançado para extração de dados
    • Bancos de Dados SQLite, PostgreSQL, SQL Server, Oracle, Teradata

    Projetos de Ciência de Dados

    Abaixo, serão apresentados 3 projetos completos.
    São focados na resolução de problemas de negócio reais.
    Eles tem como saída, modelos de aprendizado de máquina.

    Projetos de Machine Learning

    Programa de Fidelidade para Clientes de E-Commerce

    Objetivo:

    Agrupar os mais de 5000 clientes por perfil de consumo, e identificar os valiosos, criando um programa de fidelidade.

    Execução:

    Implementei uma infraestrutura em cloud AWS, que recebe, classifica, e inclui os novos clientes no grupo correspondente ao seu perfil de consumo. Um dashboard no Metabase detalha cada perfil, e monitora sua performance.

    Ferramentas utilizadas:

    • Python com pacotes de Machine Learning: sklearn, scipy e yellowbrick.
    • Serviços AWS: S3 (armazenamento), EC2 (servidor) e RDS (banco de dados).
    • Jupyter Notebook, Git e Github.
    • Crontab e Papermill
    • Pandas Profiling, Metabase.
    • Algoritmos de Clusterização e Redução de Dimensionalidade:
      • K-Means, Gaussian Mixture Model, Hierarchical Clustering e DBScan.
      • PCA, UMAP, t-SNE e Tree-Based Embedding

      Resultados financeiros:

      • Expectativa de 10% de aumento no número de clientes mais valiosos no programa de fidelidade "Loyals" no próximo ano.
      • Em números, expectativa de incremento de faturamento de $280 mil no próximo ano.

      • Projeto concluído em 09/2022.

    Sistema de Recomendação para Cross-selling de Seguros

    Objetivo:

    Criar um algoritmo de rankeamento de interesse em seguro veicular para novos clientes, a partir de dados de pesquisa de interesse realizada com clientes antigos.

    Execução:

    Criei uma funcionalidade em Google Sheets, que a partir de uma lista de clientes, consulta o algoritmo via API, e retorna em tempo real a lista ordenada destes clientes por interesse em aquisição de seguro veicular.

    Ferramentas utilizadas:

    • Python com pacotes de Machine Learning: sklearn e xgboost.
    • Jupyter Notebook, Git, Github e Gitlab.
    • Google Apps Script.
    • Técnicas de seleção de atributos e redução de dimensionalidade.
    • Heroku Cloud, Flask e Python API's.
    • Algoritmos de Classificação e Regressão:
      • KNN Classifier, ExtraTrees Classifier, XGBboost Classifier e Logistic Regression.

    Resultados financeiros:

    • Realizando 20 mil ligações, incremento previsto de 170% na receita com seguro veicular: US$ 131 milhões.
    • Realizando 40 mil ligações, incremento previsto de 90% na receita com seguro veicular: US$ 139 milhões.

    • Projeto concluído em 04/2022.

    Previsão de Vendas de Rede Farmacêutica

    Objetivo:

    Criar um algoritmo de previsão de vendas para 1115 lojas, e disponibilizá-lo para acesso 24/7, via smartphone.

    Execução:

    Criei um robô no aplicativo de mensagens Telegram, que recebe o código da loja, consulta o algoritmo via API, e retorna em tempo real qual a previsão de vendas (faturamento) daquela loja para as próximas 6 semanas.

    Ferramentas utilizadas:

    • Python com pacotes de Machine Learning: sklearn e scipy.
    • Jupyter Notebook, Git e Github.
    • Técnicas de seleção de atributos e redução de dimensionalidade.
    • Heroku Cloud, Flask e Python API's.
    • Algoritmos de Classificação e Regressão:
      • Linear Regressor, Linear Regressor Regularized, Random Forest e XGBoost Classifier.

    Resultados financeiros:

    • Redução da taxa média de erros das previsões de vendas de toda a rede de 36% para 4,65% em média (-31%).
    • Após o 1º semestre da implantação, aumento de 1.9% no lucro líquido semestral da Rossmann.
    • Em números, considerando o faturamento de 2020 de €10 bilhões, o projeto traz um resultado líquido semestral aproximado de €114 milhões.

    • Projeto concluído em 01/2022.

    Projetos de Insights

    Abaixo, serão apresentados 2 projetos de análise de dados.
    Geram insights como saída, sugerindo ações para tomada de decisão.

    Insights para Maximização de Lucro de Imobiliária

    Objetivo:

    Responder duas questões chaves do negócio:
    1. Quais são os imóveis que deveríamos comprar, dos mais de 20 mil disponíveis?
    2. Uma vez o imóvel comprado, qual a melhor sazonalidade para vendê-lo, e por qual preço?

    Execução:

    Respondi as questões através de uma análise exploratória de dados em Python. Para isto, construí um dashboard interativo acessível via navegador, que serve de base para a tomada de decisão do time de negócio. Ele contém:

    • Métricas descritivas dos dados.
    • Mapa de densidade dos imóveis e de preços por região.
    • Gráficos variados de distribuição de preço e atributos dos imóveis.
    • Relatório e mapa de imóveis recomendados para compra.
    • Relatório contendo a melhor sazonalidade para venda, e preço de venda recomendado.

    Ferramentas utilizadas:

    • Python, Pandas, Numpy e Seaborn.
    • Pycharm e Google Colab.
    • Git e Github.
    • Mapas interativos com Plotly e Folium.
    • Streamlit Web App.
    • Heroku Cloud.

    Resultados financeiros:

    Respeitando o alto padrão de qualidade exigido, apenas 5 imóveis foram sugeridos para a compra e revenda nesta primeira versão do projeto.
    Caso implementada, a solução traria uma margem de aproximadamente 30% de lucro, equivalente a $544 mil dólares para a empresa.

    Projeto concluído em 11/2021.

    Insights para Análise de Performance de E-Commerce

    Objetivo:

    Avaliar a performance de um e-commerce real (Mahalo Holding), realizando uma análise exploratória nos seus dados de vendas (2019-2022). Para isto:
    1. Quatro hipóteseses foram validadas, gerando insights sobre ticket médio, representatividade e lucro por UF e fornecedor.
    2. Nove questões de negócio foram respondidas, envolvendo volume de vendas, faturamento e lucro por marketplace, fornecedor, UF, região do Brasil, mês, trimestre, entre outros.

    Execução:

    • Realizei o planejamento do projeto, coletei dados do Google Sheets anonimizando os sensíveis, e realizei sua limpeza e padronização.
    • Apliquei estatística descritiva, criei 6 novas features (atributos dos dados) e iniciei a análise exploratória com a ferramenta de visualização Sweetviz.
    • Validei as 4 hipóteses e respondi as 9 questões de negócio.
    • Apresentei resultados aos sócios, compartilhando insights e lições aprendidas.

    Ferramentas utilizadas:

    • Python, Pandas, Matplotlib e Seaborn.
    • Jupyter Notebook, Git e Github.
    • Anonimização de dados com Hashlib.
    • Limpeza e padronização nos dados com RegEx.
    • Data Viz com Sweetviz.

    Resultados:

    Foram validadas as hipóteses dos sócios da empresa, e respondidas as suas questões de negócio.
    A partir disso, poderão ter uma visão mais assertiva do business, e extrair lições aprendidas valiosas para o futuro.

    Projeto concluído em 07/2022.

    Contato

    Vamos conversar? Aguardo o seu contato: