Sobre a vaga/ Missão do cargo
Buscamos um(a) Cientista de Dados Pleno com perfil hands-on, proativo e com forte capacidade analítica para integrar nosso time de IA e Analytics. Sua principal missão será desenvolver, treinar e implantar modelos de Machine Learning e Inteligência Artificial Generativa, apoiando diretamente a evolução da nossa plataforma de dados em ambiente multi-cloud.
Você fará parte de um time que trabalha com uma arquitetura moderna baseada em Databricks no Azure, integrado a um Data Lake hospedado em OCI (Oracle Cloud Infrastructure) utilizando Autonomous Exadata, com consumo de dados via Delta Sharing e conexões Spark JDBC. Se você tem interesse genuíno em construir soluções aplicadas de IA para problemas reais de negócio, essa vaga é para você.
Responsabilidades / Atividades
Modelagem e IA Tradicional: Desenvolver, treinar, avaliar e implantar modelos de Machine Learning em produção, atuando com algoritmos preditivos, classificação, otimização e projetos de visão computacional.
Inteligência Artificial Generativa: Participar ativamente do desenho e da construção de soluções modernas utilizando IA Generativa, Large Language Models (LLMs), arquiteturas RAG, agentes autônomos de IA e chatbots inteligentes.
Engenharia de Recursos e Pipelines: Desenvolver pipelines de dados, transformações e notebooks diretamente na plataforma Databricks, consumindo, tratando e higienizando dados provenientes do Data Lake corporativo.
Melhoria Contínua e Ciclo de Vida: Realizar experimentações constantes de algoritmos, apoiar processos de fine-tuning, validação de hipóteses e garantir a melhoria contínua dos modelos integrados em ambiente produtivo.
Interface com o Negócio: Atuar em estreita colaboração com as áreas de negócio para o correto entendimento de dores operacionais e tradução dessas demandas em soluções analíticas eficazes.
Evolução da Plataforma: Contribuir ativamente para a maturidade técnica do ecossistema analítico e das ferramentas de IA da companhia.
Curiosidade Intelectual: Perfil investigativo, automotivado e com constante desejo de aprender e testar tecnologias modernas de IA.
Forte Capacidade de Execução: Orientação para resultados, garantindo entregas ágeis, funcionais e com código limpo.
Autonomia na Resolução de Problemas: Postura resolutiva para investigar falhas operacionais, analisar cenários de erros e propor soluções de contorno com independência.
Colaboração e Comunicação: Facilidade para trabalhar em equipe e interagir de forma clara e didática com squads multidisciplinares e clientes internos.
Requisitos
Obrigatórios:
- Formação Acadêmica
Graduação concluída em Ciência de Dados, Ciência da Computação, Engenharia, Estatística, Matemática ou áreas quantitativas correlatas.
Experiência prática comprovada no desenvolvimento e na implantação de pelo menos um modelo/projeto de IA em produção com sucesso.
Vivência sólida atuando com metodologias ágeis de desenvolvimento.
Domínio em Databricks: Conhecimentos avançados e experiência prática navegando e desenvolvendo no ecossistema Databricks.
Programação e Data Science: Fluência em Python voltado para ciência de dados e domínio de suas principais bibliotecas e frameworks de ML.
Processamento Distribuído: Vivência prática com Spark / PySpark para manipulação e processamento de grandes volumes de dados.
Modelagem Core: Sólido entendimento prático de modelos preditivos e técnicas estatísticas de classificação.
Experiência real com IA Generativa, LLMs e técnicas de Fine-tuning ou RAG (Retrieval-Augmented Generation).
Familiaridade com protocolos MCP, Agentes de IA e modelos multimodais (imagem/texto).
Vivência em arquiteturas de nuvem combinadas, especificamente Microsoft Azure e OCI.
Conhecimento em consumo de dados via Delta Sharing e conexões Spark JDBC.
Noções de MLOps (esteiras de CI/CD para modelos, monitoramento de data drift e versionamento de modelos).
Certificações oficiais da Databricks
Benefícios
- 13 notas no ano
- Ferias