Cientista de Dados Pleno – Inteligência Artificial & Machine Learning | Remoto - PJ

Tecla T

Via inHire
RemotoPJA combinar
Postado 1 hora atrás

Sobre a vaga

Sobre a vaga/ Missão do cargo

Buscamos um(a) Cientista de Dados Pleno com perfil hands-on, proativo e com forte capacidade analítica para integrar nosso time de IA e Analytics. Sua principal missão será desenvolver, treinar e implantar modelos de Machine Learning e Inteligência Artificial Generativa, apoiando diretamente a evolução da nossa plataforma de dados em ambiente multi-cloud.

Você fará parte de um time que trabalha com uma arquitetura moderna baseada em Databricks no Azure, integrado a um Data Lake hospedado em OCI (Oracle Cloud Infrastructure) utilizando Autonomous Exadata, com consumo de dados via Delta Sharing e conexões Spark JDBC. Se você tem interesse genuíno em construir soluções aplicadas de IA para problemas reais de negócio, essa vaga é para você.

Responsabilidades / Atividades

  • Modelagem e IA Tradicional: Desenvolver, treinar, avaliar e implantar modelos de Machine Learning em produção, atuando com algoritmos preditivos, classificação, otimização e projetos de visão computacional.

  • Inteligência Artificial Generativa: Participar ativamente do desenho e da construção de soluções modernas utilizando IA Generativa, Large Language Models (LLMs), arquiteturas RAG, agentes autônomos de IA e chatbots inteligentes.

  • Engenharia de Recursos e Pipelines: Desenvolver pipelines de dados, transformações e notebooks diretamente na plataforma Databricks, consumindo, tratando e higienizando dados provenientes do Data Lake corporativo.

  • Melhoria Contínua e Ciclo de Vida: Realizar experimentações constantes de algoritmos, apoiar processos de fine-tuning, validação de hipóteses e garantir a melhoria contínua dos modelos integrados em ambiente produtivo.

  • Interface com o Negócio: Atuar em estreita colaboração com as áreas de negócio para o correto entendimento de dores operacionais e tradução dessas demandas em soluções analíticas eficazes.

  • Evolução da Plataforma: Contribuir ativamente para a maturidade técnica do ecossistema analítico e das ferramentas de IA da companhia.

  • Curiosidade Intelectual: Perfil investigativo, automotivado e com constante desejo de aprender e testar tecnologias modernas de IA.

  • Forte Capacidade de Execução: Orientação para resultados, garantindo entregas ágeis, funcionais e com código limpo.

  • Autonomia na Resolução de Problemas: Postura resolutiva para investigar falhas operacionais, analisar cenários de erros e propor soluções de contorno com independência.

  • Colaboração e Comunicação: Facilidade para trabalhar em equipe e interagir de forma clara e didática com squads multidisciplinares e clientes internos.

Requisitos

Obrigatórios:

  • Formação Acadêmica
    • Graduação concluída em Ciência de Dados, Ciência da Computação, Engenharia, Estatística, Matemática ou áreas quantitativas correlatas.

    Experiência Essencial
    • Experiência prática comprovada no desenvolvimento e na implantação de pelo menos um modelo/projeto de IA em produção com sucesso.

    • Vivência sólida atuando com metodologias ágeis de desenvolvimento.

    Competências Técnicas Obrigatórias (Hard Skills)
    • Domínio em Databricks: Conhecimentos avançados e experiência prática navegando e desenvolvendo no ecossistema Databricks.

    • Programação e Data Science: Fluência em Python voltado para ciência de dados e domínio de suas principais bibliotecas e frameworks de ML.

    • Processamento Distribuído: Vivência prática com Spark / PySpark para manipulação e processamento de grandes volumes de dados.

    • Modelagem Core: Sólido entendimento prático de modelos preditivos e técnicas estatísticas de classificação.

Diferenciais:
  • Experiência real com IA Generativa, LLMs e técnicas de Fine-tuning ou RAG (Retrieval-Augmented Generation).

  • Familiaridade com protocolos MCP, Agentes de IA e modelos multimodais (imagem/texto).

  • Vivência em arquiteturas de nuvem combinadas, especificamente Microsoft Azure e OCI.

  • Conhecimento em consumo de dados via Delta Sharing e conexões Spark JDBC.

  • Noções de MLOps (esteiras de CI/CD para modelos, monitoramento de data drift e versionamento de modelos).

  • Certificações oficiais da Databricks

Benefícios

  • 13 notas no ano
  • Ferias
WhatsApp
Receba vagas pelo WhatsAppEntre no grupo e receba vagas diretamente no seu celular
Entrar no grupo →