Skip to content

Chercheur - Apprentissage par Renforcement et Raisonnement LLM

    • Montreal, Québec
  • e5489

Description de l'offre d'emploi

Huawei Canada recrute immédiatement un Chercheur pour un contrat de 12 mois


À propos de l'équipe :

Fondé en 2012, le laboratoire Noah's Ark est devenu une organisation de recherche de premier plan avec des réalisations notables dans le milieu universitaire et l'industrie. La mission du laboratoire se concentre sur l'avancement de l'intelligence artificielle et des domaines connexes pour bénéficier à l'entreprise et à la société. Animé par des projets impactants à long terme, l'objectif est d'améliorer la recherche de pointe tout en intégrant des innovations dans les produits et services de l'entreprise, y compris les LLM, RL, NLP, la vision par ordinateur, la théorie de l'IA et la conduite autonome.

À propos du poste :

  • Mener des recherches de pointe dans le domaine des grands modèles de langage (LLMs), en mettant l'accent sur l'avancement du raisonnement du modèle.

  • Exploiter l'apprentissage par renforcement et le deep learning pour améliorer les capacités de raisonnement et de prise de décision des LLMs.

  • Concevoir, mettre en œuvre et expérimenter de nouvelles méthodes pour améliorer les performances et l'efficacité du modèle dans des applications du monde réel.

  • Publier des recherches de haute qualité dans des conférences de premier plan en IA/ML (par ex. NeurIPS, ICML, ICLR) et contribuer à la communauté plus large de l'apprentissage automatique.

Pré-requis du poste

Profil du candidat idéal :

  • Doctorat ou maîtrise en informatique, intelligence artificielle, apprentissage automatique, mathématiques ou un domaine technique connexe.

  • Bonne compréhension des Transformers et de l'apprentissage par renforcement pour les LLMs.

  • Expertise dans la formation de grands modèles de langage (LLMs) en RL avec des récompenses vérifiables avec des frameworks comme PyTorch.

  • Expérience pratique du réglage fin, RLHF et de l'application de méthodes de raisonnement avancées telles que Chain of Thought et In-Context Learning.

  • Compétences analytiques, de résolution de problèmes et de dépannage efficaces avec un accent sur des solutions de recherche innovantes.

  • Solides compétences en communication, à l'écrit et à l'oral, et capacité démontrée à transmettre des résultats de recherche complexes à divers publics, démontrée par des articles publiés dans des conférences de premier plan comme NeurIPS, ICLR, ACL, etc.

L'utilisation du genre masculin a été adoptée afin de faciliter la lecture et n'a aucune intention discriminatoire.

Huawei vise à soutenir un environnement de travail en français pour ses employés au Québec. Nous avons pris des mesures pour éviter d'exiger une langue autre que le français pour ce poste. Cependant, la maîtrise de l'anglais est essentielle pour ce rôle pour la ou les raisons suivantes, y compris, mais sans s'y limiter :

·        L'employé communique régulièrement avec des collègues à l'extérieur du Québec, où l'anglais est la principale langue utilisée pour la communication entre les bureaux.

ou