IA Consultant Machine Learning (H/F)

CDI
Issy-les-Moulineaux
Publié il y a 4 mois
IA Consultant Machine Learning (H/F)

Le poste

IA Consultant Machine Learning (H/F)

CDI
Issy-les-Moulineaux
Télétravail possible
Immédiat
Bac +5 ou Master
Qui sommes-nous ?

LINAGORA est une Entreprise à Mission, pionnier Français du Logiciel Libre. Sa Mission depuis 2000, est d’inventer, développer, mettre en œuvre et maintenir des technologies Open Source, pour préserver l’indépendance technologique de ses clients et la souveraineté numérique des États en particulier dela France et de l’Europe. Cette mission se conjugue avec la volonté d’avoir un maximum d’impacts positifs pour ses équipes, la société et la planète.

Depuis sa création, LINAGORA défend un numérique éthique, une « 3ème Voie Numérique », respectueuse des droits de chacun, responsable, inclusive et durable, capable d’apporter une réelle alternative aux géants américains et chinois.

Parmi ses logiciels phares LINAGORA, développe Twake Workplace qui se positionne comme une alternative 100 % libre aux solutions des GAFAM. Elle comprend notamment :

  • Twake Mail: une puissante messagerie moderne basée sur le protocole JMAP et le serveur d’e-mail James de la fondation Apache dont LINAGORA assure le leadership technique ;
  • Twake Chat: une solution de communications instantanées pour entreprise développée sur le protocole Matrix et compatible avec la solution de chat de l’État Français, Tchap ;
  • Twake Drive : une plateforme collaborative très facile d’usage permettant le travail en groupe grâce à la suite bureautique OnlyOffice.

En plus de Twake Workplace, LINAGORA développe LinShare qui est une solution de partage sécurisé de fichiers volumineux.

Depuis près de 10 ans, LINAGORA travailleégalement dans le domaine de la voix et développe ses propres algorithmes de transcription et modèles de langage. Ces technologies se retrouvent dans LinTO, une plateforme Open Source d’intelligence conversationnelle. LinTO permet l’enregistrement de réunions, leur transcription et leur édition en mode collaboratif afin de les organiser et de pouvoir en tirer parti grâce à l’intelligence artificielle.

LINAGORA est aussi un acteur clef du domaine de l’intelligence artificielle Open Source. LINAGORA propose une gamme complète de services et de produits cognitifs basés sur des modèles fondations sobres, compacts, Open Source et souverains. Ces derniers sont développés en mode communautaire avec un ensemble d’acteurs académiques, organisations publiques et privées réunis au sein de la communauté OpenLLM France.

En plus de son offre logicielle, LINAGORA propose son offre unique d’OSSA (Open Source Software Assurance) qui assure le Maintien en Conditions Opérationnelles (MCO) et le Maintien en Conditions de Sécurité (MCS) des logiciels Open Source utilisés dans les systèmes d’informations les plus critiques de ses grands clients.

Enfin, LINAGORA accompagne ses clients avec une gamme complète de services professionnels : conseil, expertise technique, développement, formation.

Présent sur tout le territoire français, LINAGORA dispose également de bureaux au Vietnam, en Tunisie et vend ses logiciels et services partout dans le monde.

Présentation du poste

Participez à impacter le monde positivement avec l’Open Source AI : venez vivre au coeur du changement en tant que Consultant Machine Learning (F/H).

Initiateur de la communauté OpenLLM France, nous sommes à l’origine et les co- créateurs de plusieurs communs numériques dans le domaine de l’IA Générative, qui se traduisent par la publication sous licence ouverte de jeux de données d’apprentissage, de modèles multimodaux ainsi que de solutions prêtes à l’usage pour mettre en œuvre des services cognitifs pour nos clients.

A titre d’exemple, le modèle CLAIRE (https://huggingface.co/OpenLLM-France/Claire-7B-0.1) a été publié en octobre 2023 pour proposer un modèle conversationnel entraîné sur des données conversationnelles ouvertes, maîtrisées et publiques. L’avantage d’un tel modèle, réellement Open Source, a démontré la possibilité de disposer d’un modèle de confiance, sobre et compact pour adresser des cas d’usages critiques dans les organisations les plus sensibles.

Via la communauté OpenLLM France ou au travers de nos accords stratégiques, nous collaborons avec les meilleurs laboratoires de recherche sur la data et l’intelligence artificielle en France et dans le monde. L’association entre la recherche publique et l’apport d’un industriel comme LINAGORA permet d’être au coeur de l’innovation dans le domaine de l’IA générative et de participer à faire progresser à l’état de l’art via nos publications académiques et participations aux meilleures conférences internationales dans ce domaine (NeurIPS, EMNLP, etc.).

L’année 2024 va être l’année de l’adoption en masse par les entreprises de l’IA Générative. Ainsi, LINAGORA a ajouté à son portfolio de prestation, une nouvelle offre de conseil et d’accompagnement pour mettre en œuvre des projets ambitieux de transformation de nos clients autour de l’IA et de l’IA générative sur une grande diversité de fonctions et processus métiers.

Nous sommes en pleine phase de structuration de cette offre autour d’un centre d’excellence dédié présenté sur un site internet dédié : https://www.linagora.ai/. Nous déclinons une feuille de route d’accompagnement suivant un modèle standardisé pouvant se structurer de la manière suivante :

  • Étape 1 : l’acculturation à l’IA générative open source et souveraine. Aide à l’identification des cas d’usages les plus pertinents.
  • Étape 2 : la collecte et la préparation des données d’apprentissage. Adaptation de modèles existants via des processus d’alignement. Expérimentations.
  • Étape 3 : le déploiement de modèles pré-entraînés sur des données métiers. Mise en œuvre d’une API LLM interne. Evaluation et supervision des services cognitifs.
  • Étape 4 : collaboration de modèles spécialisés au sein d’une plateforme d’orchestration. Formation et déploiement mode MLOps.
  • Étape 5 : généralisation par le déploiement à l’échelle et évaluation objectivée des gains.

Dans le cadre d’évolution de ce pôle de compétences, nous lançons un vaste plan de recrutement pour rassembler les talents et les compétences nécessaires à la concrétisation de notre ambition. Nous recherchons des consultants Machine Learning (F/H) pour intervenir au quotidien sur les projets de nos clients.

Vos missions

Votre mission, en une phrase, consiste à intervenir sur des projets ambitieux de transformation de nos clients autour de l’IA et de l’IA générative sur une grande diversité de fonctions et processus métiers.

Vos missions détaillées sont les suivantes :

  • Participer au déploiement de la stratégie générale et l’organisation IA / Generative AI de clients internationaux sous le pilotage du responsable du Centre d’Excellence,
  • Participer aux prestations constituantes des feuilles de routes proposées aux clients (acculturation, alignement de modèle, mise en œuvre de technologies de RAG, formation, intégration MLOps…),
  • participer à l’effort de démocratisation et aux travaux de la communauté d’OpenLLM France,
  • Participer à la rédaction d’article, document de postures et autre documentation visant à faire progresser l’état de l’art dans la compréhension de la mise en œuvre des technologies d’IA de confiance et partager les meilleures pratiques de mise en œuvre via des retours d’expériences concrets de client,
  • Participer aux conférences et aux événements internes et externes dans les domaines de l’IA générative et du management des données,
  • Participer à la veille technologique sur les modèles multimodaux d’IA générative, les techniques de fine tuning et de RAG, les jeux de données d’apprentissage et l’évolution des innovations dans le domaine de l’IA Générative,
  • Participez à la mise en oeuvre des processus durables de développement et de gestion de l’IA, en lien avec les principes Responsible AI et d’IA de confiance.

Exemples de projets ou réalisations sur lesquelles vous seriez amené à intervenir sur :

  • l’acculturation et diffusion des connaissances sur l’IA Générative et plus spécifiquement sur les technologies LLM Open Source et souverain,
  • la conception de services cognitifs adaptés aux données disponibles afin de répondre aux objectifs fonctionnels du projet, à l’aide des algorithmes, outils et méthodes standards, notamment de machine learning et de deep learning,
  • le développement de services cognitifs basés sur des composants Open Source et souverains,
  • la mise en œuvre de plateforme MLOps pour mettre en œuvre des LLM et gérer leur capacité à monter en charge pour répondre aux besoins des clients,
  • la réalisation des opérations d’alignement (fine tuning) de modèle pour répondre aux besoins identifiés,
  • la mise en œuvre de plateforme de RAG (Retrieval Augmented Generation) pour optimiser les processus métier des clients en s’appuyant sur leurs données,
  • la réalisation de preuves de concept pour tester et évaluer les technologies émergentes dans le l’IA générative.

Vous êtes basé au siège de la société, dans des bureaux incroyables, au sein d’une magnifique villa d’architecte, la « Villa GoodTech » avec un accès direct à la Seine. La villa est implantée sur l’île Saint-Germain. Elle offre un accès aisé au parc départemental de l’île et permet donc facilement de faire aussi du footing. Son accès privé direct sur la Seine offre la possibilité de faire du paddle ou du kayak entre midi et deux, ou bien en fin de journée.

La configuration de la Villa est propice à l’organisation de meetup communautaire et aussi à la mise en œuvre de nouvelles méthodes d’idéations et de co développement avec les clients.

Ces postes en fonction de votre expérience sont ouverts au télé-travail en suivant la politique de télé-travail de la société.

Votre Profil

Vous êtes de formation Bac+5 ou master avec une spécialité en IA ou en management de la donnée, avec à minima trois années d’expérience dans cet environnement.

Dans votre quotidien, vous vous connectez tous les jours à la plateforme HugggingFace et vous suivez les comptes sur les réseaux sociaux des modèles de langage principaux et les lettres d’informations principales au sujet de l’IA Générative.

Par ailleurs, vous devez disposer des compétences suivantes pour postuler :

  • Compétences en Machine / Deep Learning, Computer Vision, audio/sound (transcription de la voix, etc.), services cognitifs (agents virtuels, automatisation de processus robotisés, traitement de cas intelligents, etc.),
  • Infrastructure et système d’exploitation : Linux, Docker/Docker compose, techniques et librairies liées aux GPU Nvidia, Google Collab,
  • Modèles fondations (exemple : OpenAI GPT, Palm, Bard, Bloom, LLama, Mistral…), modèles d’embeddings et framework de tokerniser,
  • Framework IA : LangChain, llamaindex, Ollama, LM Studio,
  • Langages de programmation : Python, Jupyter Notebook, Langage R,
  • Bases de données et vector database : PostgreSQL, Pinecope, Chroma,
  • Notions de développement Web : Node.js, AngularJS, React serait un plus,
  • Jeux de données d’apprentissage principaux (OSCAR, CommonCrawl…),
  • vous faites preuve d’un fort intérêt pour les technologies de pointe et pour l’expérience utilisateur.

La maîtrise de l’anglais est aussi indispensable.

Salaire envisagé : en fonction de l’expérience de 40 à 60k€

QUESTIONS ET RÉPONSES SUR L’OFFRE

L’envoi d’un CV est-il obligatoire ?

Pour postuler à cette offre, l’envoi de votre CV est obligatoire.

Le télétravail est-il possible pour ce poste ?

Il n’est pas précisé si cet emploi est possible en télétravail.

Quel est le type de contrat pour ce poste ?

Le contrat pour ce poste est de type CDI.

Une lettre de motivation est-elle obligatoire pour postuler à cette offre ?

La lettre de motivation est optionnelle pour postuler à cette offre.

Partager cette offre

POSTULER

Caractéristiques de l'emploi

Catégorie emploiFonctions au siège

Postuler en ligne

La durée de l'envoi du formulaire dépend de la taille de votre CV. Veuillez patienter quelques instants pendant l'envoi. Ne fermez pas la page avant d'avoir reçu un message de confirmation. Merci de votre patience !

Un email valide est requis.