Senior Data Engineer

fulltime

Employment Information

Notre mission ⚖️

Nous nous engageons pour un enjeu démocratique majeur : rendre le droit plus accessible et transparent aux justiciables et aux professionnels du droit.

Doctrine est la première plateforme d'intelligence juridique. Nous centralisons et organisons toute l'information juridique disponible pour permettre aux avocats et juristes de mieux conseiller et défendre leurs clients. Plus d'un million de personnes viennent tous les mois sur Doctrine se renseigner sur leurs droits, et déjà 14 000 professionnels du droit nous font confiance.

Nos valeurs 🤝

Challenge the status quo.

Nous défendons les idées audacieuses et la prise de risque intelligente.

Liberty and responsibility.

Nous promouvons l'autonomie, l'impact de chacun·e et l'ownership.

Knowledge is power.

L'information est au cœur de la mission de Doctrine, et nous voulons toujours apprendre plus.

Release early, release often and listen to your customers.

Nous croyons au pouvoir de l'itération et à l'importance d'écouter en permanence notre marché, nos client·e·s et leurs problématiques.

Le contexte

Nous sommes actuellement à la recherche d'un.e ingénieur data confirmé pour rejoindre l'une de nos squads et participer à la construction de la première plateforme d'intelligence juridique.

Tu rejoindras une équipe dédiée à l'acquisition, l'enrichissement et la mise à disposition de la donnée juridique dans notre plateforme.

Tu peux trouver des détails sur l'ensemble de la stack sur Github !

A savoir : il n'est pas nécessaire d'avoir une expérience professionnelle dans le domaine du droit, cependant l'envie de s'investir et de monter en compétence dans la compréhension des documents juridique est importante :)

Les missions 🛠

  • Consolider les pipelines de données du périmètre de la squad
  • Concevoir, développer, monitorer et maintenir de nouveaux scripts d'acquisition et de traitement des données en Python pour ajouter de nouveaux contenus dans notre plateforme
  • Assurer la qualité de la donnée et son monitoring
  • Travailler en collaboration avec nos Machine Learning Engineers et experts NLP pour les aider à intégrer leur travail dans le pipeline de données
  • Contribuer à l'évolution de nos outils de pipeline de données (Airflow, Kubernetes, Dask, Amazon S3, PostgreSQL, Terraform, etc...), et faire en sorte d'en tirer le meilleur profit au quotidien
  • Au sein du Chapter Data Engineering, participer à l'élaboration de nos pratiques de modélisation et de traitement des données.
Le profil idéal 👀
  • De bonnes compétences en programmation Python
  • Une expérience des pratiques d'acquisition et de modélisation des données
  • Une bonne connaissance de SQL et du stockage objet
  • Une expérience dans un écosystème cloud (AWS de préférence)
  • L'envie de partager tes connaissances pour participer à la progression de chacun.e
  • La maîtrise de la langue française, car tu seras amené.e à manipuler des données juridiques en français.
joxBox

Join our newsletter to get monthly updates on data science jobs.

joxBox