Job Board
Senior Cloud Data Developer | Développeur.se Cloud de Données Senior
remote
221 Rue de la Commune Ouest 210, Montréal, Québec, Canada, H2Y 2C9
full-time . March 25, 2025
221 Rue de la Commune Ouest 210, Montréal, Québec, Canada, H2Y 2C9
full-time . March 25, 2025
Description
Who are we?
We are a health technology startup building the search and data infrastructure for digital health systems of tomorrow. Our mission is simple, but the environment which we specialize in is complex.
We power enterprise-scale health organizations and healthtech startups to improve and optimize access to health care & support across North America and Europe. At our heart, we are a product & technology driven organization, and we look for people who share our vision leveraging technology to solve and scale some of the most impactful operational challenges in healthcare.
As our team grows, we are looking for an experienced cloud data developer to help us improve our data processing pipelines to enable the development of our health-care specific ML models.
What are we looking for?
A FIT.
We would like the person who joins our team to be someone:
- who gets up in the morning wanting to be better than the day before, and for whom a 7/10 is not "ok";
- who wants to be part of a team and who has passion and collaboration as a must to reach a goal.
Your role
We are looking for a person with a robust background in building or managing data pipelines to provide datasets for training machine learning models. We desire someone who is deeply passionate about data processing and is dedicated to continuously enhancing established processes to support the training of machine learning models. This role is critical for maintaining the standards of data quality and performance required for the development of products suited for dealing with the rigors required by the healthcare environment and ensuring the scalability, reliability and efficiency of our data pipelines.
As a Senior Cloud Data Developer, you will be responsible for:
- Designing secure and efficient processes for ingesting healthcare data from private sources and web-scraped sites.
- Using Spark and Ray for scalable and high-performance distributed data processing, optimized for large healthcare datasets.
- Planning and orchestrating batch data processing workflows using Spark and Ray.
- Configuring infrastructure (EKS, on-premise Kubernetes, Elasticsearch clusters, etc.) to optimize performance and computing costs.
- Maintaining a consistent and efficient data schema based on access patterns across tables. These data schemas continuously evolve as researchers experiment.
- Collaborating with the GRC Lead to ensure data processing complies with regulations and certifications (e.g., GDPR, HIPAA).
- Supporting the NLP research team by developing iterative data cleaning and transformation pipelines to assist in their experiments.
- Implementing security measures such as data encryption, access controls, and anonymization techniques to protect sensitive data.
- Maintaining comprehensive documentation of data processing pipelines, including design decisions, configurations, and workflow dependencies.
- Leading knowledge-sharing sessions within the data engineering team to disseminate best practices, new techniques, and updates.
In terms of skills, you should have:
- Strong programming skills in Python, along with proficiency in SQL.
- Knowledge of data cleaning and quality methodologies.
- Understanding of various data processing paradigms (ETL, ELT, etc.).
- Experience in parallel and distributed data processing (Ray, Spark, Dask, Hadoop, etc.).
- Experience executing parallel computations on GPUs.
- Experience with versioned data lakes (Apache Iceberg).
- Experience with containerization and cloud computing.
- Experience with data orchestration tools (Airflow, Prefect, Dagster, etc.).
- Experience with sensitive and clinical data (a plus)
If you have other skills that you think would be a plus for the team, we are of course very curious to hear from you.
What we have to offer you
- Equity participation via ESOP - more on this below
- 4 weeks of vacation;
- Summer schedules;
- Group insurance from day 1;
- Direct access to a 24/7 online doctor for you and your family through our partner (and client) Dialogue from day 1;
- Employee and Family Assistance Program (EFAP);
- Flexible hours: free to work the hours you are most productive;
- Flexible office: free to work from wherever you want;
- Autonomy, because Hey, you're the specialist;
- Independence of action in a highly collaborative environment;
- High-performance equipment (MacBook Pro with Apple Silicon);
- Camellia Sinensis tea and Montreal roasted coffee for your office time;
- Pet therapy with Clinia's dogs @pico_the_teckle, Cacau, Alaska and Opale;
- Team buildings, 5@7, and team activities.
But also, this:
Moving is important : Clinia fundamentally believes in a balanced, active lifestyle. That's why we decided to offer a bonus ($) for every hour of physical activity you do: hiking, biking, running, climbing - whatever your sport, whatever day of the week, we encourage you to keep going
Clinia for All. We fundamentally believe in sharing the value we create as a team to all team members. As such, we are proud to offer an Employee Stock Option Plan (ESOP) accessible to all full-time team members around the globe.
We also offer the opportunity to :
- Play an essential role in the development of a scaling company;
- Contribute to the development of a product impacting millions across the globe;
- Work with a team of persevering and ambitious people with a true team spirit.
Our approach is simple:
We are a dynamic team that advocates the involvement and equality of everyone in decision-making - we don't say that to be cool, we really believe in it. So we're looking for someone who can use their expertise to help us build a solid future for tomorrow. Do you have the motivation, focus and entrepreneurial spirit to meet this challenge? We're looking for someone like you!
Proudly B Corp Certified, join our team and be part of a company dedicated to making a positive impact on the world. Come grow with us!
Apply now !
*By submitting your application, you consent to share your personal information with Clinia, which will use it to process your application for this job position. Clinia will not use this information for any other purposes than stated above. See our Privacy Policy for more information.
---------
Qui nous sommes?
Nous sommes une startup spécialisée en technologies de la santé qui bâtissons l’infrastructure de recherche et de gestion des données pour les systèmes de santé de demain. Notre mission est simple, mais l'environnement dans lequel nous nous spécialisons est complexe.
Nous aidons les grandes (et moins grandes) organisations de santé à optimiser et à améliorer l'accès aux soins de santé à travers l'Amérique du Nord et l'Europe. Clinia est fondamentalement une compagnie de produits, et cherchons des collègues qui partagent notre vision de miser sur la technologie pour résoudre certains des défis opérationnels les plus importants dans le domaine des soins de santé d’aujourd’hui.
Notre équipe étant en pleine croissance, nous recherchons un développeur.se cloud de données expérimenté.e pour nous aider à améliorer les pipelines de données qui permettent le développement de nos modèles d’intelligence artificielle spécifiques aux soins de santé.
Ce qu’on recherche?
Un FIT.
On aimerait que la personne qui rejoindra notre équipe soit quelqu’un:
- qui se lève le matin en ayant envie d’être meilleur que la veille et pour qui un 7/10 n’est pas « ok ». On cherche aussi quelqu’un qui a envie de faire partie d’une équipe et qui a la passion et la collaboration comme un must pour atteindre un objectif;
- de curieux, capable de nous mettre au défi, de définir de nouvelles solutions et de les mettre en œuvre, de comprendre comment les solutions techniques contribuent à la réalisation d'une vision plus large, et qui a la passion d'interagir avec de nombreuses personnes différentes pour atteindre différents buts.
Ton rôle
Nous recherchons une personne ayant une solide expérience dans la construction ou la gestion de pipelines de données pour fournir des ensembles de données pour l'entraînement de modèles de machine learning. Nous souhaitons quelqu'un qui est profondément passionné par l’orchestration et la transformation de données et qui est dédié à l'amélioration continue des processus établis pour soutenir l'entraînement des modèles d' apprentissage automatique. Ce rôle est essentiel pour maintenir les normes de qualité des données et de performance requises pour le développement de produits adaptés aux rigueurs du secteur de la santé et pour garantir la scalabilité, fiabilité et efficacité de nos pipelines de données.
En tant que Développeur.se Cloud de Données Senior, tu seras porté.ée à:
- Concevoir des processus sécurisés et efficaces pour l'ingestion de données de santé provenant de sources privées et de sites web explorés.
- Utiliser Spark et Ray pour un traitement de données distribué évolutif et performant, optimisé pour les grands ensembles de données de santé.
- Planifier et orchestrer la planification et l'automatisation des tâches de traitement en batch de données en utilisant Spark et Ray.
- Configurer l’infrastructure (EKS, on-premise k8s, ElasticSearch cluster, etc.) pour optimiser la performance et les coûts de computation.
- Maintenir un schéma de données cohérent et performant en fonction des “access patterns” à travers les tables. Ces schémas de données sont en constante évolution au gré des expérimentations des chercheurs.
- Travailler en collaboration avec le Responsable GRC pour s'assurer que le traitement des données est conforme aux réglementations et certifications (par exemple, GDPR, HIPAA).
- Supporter l'équipe de recherche TLN en développant des pipelines de nettoyage et de transformation de données de manière itérative pour soutenir leurs expérimentations.
- Mettre en œuvre des mesures de sécurité telles que le chiffrement des données, les contrôles d'accès et les techniques d'anonymisation pour protéger les données sensibles.
- Maintenir une documentation complète des pipelines de traitement des données, y compris les décisions de conception, les configurations et les dépendances des workflows.
- Faciliter des sessions de partage de connaissances au sein de l'équipe d'ingénierie des données pour diffuser les meilleures pratiques, les nouvelles techniques et les mises à jour.
Côté compétences, tu devrais avoir:
- Solides compétences en programmation Python, ainsi qu'une maîtrise de SQL.
- Connaissance des techniques et méthodologies autour du nettoyage et de la qualité des données.
- Connaissance des différents paradigmes de traitement des données (ETL, ELT, etc.)
- Expérience dans le traitement de données parallèles et distribuées (Ray, Spark, Dask, Hadoop, etc.)
- Expérience en exécution de computation GPU en parallèle.
- Expérience avec les lacs de données versionnés (Apache Iceberg)
- Expérience avec les conteneurs et l'informatique en cloud
- Expérience avec un orchestrateur de données (Airflow, Prefect, Dagster, etc.)
- Expérience avec les données sensibles et cliniques (un atout)
Enfin, comme nous sommes en train de développer le marché américain, tu dois parler et écrire aussi bien français qu’anglais, donc être bilingue.
Si tu as d’autres skills que tu crois seraient un plus à l’équipe, on est bien sûr très curieux de t’entendre.
Ce que nous avons à t’offrir
- Options d’achat d’actions - voir plus bas
- 4 semaines de vacances;
- Un horaire d’été;
- Un accès à nos assurances collectives dès le jour 1 ;
- Un accès direct à un médecin en ligne 24/7 pour ta famille et toi grâce à notre partenaire (et client) Dialogue dès le jour 1 ;
- Un accès à notre programme d'aide aux employés et leurs familles ;
- Des horaires flexibles : libre de travailler aux heures où tu es le plus productif ;
- Un bureau flexible : libre de travailler d’où tu veux ;
- De l’autonomie, parce que Hey, c’est toi le spécialiste ;
- Une indépendance d’action au sein d’un environnement hautement collaboratif;
- Des équipements performants (Macbook) ;
- Du thé Camélia Sinensis et du café torréfié à Montréal pour tes moments au bureau ;
- De la zoothérapie avec les chiens de Clinia: @pico_the_teckle, Alaska et Opale ;
- Des teams buildings, 5@7, et activités d’équipe.
Mais aussi, ceci:
Bouger, c'est important : Clinia croit fondamentalement à un mode de vie équilibré et actif. C'est pourquoi nous avons décidé d’offrir une prime ($) pour chaque heure d'activité physique que tu feras : randonnée, vélo, course à pied, escalade - quel que soit ton sport, quel que soit le jour de la semaine, on t'encourage à continuer !
Clinia pour tous. Nous croyons fondamentalement qu'il faut partager la valeur que nous créons en tant qu'équipe avec tous les membres de l'équipe. C'est pourquoi nous sommes fiers d'offrir un plan d'options d'achat d'actions accessible à tous les membres de l'équipe à temps plein dans le monde entier.
On offre aussi l’opportunité :
- de jouer un rôle essentiel dans le développement d'une entreprise d’impact ;
- de contribuer au développement d’un produit utilisé par des millions de patients au Canada ;
- de travailler avec une équipe de personnes persévérantes et ambitieuses avec un véritable esprit-d'équipe.
Notre approche est simple :
Nous sommes une jeune équipe dynamique qui prône l’implication et l’égalité de chacun dans la prise de décision - on ne dit pas ça pour être cool, on y croit vraiment. Nous cherchons donc une personne qui saura mettre son expertise à profit pour nous aider à bâtir un solide futur pour demain.
Tu as la motivation, le focus et l’esprit entrepreneurial pour relever ce défi ? Nous cherchons quelqu'un comme toi !
Fièrement certifié B Corp, rejoignez notre équipe et faites partie d'une entreprise qui s'engage à avoir un impact positif sur le monde. Venez grandir avec nous !
Applique maintenant !
*En soumettant votre candidature, vous consentez à partager vos informations personnelles avec Clinia, qui l’utilisera pour traiter votre candidature pour ce poste. Clinia n’utilisera cette information à aucune autre fin que celle indiquée plus haut.
Voir notre Politique de Confidentialité pour plus d’information.
Compensation
$115,000.00 - $129,975.00 per year