Ingénieur·e SRE / Site Reliability Engineer

Montréal, Québec, Canada

Site Reliability Engineer DevOps Engineer Platform Engineer Operations Engineer

Actively hiring

Ingénieur·e SRE / Site Reliability Engineer

mthree

Montréal, Québec, Canada

Site Reliability Engineer DevOps Engineer Platform Engineer Operations Engineer

mthree

Actively hiring

hackajob is partnering with mthree to fill this position. Create a profile to be automatically considered for this role—and others that match your experience.

**English version below**

Doit être local à Montréal

Vous souhaitez travailler dans le domaine de la technologie au sein d'une banque d'investissement?

Nous recherchons une personne pour rejoindre une équipe dynamique en tant qu’

Ingénieur·e Fiabilité de Site (Site Reliability Engineer)

pour l’un de nos clients. Le

Site Reliability Engineering (SRE)

est une discipline orientée production, axée sur l’amélioration de la disponibilité des services systèmes, de l’observabilité, de l’évolutivité, de la performance et de la fiabilité des produits technologiques, en appliquant de solides principes d’ingénierie logicielle et en adoptant les technologies et outils les plus récents.

Nous serions ravis de vous rencontrer si vous :

Vous intéressez aux systèmes distribués et au travail sur des services hautement évolutifs, fiables et à grande échelle.
Aimez évoluer dans un environnement dynamique et n’avez pas peur de changer les choses pour les améliorer.
Appréciez les nouveaux défis technologiques et la résolution de problèmes complexes.
Croyez qu’une équipe qui collabore efficacement est véritablement plus intelligente que la personne la plus brillante qui la compose.
Aspirez à évoluer en tant que personne, coéquipier·e et ingénieur·e.
Faites preuve de détermination, de motivation et d’un profond sens des responsabilités.

À propos de mtrois :

Depuis 2010, mtrois aide ses clients à résoudre leurs défis commerciaux et technologiques. Nous sommes une société de conseil en technologie et en affaires avec une main-d'œuvre mondiale qui réalise des projets commerciaux et informatiques significatifs dans certaines des plus grandes organisations de services financiers du monde.

Services principaux

Consulting et Conseil
Services gérés
Programme de diplômés Alumni
Programme Alumni Pro

Nous avons une présence mondiale et sommes experts dans la fourniture d'une qualité exceptionnelle à notre base de clients, offrant des services de conseil dans les domaines du risque, de la réglementation et de la conformité ; Produits des fournisseurs ; Support d'application ; Développement d'application ; Cyber et sécurité de l'information ; Science des données et DevOps.

Notre programme Expert offre aux professionnels expérimentés l'accès à des rôles de premier plan dans la technologie, la finance, l'aviation et l'assurance. Rejoignez-nous pour travailler sur des projets technologiques révolutionnaires, des plateformes de trading internationales aux applications critiques pour les principales compagnies aériennes. Nous recrutons des professionnels désireux de faire progresser rapidement leur carrière dans la technologie ou les opérations au sein d'organisations mondiales prestigieuses.

Responsabilités :

Travailler en étroite collaboration avec les équipes d’ingénierie et de développement pour concevoir, construire et maintenir des systèmes, tout en les conseillant sur le choix des produits, la conception des schémas et l’optimisation des requêtes.
Diagnostiquer et résoudre des problèmes à travers l’ensemble de la stack : matériel, logiciel, application et réseau.
Identifier et piloter les opportunités d’amélioration de l’automatisation de nos plateformes ; définir et créer des automatisations pour le déploiement, la gestion et la visibilité de nos services.
Identifier de manière proactive les risques liés à la fiabilité des systèmes et y remédier.
Représenter l’organisation RPE lors des revues de conception et des exercices de préparation opérationnelle pour les services nouveaux et existants.
Travailler aux côtés des membres des équipes mondiales et régionales existantes selon un modèle de suivi en continu (“follow‑the‑sun”).
Participer à la rotation d’astreintes ainsi qu’aux appels périodiques avec des spécialistes situés dans d’autres fuseaux horaires.

Compétences Requises :

Formation en informatique équivalente à un diplôme de niveau licence (B.Sc.), ou expérience pratique équivalente.
Doit impérativement avoir une expérience avec Kubernetes et la gestion d’applications conteneurisées.
Expérience avérée en automatisation, notamment via des langages de script tels que Python, Bash ou Perl. La maîtrise d’au moins un langage de plus haut niveau est souhaitée.
Expérience du support d’architectures trois tiers, incluant une exposition aux plateformes UNIX/Linux et aux bases de données telles qu’IBM DB2, Sybase, MongoDB, GreenPlum, etc.
Expérience avec les dépôts de code source et binaires, les outils de build et CI/CD (Git, Artifactory, Jenkins, Docker), ainsi qu’avec des technologies de streaming de données comme Spark ou Kafka.
Maîtrise des outils d’entreprise tels que Grafana, Dynatrace ou AppDynamics.
Connaissance et compréhension des architectures logicielles et systèmes modernes : load balancing, file d’attente, caching, modes de défaillance des systèmes distribués, microservices, etc.
Solide compréhension des concepts liés au système d’exploitation (processus, allocation mémoire, stack réseau), de leurs impacts sur les applications, et capacité à en effectuer le débogage.
De manière générale, une expérience pratique dans l’exploitation de systèmes en ligne à grande échelle constitue un avantage certain.

Chez mtrois, nos valeurs soutiennent des coéquipiers courageux, des moteurs d'aiguilles et des champions de l'apprentissage tout en s'efforçant de soutenir la santé et le bien-être de tous les employés. Nous sommes très fiers de célébrer la diversité de chaque individu qui contribue à faire de mtrois l'entreprise qu'elle est aujourd'hui et sera à l'avenir. Nous valorisons la diversité tant au sein de mtrois qu'avec nos entreprises partenaires, et nous sommes fiers de fournir un environnement où tous nos collègues peuvent s'épanouir. Cela signifie promouvoir une forte culture d'égalité mais, surtout, d'inclusion.

Les candidats doivent être actuellement autorisés à travailler au Canada à temps plein. L'entreprise ne parrainera pas les candidats pour des visas de travail

**English Translation**

**Must be local to Montreal**

Want to work in technology at an investment bank?

We are looking for someone to be a part of a dynamic team as a Site Reliability Engineer for one of our clients. Systems Reliability Engineering (SRE) is a production-oriented discipline focused on improving system service availability, observability, scalability, performance, and reliability for technology products by applying sound software engineering principles and adopting the latest technology and tooling.

We would like to talk to you if you:

Are interested in distributed systems and working with high scale scalable and reliable services.
Like to work in a fast-moving environment and you aren't afraid to change things to make them better.
Enjoy new technological challenges and solving hard problems.
Believe that a team working well together is truly smarter than the single smartest person on that team.
Aspire to grow as a person, as a teammate, and as an engineer.
Have Grit, drive and a deep feeling of ownership.

About mthree:

Since 2010, mthree has been helping clients solve their business and technological challenges. We are a technology and business consultancy with a global workforce delivering significant business and IT projects in some of the largest financial services organizations worldwide.

Core Services
Consulting and Advisory
Managed Services
Alumni Graduate Program
Alumni Pro Program

We have a global presence and are experts in delivering exceptional quality to our client base, providing consulting services across Risk, Regulation & Compliance; Vendor Products; Application Support; Application Development; Cyber & Information Security; Data Science and DevOps areas.

Our Expert program offers experienced professionals access to top roles in tech, finance, aviation and insurance. Join us to work on groundbreaking technology projects, from international trading platforms to critical applications for leading airlines. We recruit professionals who are eager to fast-track their careers in technology or operations within prestigious global organizations.

Responsibilities:

Working closely with engineering/development teams to design, build, and maintain systems and help them decide on products to use, schema design and query tuning.
Troubleshoot issues across the entire stack: hardware, software, application and network.
Identifying and drive opportunities to improve automation for our platforms; scope and create automation for deployment, management and visibility of our services.
Proactively identifying and addressing systems reliability risks.
Represent the RPE organization in design reviews and operational readiness exercises for new and existing services.
Working alongside existing global and regional team members on a follow-the-sun basis.
Participate in on-call rotation and periodic conference calls with other specialists from other time zones.

Skills Required:

Background in Computer Science equivalent to a B.Sc. Equivalent practical experience is a reasonable substitute.
Must have experience with kubernetes and management of containerized applications
Automation-related experience is particularly valued using scripting languages such as python, bash, Perl. One higher level language is desired.
Experience on supporting three tier architecture which includes exposure to UNIX, Linux platforms and databases such IBM DB2, Sybase, Mongo, GreenPlum etc.
Experience with source code and binary repositories, build tools, and CI/CD (Git, Artifactory, Jenkins, Docker) etc and data streaming technologies like Spark, Kafka etc.
Hands on experience on enterprise tools set such as Grafana, Dynatrace, AppDynamics etc.
Awareness of, and ability to reason about modern software & systems architectures, including load-balancing, queueing, caching, distributed systems failure modes, micro services etc
Deep understanding of operating system level concepts such as processes, memory allocation, and the network stack; understanding of how applications are affected by the above, and ability to debug same.
Generally speaking, practical experience running large scale online systems is always an advantage.

At mthree, our values support courageous teammates, needle movers, and learning champions all while striving to support the health and well-being of all employees.  We take great pride in celebrating the diversity of each individual who contributes to making mthree the company it is today and will be in the future. We value diversity both within mthree and with our partner companies, and we're proud to provide an environment where all our colleagues can flourish. That means promoting a strong culture of equality but, most importantly, inclusion.

Applicants must be currently authorized to work in Canada on a full-time basis. The Company will not sponsor applicants for work visas.

hackajob is partnering with mthree to fill this position. Create a profile to be automatically considered for this role—and others that match your experience.

Upskill

Level up the hackajob way. Verify your skills, learn brand new ones and test your ability with Pathways, our learning and development platform.

Find out more

Ready to reach your potential?

Find out more

Platform

Customers

Solutions

Resources

Ingénieur·e SRE / Site Reliability Engineer

Montréal, Québec, Canada

Actively hiring

Ingénieur·e SRE / Site Reliability Engineer

mthree

Montréal, Québec, Canada

mthree

Actively hiring

Upskill

Ready to reach your potential?