Senior Site Reliability Engineer

Salary: 800 - 1500 百万円

AWSAzureKubernetes

Minimum year of experience: 2

dotData

職種 / 募集ポジション

Senior Site Reliability Engineer

ポジション概要

このポジションでは、クラウドインフラ・データ分析基盤に深い知見を持つプロダクトマネージャーおよび、製品開発チームのリーダー陣と協力しながら、製品やサービスに求められる可用性、信頼性、セキュリティなど要件および仕様を明確にし、システムアーキテクチャを漸進的に進化させたり、最新のテクノロジーをフル活用して運用の自動化・効率化を行い、継続的な運用改善を担当していただきます。

中長期には、エンジニアリングマネージャーとして組織面でチームをリードする役割や、スタッフエンジニアとして技術面でチームや開発チーム全体をリードする役割、プロダクトマネジメント領域への進出など、様々な役割に挑戦できるチャンスがあります。

業務内容

  • dotData が開発するデータ分析/機械学習/AI関連製品のSaaS版であるdotData Cloudの設計/開発/運用をSite Reliability Engineer (SRE) としてリード
  • マルチクラウド (AWS/Azure) かつマルチリージョン (日本/米国) の環境で、数百台規模のクラスタを運用
  • システム運用に関するテスト、デプロイ、モニタリング、アラート、メンテナンスの自動化のためのソフトウェアを開発

必須スキル/経験

  • テックリードもしくはエンジニアリングマネージャー相当の業務経験2年以上
  • パブリッククラウド(AWS, Azure, Google Cloudなど) 上でのインフラ設計・構築・運用経験
  • AWS CDK / Bicep などの構成管理ツールを利用したシステム構築・運用経験
  • Amazon CloudWatch / Azure Monitor などのモニタリング基盤の構築・運用経験
  • Kubernetes の構築・運用経験
  • Linux、Web、DBなどのトラブルシューティング経験
  • 業務レベルの日本語での読み書きおよび会話スキル

歓迎スキル/経験

  • Webアプリケーションやクラウドインフラのセキュリティに関する知見
  • データ基盤、データ分析、機械学習に関する製品開発や運用経験
  • 不確実性が高くても前向きに業務を遂行する姿勢
  • チームビルディング(採用や育成、コーチング)経験
  • 非同期コミュニケーション中心のリモートワークでの勤務経験
  • 業務レベルの英語のコミュニケーションスキル

テクノロジーについて

現在のところ、以下のようなテクノロジーやツールを活用して開発しています。

  • クラウド環境: AWS, Azure
  • 構成管理ツール: CloudFormation or CDK for AWS, Bicep for Azure
  • 運用自動化: Python
  • CI: GitHub Actions
  • コラボレーションツール: Google Workspace, Slack, GitHub, Jira, Confluence

チームについて

現在、クラウドインフラ・データ分析基盤に深い知見を持つプロダクトマネージャー(Director of Engineering と兼務)、3名のSRE、1名のSRE(他業務と兼務)でチームを組んでいます。全メンバーが日本語話者ですが、英語の方が得意なメンバーもおり、他のメンバーとのコミュニケーションは必要に応じて英語を使用します。

魅力ポイント

  • キャリアのハイライトになる開発プロジェクトへの参画機会
  • AWS/Azure/Databricks/Snowflake など幅広くプラットフォームを学べる環境
  • フルリモートワークおよびフレックスタイム制での勤務
  • 自宅で仕事に集中できる環境作り予算
  • 年間自己開発予算(技術カンファレンス参加費用、技術書籍代などの補助)
  • 第二外国語の学習支援(オンライン英会話費用の補助)
  • 米国シリコンバレーやポーランド・ワルシャワへの出張機会
  • 副業、兼業OK

雇用形態

正社員

給与

年収 8,000,000円 〜 15,000,000円

※ストックオプションあり ※業務委託の場合、時給: 8000円-10000円

勤務地

フルリモートOK。