Senior Site Reliability Engineer
Salary: 800 - 1500 百万円
AWSAzureKubernetes
Minimum year of experience: 2
dotData職種 / 募集ポジション
Senior Site Reliability Engineer
ポジション概要
このポジションでは、クラウドインフラ・データ分析基盤に深い知見を持つプロダクトマネージャーおよび、製品開発チームのリーダー陣と協力しながら、製品やサービスに求められる可用性、信頼性、セキュリティなど要件および仕様を明確にし、システムアーキテクチャを漸進的に進化させたり、最新のテクノロジーをフル活用して運用の自動化・効率化を行い、継続的な運用改善を担当していただきます。
中長期には、エンジニアリングマネージャーとして組織面でチームをリードする役割や、スタッフエンジニアとして技術面でチームや開発チーム全体をリードする役割、プロダクトマネジメント領域への進出など、様々な役割に挑戦できるチャンスがあります。
業務内容
- dotData が開発するデータ分析/機械学習/AI関連製品のSaaS版であるdotData Cloudの設計/開発/運用をSite Reliability Engineer (SRE) としてリード
- マルチクラウド (AWS/Azure) かつマルチリージョン (日本/米国) の環境で、数百台規模のクラスタを運用
- システム運用に関するテスト、デプロイ、モニタリング、アラート、メンテナンスの自動化のためのソフトウェアを開発
必須スキル/経験
- テックリードもしくはエンジニアリングマネージャー相当の業務経験2年以上
- パブリッククラウド(AWS, Azure, Google Cloudなど) 上でのインフラ設計・構築・運用経験
- AWS CDK / Bicep などの構成管理ツールを利用したシステム構築・運用経験
- Amazon CloudWatch / Azure Monitor などのモニタリング基盤の構築・運用経験
- Kubernetes の構築・運用経験
- Linux、Web、DBなどのトラブルシューティング経験
- 業務レベルの日本語での読み書きおよび会話スキル
歓迎スキル/経験
- Webアプリケーションやクラウドインフラのセキュリティに関する知見
- データ基盤、データ分析、機械学習に関する製品開発や運用経験
- 不確実性が高くても前向きに業務を遂行する姿勢
- チームビルディング(採用や育成、コーチング)経験
- 非同期コミュニケーション中心のリモートワークでの勤務経験
- 業務レベルの英語のコミュニケーションスキル
テクノロジーについて
現在のところ、以下のようなテクノロジーやツールを活用して開発しています。
- クラウド環境: AWS, Azure
- 構成管理ツール: CloudFormation or CDK for AWS, Bicep for Azure
- 運用自動化: Python
- CI: GitHub Actions
- コラボレーションツール: Google Workspace, Slack, GitHub, Jira, Confluence
チームについて
現在、クラウドインフラ・データ分析基盤に深い知見を持つプロダクトマネージャー(Director of Engineering と兼務)、3名のSRE、1名のSRE(他業務と兼務)でチームを組んでいます。全メンバーが日本語話者ですが、英語の方が得意なメンバーもおり、他のメンバーとのコミュニケーションは必要に応じて英語を使用します。
魅力ポイント
- キャリアのハイライトになる開発プロジェクトへの参画機会
- AWS/Azure/Databricks/Snowflake など幅広くプラットフォームを学べる環境
- フルリモートワークおよびフレックスタイム制での勤務
- 自宅で仕事に集中できる環境作り予算
- 年間自己開発予算(技術カンファレンス参加費用、技術書籍代などの補助)
- 第二外国語の学習支援(オンライン英会話費用の補助)
- 米国シリコンバレーやポーランド・ワルシャワへの出張機会
- 副業、兼業OK
雇用形態
正社員
給与
年収 8,000,000円 〜 15,000,000円
※ストックオプションあり ※業務委託の場合、時給: 8000円-10000円
勤務地
フルリモートOK。