SRE Engineer

Salary not provided

KubernetesAzureGCPShellPythonGrafanaNagiosAWS

Minimum year of experience: 3

ExaWizards

職務内容

Business content / 業務内容

As a Site Reliability Engineer, you will be responsible for developing solutions, implementing requirements, assisting in creating key processes and procedures, that facilitate product planning, execution and delivery. We aim to solve society's issues with AI, so our mission is to solve the Engineering Department's issues!

SREとして、製品の計画、実行、および配信を容易にするための主要なプロセスや手順の作成を支援し、要件の実装と課題解決を担当します。私たちはAIを用いて社会の問題を解決することを目指しているので、私たちのミッションはエンジニアリング部門の課題を解決することです。

Detail / 詳細

  • Participate in the design, implementation, and management of scalable and reliable product infrastructure solutions in public cloud environments (e.g., AWS).

  • Responsible for the development and maintenance of Kubernetes clusters, ensuring optimal performance, availability, and security.

  • Collaborate with development teams to provide expertise in designing architecture, act as a trusted advisor for development teams, provide consultations on infrastructure-related matters and guide them toward effective and scalable solutions.

  • Design and implement CI/CD pipelines for automated code building, testing, and deployment.

  • Monitor system performance, troubleshoot complex issues, and implement proactive measures to ensure high availability and reliability.

  • Participate in incident response and resolution, conducting post-mortem analyses to identify areas for improvement.

  • AWSなどのパブリッククラウド環境におけるスケーラブルで信頼性の高いインフラストラクチャソリューションの設計、実装、および管理

  • Kubernetesクラスターの開発および保守を担当し、最適なパフォーマンス、可用性、およびセキュリティを確保

  • 開発チームと協力してアーキテクチャ設計の専門知識を提供し、開発チームの信頼できるアドバイザーとしてインフラ関連のコンサルティングを行い、効果的でスケーラブルなソリューションへ導く

  • 自動コードビルド、テスト、およびデプロイメントのためのCI/CDパイプラインを設計および実装

  • システムパフォーマンスを監視し、複雑な問題をトラブルシューティングし、高可用性と信頼性を確保するための積極的な対策を実施

  • インシデント対応と解決に参加し、改善点を特定するための事後分析を実施

Techstack / 技術スタック

  • Cloud platform: AWS, Azure, GCP

  • Container orchestration: Kubernetes, ECS

  • Infrastructure as Code: terraform

  • CI/CD: GitHub Actions, ArgoCD

  • Observability: Datadog

What you ca gain / 本ポジションを通して得られる経験

  • As part of a team with many international members, there are opportunities to utilize your language skills and to grow.

  • You can be involved in various phases of the product lifecycle, from infrastructure design to post-release monitoring and operations (0→1, 1→10, etc.).

  • You will have the opportunity to work with industry-leading platform technologies and gain deep insights into cloud infrastructure through the experience of building best practice infrastructure environments.

  • 海外メンバーが多く在籍しているチームのため、語学力を活かしたり、成長できる機会があります

  • インフラ設計からリリース後のモニタリングや運用に至るまで、製品ライフサイクル(0→1、1→10等)の様々なフェーズに関わることが可能です

  • 業界最先端のプラットフォーム技術を扱い、ベストプラクティスなインフラ環境を構築する経験を通して、クラウドインフラに関する深い知見を得られることが可能です

応募資格(必須)

  • Familiarity with at least one cloud platform (i.e. GCP, AWS, Azure, etc...)

  • Experience in designing and implementing scalable cloud-based solution architectures

  • Strong expertise in infrastructure-as-code solutions such as Terraform

  • Strong operational expertise in containerization technologies, especially Kubernetes

  • Knowledge of source control, CI/CD, infrastructure automation, orchestration, deployment automation and configuration management

  • Bi-lingual (business English & Japanese daily conversation or English daily conversation & Japanese native)

  • While our team is mostly english-speaking, you should be comfortable enough talking in Japanese with other internal stakeholders

  • GCP, AWS, Azureなどのクラウドプラットフォームの利用経験

  • スケーラブルなクラウドベースのソリューションの設計・実装の経験

  • Terraformなどのinfrastructure as codeの専門知識

  • Kubernetesに関する深い知識・運用経験

  • ソース管理, CI/CD, インフラストラクチャー自動化, オーケストレーション, デプロイ自動化、構成管理に関する知識

  • 言語スキル(ビジネス英語・日本語日常会話 または 英語日常会話・日本語ネイティブ のいずれか)

  • チーム内言語は主に英語となりますが、社内関係部門と日本語でコミュニケーションをとることが求められます。

応募資格(歓迎)

  • AWS Solutions Architect certifications or knowledge on par with those

  • Kubernetes development experience, such as creation of in-house Helm charts

  • Familiar with scripting languages (Shell, Python, Golang)

  • Familiar with extended infrastructure-related tooling such as Ansible or Chef

  • Experience in working with large software systems developed on Unix/Linux

  • Experience of working with monitoring and metrics systems (e.g Collectd, Grafana, Nagios, etc.)

  • Experience in working closely together with development, product and business teams

  • Knowledge of web application security and best practices

  • AWS認定ソリューションアーキテクト または 同等の知識

  • Kubernetesの開発経験

  • Shell, Python, Golang などのプログラミング言語の経験

  • Ansible, Chefなどの拡張インフラ関連ツールの経験

  • Unix/Linux上で開発された大規模なソフトウェアシステムの運用経験

  • Collectd, Grafana, Nagiosなどを用いたモニタリング、及びメトリクス管理の経験

  • Engineering, Product, Businessチームなどと連携しながら業務を進めた経験

  • ウェブアプリケーションのセキュリティに関する知識

求める人物像

You are comfortable at explaining complex recommendations to engineering and infrastructure teams, while discussing technical trade-offs in product development with other work colleagues. You are highly resourceful, analytical, and have a combination of focus, flexibility, self-motivation, and integrity.

Our team values communication with candor (openness, frankness, honesty) and the 4 Agile Values to ensure everybody can grow and progress together as well as support the company's CREDO and values, and you are comfortable to work in such an environment.

Engineering, Infrastructureチームなどとプロダクト開発における技術的課題を議論しながら、複雑な提案を分かりやすく説明できる方

柔軟性, 論理的思考, 自発性, 誠実さを持っている方

私たちのチームは、会社の理念やバリューに貢献しながら、チーム全員が切磋琢磨し成長していくため、オープンで率直なコミュケーションとアジャイルの価値観を重視しています。とても働きやすい環境です。

賃金

年収 600万円 ~ 1080万円

  • 月収:年収の12分割分を支給

  • 月収下限50万円(基本給369,930円、みなし残業代45時間分として130,070円)

  • 月収上限90万円(基本給621,510円、みなし残業代45時間分として218,490円)

  • 45時間を超える時間外労働分の割増賃金は追加で支給

※経験・能力、希望を考慮の上、当社規定により決定

※業務の内容に応じて、フレックス/裁量労働制または管理監督者としての勤務形態を適応