Staff Research Engineer, 2D/3D Vision & Multimodal Understanding / キャディ株式会社
Salary: 1200 - 2500 百万円
Staff Research Engineer, 2D/3D Vision & Multimodal Understanding
職務内容
募集背景
私たちは「モノづくり産業のポテンシャルを解放する」というミッションのもと、製造業における非効率を解消し、お客様の重要な意思決定を支援するSaaSプロダクトを開発しています。AI技術の進化により汎用モデルのコモディティ化が加速する中、中長期的な競争優位性を築くためにも、製造業特有のデータ(図面、3D CAD、仕様書、見積、不具合実績など)を高度に認識・理解し、マルチモーダルな分析・推論する独自基盤の戦略的な重要度が増しています。本ポジションでは、最先端の研究水準を追求しながらも「研究」に閉じず、自らの手でPoCや実データでの価値検証を牽引し、数兆円規模の巨大産業にブレイクスルーをもたらす要素技術の研究開発を行うResearch Engineerを募集します。
業務内容
このポジションのミッション
「図面・3D CAD・テキスト等の多種多様な製造業データを統合的に理解・対応付けできる独自のAI基盤を研究・実装し、設計レビューや品質判断といった顧客の重要な意思決定の質を劇的に向上させること」
※半年〜1年程度の研究開発計画における意思決定と成果責任を担い、要素技術の開発にとどまらず、自ら適切な研究のスコープを定義し、プロトタイプ実装、PoC、実データ上での価値検証までを一気通貫でリードしていただきます。アウトプットの一形態として論文執筆等の学術的貢献も推奨しますが、本ポジションにおける最大のミッションは「生み出した研究成果を、PdMやエンジニアとの連携を通じて事業価値へ接続すること」にあります。
このポジションの業務例
- 業務例1:3D幾何形状の詳細な認識と2D/3D統合モデリング
汎用AIでは捉えきれない、製造業特有の複雑な幾何情報(2D/3D)の深い理解と表現学習に取り組みます。3Dデータから製造・設計上意味を持つ局所的な特徴を抽出し、幾何的・意味的側面を統合するモデリングや、図面上の多様な要件(寸法、公差、注記等)を3D空間の要素と高度に対応付けるための基盤技術の研究開発をリードしていただきます。 - 業務例2:製造業特化のVLM改善とマルチモーダル基盤構築
図面や3D CAD、テキスト(仕様書や不具合報告等)を横断して検索・推論するためのマルチモーダル埋め込みモデルを開発します。また、既存の汎用VLMが抱える言語偏重のバイアスを解消し、図面上の微細な記号や空間的な配置を正確に推論するための独自ベンチマークの継続拡張や、類似図面検索・寸法漏れ検出モデルの継続的な性能改善(Post pre-training等を含む)を担当します。 - 業務例3:研究成果の事業実装とPoC検証による価値創出
開発した2D/3D認識技術を活用し、実際の業務課題(例:特定の局所形状に起因する不具合リスクの予測や、コスト増加箇所の特定など)に対するモデル学習とPoCを推進します。PM、ソフトウェアエンジニア、ドメインエキスパートと密に連携し、「モデルの精度検証」にとどまらず、顧客の意思決定の質向上や業務時間短縮といった具体的な事業価値へと繋げる製品化の橋渡しを行います。その際、推論やデータ作成にかかるコスト・予算を考慮した費用対効果の高い技術選定や、研究開発におけるリスクマネジメント(代替プランの検討等)も主導します。
得られる経験
- 巨大産業の進化を後押しするドメイン特化AIの探求:製造業という数兆円規模の産業を舞台に、現場の深い知見とAIを掛け合わせることで、汎用AIでは解けない複雑な課題に向き合い、モノづくり産業のポテンシャル解放を牽引する要素技術の研究開発する経験
- 2D/3D・マルチモーダル領域における技術的Moatの構築:既存のLLM/VLMの応用にとどまらず、2D/3D Vision単体の深い独自基盤開発から、B-Rep等の幾何情報・NLP・表データを統合したマルチモーダル理解の技術開発まで、世界水準の技術的優位性を自らの手で築く経験
- 研究から価値検証までを一気通貫で牽引するキャリア:「面白い研究」で終わらせず、研究開発からPoC、実データ上での価値検証までを最速でリードし、PdMやエンジニアへの橋渡しを通じて確実な事業価値創出へと繋げるエキスパートとしての経験
- ゼロベースでの研究戦略・評価基盤・学術連携の設計:前例のない課題に対する研究ロードマップの策定や、監査可能な独自の評価規格(ベンチマーク)の構築、および産学連携を通じた学術的貢献を主導する経験
チームについて
Research Engineerが所属するResearchチームは、高度なAI技術に対する専門性から中長期的な影響を与え、全社の技術的優位性(Moat)構築を牽引するためのチームです。
応募資格
応募資格(必須)
- AI/ML領域における高い専門性:機械学習、2D/3D Vision、NLP、マルチモーダル理解等の主軸となる分野におけるトップ国際会議の採択経験相当の高い専門性を持ち、最新論文を読み解き、実課題に合わせて再構成・実装へ落とし込めること
- 事業課題の解決と価値検証の経験:曖昧なビジネス課題に対して適切な問題設定を行い、コスト・予算やリスクを考慮しながら、機械学習・統計モデルの継続的な精度改善を通じて課題を解決した実務経験
- 再現性とスケーラビリティを担保できるエンジニアリング力:Pythonを中心とした実装力(実験・評価・API化)に加え、GPU環境でのデータ処理、Docker等コンテナ技術、Git、CI/CD、クラウドを活用した開発経験
- ステークホルダーを巻き込むコミュニケーション力:非研究者(PdMやソフトウェアエンジニア等)と対話し、高度な技術を分かりやすく翻訳しながら意思決定をリードし、複数チームにまたがるプロジェクトを推進できる能力
応募資格(歓迎)
- 製造業ドメインおよび固有データに関する深い知見:製造業ドメインの知識、または3D CAD、B-Rep、GD&T、PMI、図面理解、OCR、VLM等の技術開発経験
- 卓越した研究・技術実績:関連分野のトップカンファレンス・学術誌での論文採択、Kaggle等での上位入賞、特許取得、主要OSSへの貢献実績
- MLOpsおよびデータ基盤の実運用経験:Vertex AI等を用いた機械学習パイプラインの開発、継続的デリバリー、Data-centricなアプローチによるデータ品質向上施策の実施経験
- リーダーシップ:MLプロジェクトのマネジメント、またはMLチームのリード経験
- 周辺領域の高度な開発経験:CUDA等を用いたGPU処理の最適化、分散処理アーキテクチャの開発・運用、またはWebサービス(フロントエンド/バックエンド)の開発経験
求める人物像
- キャディのミッション「モノづくり産業のポテンシャルを解放する」に共感する方
- 研究開発と事業の両方に高い基準を持てる方(「モデルの精度が上がった」で満足せず、「事業価値にどう繋がったか」までを常に追求できる方)
- プロダクトの課題と優先度を理解し、事業利益を最大化するための技術的・研究的意思決定ができる方
- 未知の技術や新しい領域に対して、貪欲に学び挑戦し続ける姿勢がある方
- 表面的な事象にとらわれず本質的な課題に向き合い、当事者意識をもって解決に向けた行動ができる方
- 変化が速く不確実性の高い状況においても、前向きな姿勢と建設的な議論を通じて業務を推進できる方
- 相手のコンテキストや解像度に配慮し、他者をリスペクトする姿勢でコミュニケーションができる方
給与
- 入社時年俸は1,200万円~2,500万円程度を想定
- 昇給年2回
- 年収を12で割った金額を月額固定給として支給
- ストックオプション制度あり
開発環境
言語
- フロントエンド:TypeScript
- バックエンド:Rust, TypeScript, Python
フレームワーク・ライブラリ
- フロントエンド:React, Next.js, WebGL, WebAssembly
- バックエンド:Rust (axum), Node.js (Express, Fastify, NestJS), PyTorch
インフラ
- Google Cloud, Google Kubernetes Engine, Anthos Service Mesh
データベース・データウェアハウス
- CloudSQL(PostgreSQL), AlloyDB, Firestore, BigQuery
API
- GraphQL, REST, gRPC
監視・モニタリング
- Datadog, Sentry, Cloud Monitoring
環境構築
- Terraform
CI/CD
- Github Actions
認証
- Auth0
開発ツール
- Claude Code, GitHub, GitHub Copilot, Figma, Storybook
コミュニケーションツール
- Slack, Discord, JIRA, Miro, Confluence
※特に関係するものを太字にしています
採用フロー
- カジュアル面談(希望された場合)
- 書類選考
- 技術課題(オンラインのコーディングテスト)
アルゴリズムの知識や回答のスピードよりも、コードを通して「一緒に開発をすすめていくイメージが持てそうか」を重視しています。 - 人事面談
選考要素はなく、条件面等のすり合わせや選考を受けるにあたっての疑問解消の場となります - 技術面接(エンジニア)
- 最終面接(CTO小橋)
- オファー面談
※状況により、追加の面接・面談をご相談する場合もございます。
※ご希望に応じて、選考途中でも社員とのカジュアル面談をセットいたします。ご相談ください。
※応募~内定は1カ月程度が平均的ですが、お急ぎの場合はご相談ください。
募集要項
働き方
働く場所について
- 現状、週1〜3日の出社をベースとした運用
- 都心近郊在住者:週1〜3日程度(プロジェクト状況やフェーズにより変動)
- 遠方・地方在住者:月1〜2回程度の出張ベースでの出社(東京または大阪オフィス)
- アーキテクチャの大規模変更時など、対面でのコミュニケーションが重要な局面では一時的に出社頻度が高まる場合有
- 今後も状況に応じて勤務形態や出社ルールを柔軟にアップデート予定
働く時間について
- フレックスタイム制(コアタイム11:00~16:00)
- ※働き方に関するご質問がございましたら、採用プロセスの中でお気軽にご相談ください。
オフィス所在地
- 東京都台東区浅草橋4-2-2D'sVARIE浅草橋ビル 総合受付:6階
- JR浅草橋駅西口から徒歩2分・馬喰町駅から徒歩8分
雇用形態
- 正社員
- 試用期間3ヵ月(この間の給与・待遇等に変わりはありません)
休日
- 完全週休2日制(土日祝)
- 年次有給休暇(入社6カ月経過後)・入社時特別有給(3日間)
- 夏季休暇(3日間、7~9月で自由に取得可能)
- 年末年始休暇(6日間)
- 看護・介護休暇(年間4日間まで)※ペットも対象
- リフレッシュ休暇(勤続5年ごとに連続5日)
- 慶弔休暇
手当・福利厚生
各種手当
- 交通費実費支給
- 通勤手当実費支給
- 子ども手当(18歳以下の扶養家族1人につき1.5万円/月)
社員同士の交流支援
- 部活動支援費(1活動1500円/1名)
- Teaming Offsite費用補助(5,000円/1名、四半期1回まで)
- チーム内交流の食事代補助(2,000円/1名、月1回まで)
- 異なるチーム同士の交流の食事代補助(3,000円/1名、月1回まで)
成長サポート
- サーバー代補助(1万円/月まで、エンジニアが対象)
- 書籍購入支援
- 外部研修受講費支給
ライフイベント・ファミリー支援
- 育児休業・介護休業(試用期間終了後から取得可能)
- 結婚お祝い金(5万円)、出産お祝い金 (10万円)
- 引っ越し補助金
その他
- 社会保険完備(雇用・労災・健康・厚生年金)
- PC支給
- 健康診断・婦人科検診費用全額補助、人間ドック費用補助
- 全社表彰や部署ごとのアワード