株式会社ABEJA
◇◆米Googleから出資を受けNVIDIAと業務提携もするディープラーニングのリーディングカンパニー/戦略立案から実装まで一気通貫/働き方の自由度◎◆◇
【募集背景】
ABEJAでは、ロボット実機を用いた研究開発を進める中で、ロボット実機から発生する大量のデータを扱うための基盤整備を進めています。今後のVLAモデル開発におけるMLOpsにおいて、戦略上重要なコンポーネントとなります。
ロボットから取得される映像、LiDAR、制御ログなどのデータは、容量が大きく生成頻度も高いため、単純なファイル保存や場当たり的な構成では、開発や検証のスピードを維持できません。
今後のデータ量増加を見据え、安定してデータを取り込み、必要なタイミングで検索・再利用できる構成を初期段階から設計する必要があります。こうした基盤は、後からの作り直しが難しく、ロボット実機、オンプレミス環境、クラウドを含めた全体構成を踏まえた設計・運用が求められます。
本ポジションでは、このインフラ/データ基盤を主軸に、設計・構築・運用を担っていただきます。将来的には、その基盤の上で動くアプリケーションやツールの開発にも関わっていくことを想定しています。
【ミッション】
「ロボットとクラウドを繋ぐ堅牢な基盤を構築し、大規模ロボット基盤モデル開発を加速させる」
まずは、ロボット実機、オンプレミス環境、クラウド基盤、大規模データパイプラインを安定的につなぐインフラ/基盤の中核を担っていただきます。その上で、研究者やプロダクト開発チームと協働しながら、データを使える形にするアプリケーションやUIへと役割を広げていくことを期待しています。
【主に担っていただく領域(インフラ軸)】
・ハイブリッドクラウド/オンプレミス環境の設計・構築・運用
ロボット実機、オンプレミス環境(ストレージ・GPUサーバー)、クラウド(AWS等)を跨ぐインフラ/データ基盤のアーキテクチャ設計ネットワーク、セキュリティ、データ転送の最適化
・技術選定・技術検証・プロトタイプ開発・MVP構築
仕様が固まっていない段階から、動くものを素早く作り検証する
【将来的に期待する役割(フルスタック方向)】
・ロボット操作・管理に関わるWebアプリケーション開発
ロボット管理・遠隔操作・データ可視化等の画面
フロントエンド(React / TypeScript)
バックエンド(Go / Python)
・大規模データ基盤の設計・運用(★他メンバーと協働)
ロボット由来の非構造化データを扱うデータパイプライン設計
ワークフローエンジン(Airflow , Dagster)を用いたワークフロー定義
学習・分析用途に耐えうるデータレイアウト・クエリ基盤の構築
データ処理基盤の信頼性担保、監視系の構築
※アプリケーション領域については、入社時点での深い経験は必須ではありません。インフラを主軸としつつ、関心や強みに応じて段階的に広げていくことを想定しています。
【魅力】
・インフラを起点にフルスタックへ成長できる
単なる運用ではなく、設計・技術選定から関われます
・「モダンデータ基盤 × ロボティクス」という希少領域
Webログではなく、物理世界データを扱う高難度なデータエンジニアリング
・大規模プロジェクト × スタートアップ的スピード
技術選定や設計判断がそのまま標準になるフェーズ
・研究とプロダクトの間に立つポジション
研究成果を動くシステムとして社会実装する役割