非公開
【会話AIロボット「Romi」について】
「ペットのように癒やし、家族のように理解してくれる」というコンセプトのもと、会話AIロボットのRomiを開発しています。Romiは、あなたのすべてを肯定してくれる存在です。Romiと話す人が増えれば増えるほど、世界に優しさが満ちていく。そんな世界の実現を目指し、開発しています。
2020年6月に先行販売をして200台を完売し、2021年4月から一般販売を開始しました。2024年に完売をし、次機種である Romi Lacatan モデルを2025年7月に一般販売を開始しました。
※公式サイト:https://romi.ai
【なぜこの領域に取り組むのか】
近年、生成AIや大規模言語モデル(LLM)をはじめとするAI技術は飛躍的な進化を遂げ、日常生活やビジネスのあらゆる場面で活用されるようになりました。自動運転や画像・音声認識といった従来の領域に加え、人と自然に対話し、意思決定や創造活動を支援する存在として、AIは「使うもの」から「共にあるもの」へと変化しつつあります。
一方で、ロボットとの共生におけるコミュニケーションは依然として発展途上にあり、人の感情や文脈に寄り添った“心地よい対話体験”の実現には多くの課題が残されています。映画や小説、アニメで長年描かれてきた「人と自然に関わる存在としてのAI」は、いままさに現実になりつつある一方で、その本質的な価値はまだ十分に引き出されていません。
私たちMIXIは、「mixi」「モンスターストライク」「みてね」などを通じて、人と人とのコミュニケーションに新しい価値を提供してきました。その知見を基盤に、会話AIロボット「Romi」の開発に取り組んでいます。
私たちが目指すのは、単なる受け答えを超え、人の感情や関係性に寄り添い、日常の中に自然に溶け込む存在としてのAI・ロボットです。最先端のAI技術とこれまで培ってきたコミュニケーション設計の知見を融合し、「一緒にいることに意味がある」と感じられる体験の実現に挑戦しています。
【プロダクト開発の進め方】
Romi事業部では、エンジニア・デザイナー・ビジネスが職種の枠を越えて連携し、ひとつのプロダクトを作り上げています。仕様や体験は特定の職種だけで決めるのではなく、それぞれの専門性を持ち寄りながら議論し、意思決定していくのが特徴です。
※下記URLでハードウェアの開発風景が見られます。
https://youtu.be/e3gjfgFHbTU?si=C7rLPTHEx5DL-Y__
AIロボット開発グループは、AI R&D、バックエンド、モバイルアプリ、組み込みソフトウェア、電気設計、メカ設計など、多様な専門領域で構成されたクロスファンクショナルなチームです。ソフトウェアとハードウェアが密接に関わるプロダクトであるため、領域をまたいだ調整やトレードオフは日常的に発生します。私たちはそれを前提とし、隣接する領域への理解を持ちながら開発を進めています。
また、量産を前提としたプロダクト開発においては、社内だけで完結せず、各主要ベンダーや製造パートナーと密に連携しています。日々の開発・検証・改善を外部パートナーと一体となって進めることで、設計から製造まで一貫した品質を担保しています。
開発プロセスは一律ではなく、プロジェクトの特性に応じて最適な進め方を選択しています。事業部全体ではアジャイルな開発体制で実現していますが、ソフトウェア領域よりのプロジェクトではスクラムなどのフレームワークを取り入れつつ、ハードウェア開発ではウォーターフォールの考え方を組み合わせるなど、不確実性と制約の両方に対応しています。領域横断で開発を行うため、情報の透明性を重視し、意思決定の背景や進捗をチーム全体で共有する文化があります。
日々の取り組みとして、以下のような活動を行っています。
・なんデモ会:週に一度、職種を問わず成果物やアイデアを持ち寄り共有する場です。試作段階のものや業務外の取り組みも歓迎しており、ここから実際の機能や改善につながるケースも多く生まれています。
・20%ルール:新しいアイデアや技術検証に取り組むための時間を確保しています。確度の低い仮説の検証や未経験領域への挑戦など、将来のプロダクトにつながる探索を推奨しています。
・開発環境:AWS CloudやJetson Orinなど、用途に応じた計算リソースを利用可能です。
・ラボ環境:3Dプリンタ、恒温槽、各種工具や評価設備を備えたラボがあり、ハードウェアの試作・検証を迅速に行うことができます。
【お任せする業務内容】
Romiの会話体験はクラウドとロボットのデバイス側が協調して実現されています。近年は、LLMの進化により会話生成の性能が大きく向上していますが、実際のRomiのようなフィジカル x AI で設計するプロダクトの場合、統合的な会話体験設計が必要になります。
サーバーサイドでは今後、各種会話のリアルタイムAPIと繋ぐバックエンドやインフラの設計実装、Romiの長期記憶や各ユーザー毎のDBをはじめとする情報を統合し会話体験を設計実装、また現在はバックエンドをPythonベースにしていますが、今後各性能改善を目的としてGo言語等他の言語への置き換えを実施します。本ポジションでは、LLMを活用した会話体験をプロダクトとして成立させるためのバックエンド開発に携わっていただきます。
各専門分野のエンジニア専門領域の越境をしつつプロダクトにオーナーシップを持って進めて頂きます。
<主な業務内容>
・リアルタイム系の会話API(WebSocket/WebRTC etc.)及びプロキシサーバーの設計実装運用
・Romiの長期記憶部分や各種コンテキストを入出力する設計実装運用
・ルールベースの会話機能部分のツール化
・データベース設計およびインフラ開発改善
・Webサービス(オーナーズストア等)の開発改善
<タスク例>
・会話のリアルタイムAPI化
・社内のルールベースエンジンをツール化
・DB/インフラ構成のリプレイス
・Pythonベースのバックエンドのリプレイス
※上記は例であり、優先度に応じて柔軟に取り組んでいただきます
【開発環境】
(未経験のものがあっても問題ありません)
・言語(バックエンド):Python(今後Go言語等他の言語への移行を検討中)
・言語(フロントエンド):TypeScript(フレームワークはNext.js)
・インフラ:AWS(ALB + ECS Fargate を中心に、DynamoDB / RDS / IoT など)
・IaC:Terraform, Ansible
・コンテナ:Docker
・開発環境:AWS EC2(Ubuntu)
・支給PC:MacBook(Windows選択可)