非公開
CARTA MARKETING FIRM は「クライアントの事業を進化させる」をミッションに、デジタルや広告に領域を限定せず、クライアントのあらゆるマーケティング課題に向き合っていく事業会社です。
CARTA MARKETING FIRM 開発局では、「自分たちで創って、自分たちで売る。」をビジネスコンセプトに、自社プロダクトの1つとして、Demand Side Platform(以下、DSP)の開発を行っています。様々なマーケティング課題に対し、自らプロダクト開発を行うことでソリューションを提供し、クライアントの事業の進化を目指しています。
自社プロダクトであるDSPは、認知獲得のためのブランディング広告や、成果に直結するパフォーマンス広告といった、マーケティングにおける様々なニーズに応えられる機能を開発し提供しています。サービスリリース当初はパフォーマンス広告を主力商品として事業を成長させてきましたが、2019年のサイバー・コミュニケーションズ(CCI)との経営統合を期にブランディング広告領域への開発投資も積極的に行ってきました。現在はブランディング広告向けの機能が充実する中で、再度パフォーマンス領域への投資を行いさらなる事業成長を狙います。
■募集背景
データサイエンス人材が以下のような仕組みを一手に引き受け、分析やモデル開発へ集中できないという課題をよく耳にします。
・データパイプライン開発
・MLパイプライン開発
・プロダクトへの組み込み
我々もデータサイエンス人材がデータで価値を生む環境づくりと向き合ってきました。そこで、データパイプラインを選任するチームを作ることでデータ分析やモデル開発に集中するためのベースラインを整えました。この取り組みによって、データサイエンス人材がデータに集中する基盤ができました。
しかし、データサイエンスチームがプロダクトチームから離れていることで、ドメイン理解やプロダクトへの組込みにおいてコミュニケーションコストが増大する課題が残っています。この課題を解決するためにデータサイエンスチームがプロダクトチームに所属し、ソフトウェアエンジニアとコラボレーションを強める体制を作りました。DSPプロダクトチームでは、機械学習を使ってデータで新しい価値を生むエンジニアリングチームを目指します。
■業務内容
我々のDSPでは、月間270億インプレッション(2022/8実績)が発生します。これらの広告配信は機械学習を使い10msと短い間に自動的に入札価格などの意思決定を行っています。機械学習エンジニアには低レイテンシーな環境下で効果を発揮するモデルの構築とプロダクトへの実装が求められます。
機械学習エンジニアは、次のような仕事により広告効果を高めます。
配信ログ・ユーザー属性からCPC・CPAなどのKPIをもとに広告表示価格の決定
クリック率や勝率が低いリクエストを見分け、無駄なレスポンスの削減
ユーザー属性から最適なクリエイティブの選択
広告プラットフォーム開発における挑戦には以下のようなものが挙げられます。
▼時系列データを用いた早い学習サイクル
大量の広告配信に関わるログをもとに、モデルの更新サイクルは1時間程度
広告配信は不均衡なデータセットが多く、モデルの評価は慎重になる必要がある
▼リアルタイムな予測
DSPでは50ms程度で全ての処理が完結
推論に使える時間は10ms程度
▼論文サーベイ等の技術調査と提案
オンライン広告の分野では多くの手法が検討され日々技術が進歩する
収集したデータを最大限生かす手法を探し出し、提案する能力が求められる
仕事の進め方
機械学習エンジニアの仕事の進め方としては二つのフェーズがあると考えます。
▼ビジネス課題を機械学習の問題へ変換
新たな課題に向かう時、プロダクトマネージャーと密接に協力します。この段階ではビジネス上の課題を深く理解し、機械学習が解決可能な問題として落とし込みます。場合によっては機械学習を使わない方法も提案します。
▼MLパイプラインの構築・改善
モデル構築と改善に取り組みます。このフェーズでは、プロダクション環境へモデルを組み込むことをゴールとすることが重要になります。効率的なMLパイプラインを構築し、モデルの迅速な実験などの改善を可能にします。プロダクション環境へのリリース後は、広告配信ログなどを元にフィードバックサイクルを実現します。
■働く環境
これらの働き方を支えるチーム体制として次のような仕組みがあります。
▼専門性を生かすためのデータサイエンス環境
Snowflakeをベースとしたデータ基盤をデータ基盤チームが開発・運用しています。データ基盤チームは、配信ログなどのデータについてデータ品質を担保してくれます。プロダクトチームのエンジニアはdbtを使用して簡単に分析・学習用のデータを抽出する環境が整っています。データ基盤チームはデータサイエンス人材がその専門性を最大限に活かすサポートをします。
データ基盤については、以下に詳しくまとめているので、興味あれば御覧ください。
Snowflakeの力を引き出すためのdbtを活用したデータ基盤開発の全貌
Snowflakeと共に過ごした一年間。その進化過程と未来へのVision
▼ソフトウェアエンジニアとのコラボレーションが密である
MLパイプラインやA/Bテスト基盤など構築や運用はデータサイエンスの価値を出す上で重要になります。ソフトウェアエンジニアと協力することで素早くデータの価値を届けます。
業務上触れる分野や技術スタックについて
▼分野
機械学習
オンライン意思決定
数理最適化
統計学
▼スタック
Python, Kotlin
AWS
dbt, Snowflake
Prefect
Terraform
GitHub
Slack
ー