「極予測AI」データサイエンティストに聞く「生成AIを活用した商品画像の自動生成機能で、広告クリエイティブ制作はどう変わるか?」

技術・デザイン

「極予測AI」は2023年12月に商品画像の自動生成機能を開発し、翌2024年1月から本格運用を開始しました。本機能は、従来の撮影プロセスに代わり、AIが複雑なシチュエーションや素材を考慮した高品質な商品画像を瞬時に生成することを可能としています。これにより、広告クリエイティブ制作の効率が大幅に向上し、広告効果の最大化を狙いとしています。本機能のエンジニアリングマネージャーを務めた脇本に、生成AI技術の検証や導入、ビジネス的な効果などを聞きました。

Profile

  • 脇本 宏平 (AI事業本部 AIクリエイティブディビジョン 極AI事業部)
    2019年新卒入社。 AI事業本部 極予測AIにおいて、広告クリエイティブ制作のための生成技術の開発に従事。現在はマネジメント業も担いながら、画像・テキスト生成の研究開発や大学との産学連携、それらを活用した新しい制作フローの開発に取り組んでいる。

「架空のAI人物生成」が可能性を示した、次世代の広告クリエイティブ制作

── 脇本さんのデータサイエンティストとしてのバックグラウンドについて教えて下さい。

2019年に新卒入社し、データサイエンティストとしてAI事業本部に配属されました。入社当初は広告コピーの自動生成プロジェクトに携わりました。その後に人物画像生成の技術検証プロジェクトを経て、2020年には広告画像生成サービス「極予測AI人間」の開発に関わりました。

最近の大きな仕事は「極予測AI」における「生成AIを活用した商品画像の自動生成機能」の開発です。このプロジェクトではデータサイエンティスト兼エンジニアリングマネージャーを担当しています。

── 生成AIの発展は「極予測AI」プロジェクトにどのような影響をもたらしていますか?

「極予測AI」シリーズにおいても、生成AIを活用した広告効果を最大化する機能が増えています。中でも「極予測AI人間」で実現した、架空のAI人物生成は、広告クリエイティブ制作における課題解決に、1つの可能性を示しました。GAN(敵対的生成ネットワーク)と、当社独自の効果予測アルゴリズムによる最適化により、架空のAI人物モデルを大量に生成し、広告クリエイティブ制作に活用することができるようになりました。

これにより、実在する人物画像との比較においてCTR(クリックスルーレート)を122%向上させるなど、広告効果の改善を実証しています。

そして新たに、広告の主要な要素である商品画像に応用したのが「生成AIを活用した商品画像の自動生成機能」です。

 引用:プレスリリース
引用:プレスリリース

「実在する商品」の画像生成がもたらす、広告クリエイティブ制作の可能性

── 「架空の人間」に加え、「実在する商品」が生成対象になりましたが、どんな課題やビジネスニーズがあったのですか?

広告クリエイティブの制作現場では、撮影にかかる時間やコストが課題となっていました。例えば、商品イメージに適したロケ地の確保、撮影班やエキストラの手配、撮影における天候や交通環境に左右される不確実性。加えて、四季折々のシーンを、様々な土地で表現したいニーズとなると、膨大な撮影コストが発生します。

商品は広告の主役です。その商品画像を、精度高く自動生成することで、これまでの制作を大きく上回る多種多様な表現のクリエイティブを生み出すことが可能になります。

あわせて本機能では、背景や環境光と自然に調和した画像を生成することが可能です。特に、透明な化粧品ボトルの後ろに風景が透けて見える表現、ロケ地特有の自然光に溶け込む表現など、複雑な表現を必要とするシチュエーションに対応しているのも特徴です。

── 商品のブツ撮りと比べて、本機能を利用する際のメリットは何ですか?

まず、本サービスの良い点は、クライアントが特別な準備を必要としないところです。撮影・学習・生成まで、自社で一貫して行う体制を作っているため、商品を当社に送っていただくだけで良いのです。

ブツ撮りとの違いでは、1日で数百枚の異なるパターンやシチュエーションの商品画像を生成することで、大量の広告クリエイティブを揃えることができる点です。朝陽がさす森林や夕暮れのビーチを背景にしたシーンなど、商品にマッチしうるシチュエーションを網羅的にその日のうちに制作することが可能です。

そして「極予測AI」の効果予測技術と組み合わせることで、より高い広告効果を持つ広告クリエイティブの制作と運用が可能となります。

「AIによる画像生成」と聞くと、アウトプットのクオリティに注目しがちですが、我々のサービスの本質は「大量の広告クリエイティブを制作することで、より広告効果を追求できる」という点です。あくまで、クライアントのビジネスに貢献することを目的としているのが特徴です。

── サンプル画像における商品の反射光や透明感、影のさす方向などが素晴らしいですね。技術的に難しかった点は何ですか?

AI人物生成の場合、架空の人物という性質上、人間としての特徴を正確に捉えていれば、人間の画像として違和感なく受け入れられる傾向があります。しかし、商品は精巧なプロダクトデザインをもとに作られていて、曲線や丸み、ロゴの位置やフォントデザインなど、商品を構成する要素の再現性が重要となります。

そのため、AIによる商品画像の生成は技術的にハードルが高く、困難とされてきましたが、生成AI技術の進化により、再現性の高いアウトプットが出せるようになってきました。それでも、商品の特徴を正確に生成することは、依然として技術的なハードルが高い状況と言えます。

そこで、AIモデルの開発に加えて我々が注力したのは、学習データの品質向上です。生成する画像のクオリティ向上には、AIに供給するデータの質が非常に重要だからです。商品が鮮明に写った高解像度の写真、ノイズや歪みを極力なくした鮮明な写真、正確な色が捉えられた写真などがそれにあたります。

AIが商品の画像を再現性高く生成するためには、様々な側面から商品の情報を学習させる必要があります。例えば、ドリンクのような透明な商品では、自然光が回り込むように溢れて見えたりしますし、自然光の透過や反射は飲料の透明度や色彩によって異なります。

このように、AI学習に適したデータの作り方を明確に定義し、それに合わせた撮影を行う必要があります。サイバーエージェントには複数のカメラマンが在籍する専属の撮影チームや、「極(きわみ)AIお台場スタジオ」など生成AIの性能を向上させる学習データを提供することが可能な体制を揃えています。

AIプロダクトを商品化するために必要な要素

── 生成AIを活用したプロダクト開発は、様々な業種で模索されています。「極予測AI」のように、AIプロダクトとして商品化するためには何が要となりますか?

クライアントのビジネスニーズや、広告クリエイティブのクオリティ要件を満たす観点から考えると、一般的に知られている生成AI技術を活用することでおよそ80%の完成度を目指せるだけの可能性があると考えます。しかし、リリース基準を満たす100%のクオリティを実現するためには、残りの20%のクオリティ向上が必須となり、一般的な生成AIでは限界があります。

要となるのが、AIによる生成ロジックの細かい調整や、古典的だが安定している枯れた技術も活用した前処理・後処理の工夫、実際の問題に合わせた高品質なデータセットの作成などです。商品画像の生成においても、AI事業本部が長年とりくんできた過去の蓄積やノウハウを活かすことができたからこそ、このクオリティを実現できています。

 引用:プレスリリース
引用:プレスリリース

クライアントのビジネスニーズや、プロダクトの課題に対して、満額回答するためのラストワンマイルは、チームとしての総合的な開発力だと思っています。我々「極予測AI」の開発チームだけでなく、機械学習・計量経済学・自然言語処理・HCIなどを専門とする研究組織「AI Lab」との連携、「極(きわみ)AIお台場スタジオ」の機材環境や撮影チーム、GPUサーバーなどの社内リソースなど、複合的な要素によって総合的な開発力を発揮していると言えます。

── ソフトだけでなくハードの面でもサイバーエージェントの強みに支えられるのは心強いですね

AIプロダクト開発には多くのGPUリソースが求められます。十分なGPUリソースをオンデマンドで利用できることは、迅速な実証実験や実装を行う上でも非常に重要です。そこで役割を果たしているのが、社内のプライベートクラウド「Cycloud」です。

例えばクラウドのGPUを利用する際、割り当てられるコンピューティングリソースが枯渇することで、適切なGPUが払い出されるまでウェイティングになるなど、検証や実装が予定通りに進まないケースもあったりします。サイバーエージェントでは、インフラ技術の専門組織であるCIU(CyberAgent Infrastructure Unit)が豊富な数のGPUを確保し、プライベートクラウド「Cycloud」として提供しています。仮にGPUのウェイティングが発生するようなケースでも、社内のGPU利用状況が可視化されていて、払い出しのキューの調整含めて、事業ニーズを満たすフォローが充実しています。

このように、データサイエンティストがプロダクトの実装の他に、中長期的な観点に基づいた研究や技術検証を日常的に行う際、事業ニーズを満たす必要十分なコンピューティングリソースやフォローを社内で得られるのが、サイバーエージェントグループの強みと言えます。

ある仮説に基づいた実験を早期に終了させ、実証実験など次のフェーズにシフトするためにも、GPUなどハード面が充実していれば、それだけ迅速にプロジェクトが進みますし、結果的にAIプロダクトの商品化のスピードが速くなるからです。

── 生成AIのプロダクト導入が事業の成功可否を握るとも言われます。エンジニアリングマネージャーとして、次世代のエンジニアに求められる要素は何だと思いますか?

次世代のエンジニアには、技術的なスキルだけでなく、ビジネス観点からの洞察も求められると思います。具体的には、市場における競争優位を生むポイントを理解し、それに基づいた価値ある開発を行う能力が必要です。

例えば商品画像の自動生成では、高品質かつ多様なシチュエーションの画像を短時間で大量に作成することで、より効果的な広告バナーを数多く制作でき、それを極AIの予測システムと組み合わせることで広告効果を最大化することが可能になります。

さらに、職種の垣根を超えてアクティブに行動し、様々な人と共同で問題を解決することが求められると思います。例えば、商品画像の生成精度を高めるためにAIモデルをカスタマイズするだけでなく、クオリティの高いデータを集め続けるために撮影班と協力してワークフローを改善する等です。また、カメラマンが撮影業務に必須の知識は、商品画像生成の精度向上に求められる基礎知識でもありました。レンズや光学に関する知識があるかないかで、どのようにクオリティを高めるかの議論のあり方も変わってきたからです。

サイバーエージェントには多種多様な職種のプロフェッショナル人材が多く在籍しています。お互いの強みをかけ合わせながら、ビジネスを成功に導くエンジニアが今後ますます求められると思います。

この記事をシェア

オフィシャルブログを見る

記事ランキング

WebパフォーマンスのExpertsが目指す 持続性の高いWeb開発

技術・デザイン

Page Top