Ximera Media Next Trends #45|Ikuo Morisugi|January 16th, 2023
はじめに
メディアのトレンドとそれを巻き起こすスタートアップを追いかける連載シリーズXimera Media Next Trendsの第45回となる今回は「進化するAIとクリエイターの未来」をとりあげたいと思います。
近年ではAIが自動生成する文章・画像などが実用レベルに高度化しています。過去にXimera Media Next TrendsでもOpenAIが提供する自然言語を理解し文章や画像を作ることできるAIモデルについて紹介しました。
#1 コンテンツ制作の次世代トレンド:AIのサポートによるコンテンツの未来
本稿では生成系AIツールの現状、より実用レベルで使える生成系AIスタートアップの事例、生成系AIが今後クリエイターやビジネスマンに与える影響について考えていきたいと思います。
LLM(巨大言語モデル)ベースの生成系AIツールの現状
イーロン・マスクや有名なベンチャーキャピタルのプレジデントだったサム・アルトマンにより設立されたOpenAIが、2020年にLLMを使った高性能な言語モデルであるGPT-3を発表したことをきっかけに、高度な文章生成ができる生成系AIに大きな注目が集まりました。2021年にはGPT-3ベースのテキストから画像を生成できるDALL·E(2022年4月にVer2も発表)や、類似の画像生成系ソリューションとしてMidjourney、オープンソースで使えるStable Diffusionが登場し、画像生成系AIは広く認知を得ています。そして、2022年11月には自然な対話が可能なChatGPTが登場し、その品質の高さや出来ることの広さからクリエイターやTechビジネス界隈でも大きな話題となり、ロンチ後わずか6日で登録者が100万人を超えたことは記憶に新しいです。
LLMというのは、Large Language Modelの略です。LLMは、文章を扱うことができる大規模な言語モデルのことを指します。LLMは、文章を入力として受け取り、その文章を解釈し、必要に応じて回答や予測を出力することができます。LLMは、膨大な文章データを使って学習させることで、自然言語処理タスクや自然言語生成タスクを実現することができます。近年、LLMは自然言語処理の分野で注目されており、様々なアプリケーションで使われています。例えば、AIアシスタントや、自然言語に基づいた文章生成システムなどです。
上記のLLMの説明文を読んでいかがだったでしょうか。実は上記はChatGPTに「LLMについて教えて」と聞いて答えてもらった結果になります。かなり自然な文章で、かつ内容もある程度正確に記述されています。
このような生成系AIはテーマや初期コンセプトを的確に伝えることで、ある程度精度高く文章・画像などを作ることができるため、企画や調査や制作などでさまざまなことが可能になります。例えばChatGPTだけでも次のようなことができます。
- Google検索の代わり
- 勉強のパートナー
- カウンセラー
- コーディング
- コピーライティング
- 作詞、ストーリープロット、脚本たたき
例)Googleで検索しているような知識を自然な文章で聞いて答えてもらう
例)教科書を学習させてChatGPTに問題の回答を教えてもらう
例)メンタルや体調を相談して具体的な解決方法のアドバイスをもらう、ビジネスの企画の作り方や方法論を教えてもらう
例)特定の問題を解決するためのシステム要件やコードを学習させながら提案してもらう
例)自社のLP、SNS投稿、マーケティングメールなどを学習させて、各チャネルで必要なマーケティング用のコピーライティングを生成してもらう
例)「Snoop Dogスタイルの結婚ソングの歌詞を作って」といったように特定のスタイルとテーマに沿ったドラフトの詞、プロットを提案してもらう
気をつけるべき点として、ChatGPT自体は2021年末までのデータをベースにしているので最新の情報は知りません。例えば「ワールドカップ優勝国は?」と尋ねても答えることができません。また得意な分野と不得意な分野があり、時に不正確な情報や誤解を与えるような表現をすることがあるので、常にAIが答えることを鵜呑みにしてはいけません。また、ChatGPTを使うことを禁止する教育機関や企業やサービスもあり、どこでもどんな場面でも使ってよいわけではありません。
一方でこのような生成系AIツールは、サービスやコンテンツの企画/制作に大きく影響を与えるものだと考えられます。実際の制作や実装は苦手でも、企画力のある人がうまく使いこなせれば、それなりのものを作れてしまうからです。
例えば、アメリカのIT企業で働くAmmaar Reshiさんは、ChatGPTと画像生成AIのMidjourneyを使って14ページの絵本を制作し、Amazonで電子書籍として販売まですることができました(現在はAudibleのみ販売)。実際に70冊以上売れ、40-45冊がReshiさんの友人にプレゼントされました。
ここにも、AIが生成した絵の不完全性、著作権のあり方、これまでのアーティストやクリエイターの成果を盗用しているなどの批判などさまざまな問題があるため、現状ではこの事例が一概に素晴らしいとは言い切れません。しかし、それらのハードルを乗り越えた時に非常に重要なツールとなる可能性を見逃してはいけません。初期のYoutubeも著作権違反のものが大量のアップロードされており、積極的に対策していませんでしたが、音楽権利団体と包括ライセンスを結ぶ、違法動画は自動識別で削除するなど数多くの対策を行ったことで、大企業から個人まで気軽に使えるものになりました。生成系AIツールについても類似の対策が実施され、社会的な理解を得ることで真の普及に向かうものと思われます。
生成系AIの実用サービス例
Poly
ChatGPTについてはすでにさまざまなメディアで紹介されているため、さらに深掘りをしたい場合はそちらを参照ください。本稿では生成系AIでさらに可能になることを米国スタートアップの事例を取り上げご紹介したいと思います。
現在話題になっている生成系AIは主に文章や2次元の画像を生成するものですが、さらに難易度が高いと思われる3Dオブジェクトの自動生成に取り組んでいるのがPolyです。Polyは、3DCGベースのゲームや映像のデザイナーがテキスト文をもとに3Dオブジェクトを生成することができます。
例えば3Dゲーム内で草が生えているフィールドを制作する必要があった場合、通常であれば素材サイトからテクスチャーの素材となる画像を購入し、3Dモデルに貼り付けして3D編集ソフトで調整され、ようやくゲーム制作ツールに導入して利用するプロセスになります。が、Polyによってこのプロセスを一気に短縮することができます。
映像制作やゲームでよく利用されるPBR(Physical Based Rendering: 光や形状などに物理法則を適用してリアルに表現するレンダリング手法)にも対応しており、作成した3Dオブジェクトを基にリアルタイムにゲーム開発ツールで利用するためのマップを生成することもできます。
数千のクリエイターがPolyを無料で使っている一方で、すでに数百の有料プランユーザを獲得しています。2022年12月時点で200万以上のテクスチャーを生成しており、一定の支持を集めています。すでに競合が数社いる状況で今後3Dオブジェクトのみならず、イラスト、効果音などさまざまなアセットを提供することで差別化を図ろうとしています。
Polyは2022年9月にY Combinator、Bloomberg Beta、Figma Venturesなどから390万ドル(約5.85億円)を調達し、さらなる成長が見込まれます。
runway
もう一点、画像の生成にとどまらず、AIによる画像/動画編集を行うスタートアップであるrunwayを紹介します。実写の画像から不要なものを削除する、逆に必要なものを追加する、音声ノイズを除去する、動画で人物のモーショントラッキングをする、背景を入れ替える、文字書き起こしをする、など画像/動画編集をする上で、通常であれば数時間、数十時間かかる作業をAIによって魔法のように一瞬で実現するツールを提供しています。
runwayのユーザの多くは個人クリエイターですが、CBSやハリウッドの映像スタジオ、New Balanceなどにもツールとして利用されています。Proプランで月12ドル、Teamプランで月28ドルを支払う必要があり、すでに有料プランによって売上を作っています。
runwayはFelicis、Madronaなどから、2022年12月に5億ドル(約750億円)の評価額で5,000万ドル(約75億円)の資金調達を行い、生成系AI界隈ではかなり注目されているスタートアップとなっています。
おわりに
今回は「進化するAIとクリエイターの未来」についてとりあげました。
さまざまな問題はまだありつつも、新たに登場した生成系AIツールによって、学習や調査の時間を短縮し、クリエイティブな作業のサポートや壁打ちができるようになりました。これにより人々の生産性を上げ、さらには制作の敷居を大きく下げることで、これまで表出してこなかったクリエイター潜在層を掘り起こし、クリエイターの人数を大きく増やす可能性もあります。また、スキル面ではAIがメインで創作する時代になった時、「与えられた要件を着実に実装・制作するスキル」よりも、「企画やアイディアを適切にAIに与えよい結果を得られるスキル」を極める方が重要になってくることも想像できます。これによって人々が獲得するためのスキルセットの考え方や教育方法にも変化が出てくるはずです。
歴史を遡ると産業革命以降、物流や生産における機械化によりブルーカラー労働者が出現し、その後特にITの普及を中心としてホワイトカラー労働者が大量に出現しました。同じように現代では、生成系AIの登場によってAIによる制作自動化が起こり、企画力を軸にしたクリエイターが大量出現することが考えられます。
今回の事例や未来予測を聞くと、AIの進化に恐怖を感じるかもしれません。現状のAIはまだ人類のあらゆるタスクを代替するような存在ではありませんし、自分の職がすぐに奪われると悲観的になる必要もありません。将来的に行き着くところまで行くと人間ができることのかなりの部分を代替してしまうかもしれませんが、その状態になるまでにはまだまだ多くのハードルがあり、それを乗り越えるための人類の努力が必要になってきます。
いつの時代も基本的なスタンスは同じですが、世の中でうまく生き延びるには、機械やITで代替されうるようなタスクや業務を捨て、人間にしかできないことを提供していくことが必要です。生成系AIが続々と登場する現代でも上記の考え方を持ち続けることで、悲観的にならずに時代に適応することが重要だと考えます。
Ximera Media Next Trends のトップページへ
キメラは2019年1月以来、70を超える国内パブリッシャー(新聞社・出版社・放送局)でサブスクリプションの事業設計、デジタルメディアのグロース、分析体制の構築などを支援しています。
コンテンツのエンゲージメント分析ツール「Chartbeat」の日本総代理店としてデジタルメディアの分析支援や体制づくりに取り組む一方、2021年には自社開発したサブスクリプション管理プラットフォーム「AE」を通してパブリッシャーのサブスクリプションビジネス開発を支援。2024年9月からはソーシャル動画の横断分析ツール「Tubular」の導入と分析の支援を開始。