対話型生成AIツールChatGPTで世界を大きく変えたOpenAI社が、また一つの世界を変えようとしている。
それは動画生成。
2024年2月15日 OpenAIのCEO サム・アルトマンが唐突にX(Twitter)に公開した動画が大きな話題を呼んだ。
実写と区別がつかないなめらかな動きと自然なカメラワーク。
映し出されたのは日本の街並み。
その動画を作り出したツールが「Sora」。
きょうはこのSoraについて現時点で分かっていることをまとめてみた。
まだSoraが何かよくわかっていない人には参考にしてもらえると嬉しい。
- 話題の動画生成AI「Sora」ってなに?
- 「Sora」って何がすごいの?
- 「Sora」を使って何ができるの?
動画生成AI「Sora」って何?
さっそく動画生成AI「Sora」について紹介してみます。
ただし一般公開されていないので現時点で分かっている情報をまとめてみる。
Soraを作っているのはOpenAI社
Soraを公開したのは「あの」OpenAI社です。
そう、ChatGPTを生み出したAIテクノロジーベンチャー。
テキストからビデオを作成する
Sora は、テキストの指示から現実的で想像力豊かなシーンを作成できる AI モデルです。
引用:OpenAI公式サイト
Soraはテキストから動画生成できるAI
OpenAIが公開しているサンプル動画がこちら
そしてこの動画を作るために必要なのは「プロンプト(言葉による指示)」だけということ
上の動画のプロンプト(以下は公式サイトから引用)
“スタイリッシュな女性が、暖かく輝くネオンとアニメーションの街の看板で満たされた東京の通りを歩いています。彼女は黒い革のジャケット、赤い長いドレス、黒いブーツを着ており、黒い財布を持っています。彼女はサングラスと赤い口紅をつけています。彼女は自信を持って何気なく歩いています。通りは湿っていて反射しており、色とりどりの光の鏡効果を生み出しています。多くの歩行者が歩き回っています。”
「Sora」の動画生成って何がすごいの?
Soraがなんでそんなに話題になっているのか?
細かいプログラムのこととかは正直わかりません。
そんな私でも断言できるSoraのスゴさはクオリティです。
類似のアプリはこれまでもあったけど、指が10本になっていたり、人と物が融合してしまっていたりと、とても使えるものでは無かった。
しかし、このSoraは動画生成時に「元のキレイな状態」を予想する能力に優れているらしく、映像や被写体の崩れが極限まで減っている。
OpenAIが目指す安全安心なテクノロジー
OpenAI社のサイトを見ると…
OpenAI 製品には、「テキスト分類子」と呼ばれる仕組みが適用されているとのこと。
“ 何ができるかというと「極端な暴力、性的コンテンツ、嫌がらせ的な画像、有名人の肖像、または他人の IP を要求するもの」など、OpenAI社の使用ポリシーに違反するテキスト入力プロンプトをチェックして拒否します。”
つまり、モラルの無い動画や子供達に見せられないような極端な動画は生成できないようになるんです。
“また、生成されたすべてのビデオのフレームをレビューして、ユーザーに表示する前にビデオが使用ポリシーに準拠していることを確認するために使用される堅牢な画像分類子も開発したとのこと。”
さらに生成・公開前にそのようなチェックをすることができる。
生成AIの大きな課題の一つが「著作権」。
事前にチェックができるようになれば皆が安心して使えるAIへ進歩することになる。
最強すぎるやろ…
「Sora」を使ってできることは?非エンジニアでも簡単に動画生成できる
紹介してきたように動画生成の未来を変えるSora
残念ながら2024年2月18日現在、限られたクリエイターが試験的に使っている段階。
一部はX(Twitter)にも公開されているので参考にまとめてみた。
実写の映像も
クレイアニメ風の映像も
ピクセル動画のような映像も
プロンプトを入力するだけで作成できるようになる。
一般公開はまだ先だが、サム・アルトマンの動向を常にチェックしておきたいですね。
Soraの使用料はまだ決まっていない。
月額制での利用になると思われる。
情報が公開されたらこの記事に更新していきます!
AIの進化に乗り遅れないようしっかりアンテナ張っていきましょう!