SORA – OpenAIがテキストを非常にリアルなビデオに変換する能力を発表

AI
Surfer AI - Best All-in-one Assistant

- 記事は 20 分以内に完成し、専用のライターを使用するよりも 10 分の 1 の費用で済みます。
- Surfer AI を使用して、すぐにランク付けできる記事を数分で作成します。
- ボタンをクリックするだけで、業界全体で調査、作成、最適化できます。

OpenAIは、革新的なテキストからビデオへのモデル「Sora」を導入し、現在は一部の専門家とクリエイティブなプロフェッショナルのみがアクセスできる形で、生成AIの分野における新たな基準を設定しました。

プロンプト:スタイリッシュな女性が、暖かく輝くネオンとアニメーションの都市看板で満たされた東京の通りを歩いています。彼女は黒のレザージャケット、長い赤いドレス、黒いブーツを履き、黒いハンドバッグを持っています。サングラスと赤い口紅をつけています。彼女は自信を持って、そして何気なく歩きます。通りは湿っており、カラフルな光の鏡効果を作り出しています。多くの歩行者が行き交っています。

このAI企業は、生成AIの分野で顕著な進歩をマークする洗練されたテキストからビデオへの技術「Sora」を発表し、当初は専門家とクリエイティブな人々に限定してアクセスを提供しています。

Soraは、Googleの類似ツール「Lumiere」が提供するものと比較しても、最大1分間のビデオを生成できるという機能を提供することで際立っています。Lumiereもまたアクセスが限定されています。

OpenAI、Google、Microsoftなどのテクノロジー大手間でのテキストからビデオへの能力開発競争が激化しており、2032年までに1.3兆ドルを生み出すと予想されるセクターを支配することを目指しています。これらの進歩は、ChatGPTのデビューに続いて、生成AIに対する消費者の関心が急増している中で行われています。

ChatGPTとDall-Eの開発者であるOpenAIは、Soraを誤用の可能性、包括的な情報や偏見を特定するタスクに従事する専門家と、さらなる入力のためのクリエイティブなプロフェッショナルに提供する計画です。このような現実的なディープフェイクの作成に伴うリスクを軽減するため、この精査は非常に重要です。

外部からのフィードバックを求め、その進歩を共有することにより、OpenAIは、AI技術の進化する能力について一般の人々を情報提供することを目指しています。

Soraが長いプロンプト、たとえば135語のものを処理し、多様でリアルなシーンを生成する能力を示すことは、Dall-EやGPTモデルでのOpenAIの経験から得られた高度な能力を示しています。

SoraはDall-E 3からの技術を活用して、詳細なビジュアルキャプションを生成し、キャラクターの動きと背景の詳細において精度を持って複雑なシナリオを生成することができ、現実世界の物理法則と相互作用の理解を示しています。

ビデオ作成において印象的なリアリズムを持つにもかかわらず、Soraは物理法則や因果関係、例えばオブジェクトの相互作用における矛盾などを正確に描写することに課題を抱えています。

OpenAIはSoraの限界を認識しており、複雑なシーンの物理学や左右の区別などの困難を含むが、より広範なリリース前の安全対策を続け、濫用を軽減するための厳格なコンテンツガイドラインに従うことを強調しています。

Soraを洗練させるにあたり、OpenAIはより安全なAIシステムの開発における実世界のアプリケーションからのフィードバックの重要性を強調しており、このような技術の潜在的な利益とリスクの両方を認識しています。

Soraについて:

Soraは、テキスト指示からリアルで想像力豊かなビデオシーンを作成することを目的としたAIモデルで、動きのある物理世界をシミュレートすることを目指しています。このモデルは、最大1分間のビデオを生成でき、ビジュアルクオリティとユーザープロンプトへの遵守を維持するよう設計されています。現在、潜在的なリスクを評価するためのレッドチームによってテストされ、フィードバックのためにクリエイティブなプロフェッショナルに提供されています。Soraは、正確な詳細、動きの理解、キャラクターの感情表現で複雑なシーンを生成することに優れています。しかし、物理法則を正確にシミュレートすることや、特定の因果関係および空間的な詳細の理解には限界があります。

安全対策には、ドメイン専門家による敵対的テスト、誤解を招くコンテンツの検出ツールの開発、およびDALL·E 3からの既存の安全方法の適用が含まれます。これには、テキスト入力チェック、イメージ分類器、C2PAメタデータの組み込み計画が含まれます。政策立案者、教育者、アーティストとのエンゲージメントは、懸念を理解し、ポジティブな使用事例を特定することを目的としており、この技術の有益な使用と濫用の可能性の両方を認識しています。

Soraは拡散モデルとトランスフォーマーアーキテクチャを使用し、ビデオと画像をより小さいデータ単位で表現する技術を使用しており、幅広い視覚データを扱うことができます。それはDALL·EとGPTモデルからの以前の研究に基づいており、テキスト指示により忠実に従い、静止画像をアニメーション化したり、高精度でビデオを拡張する技術を取り入れています。Soraは、完全に現実世界を理解し、シミュレートするモデルへの基本的なステップとして強調され、人工一般知能(AGI)を達成するための重要なマイルストーンをマークしています。

AIAI TechAI Tools未分類
Surfer AI - Best All-in-one Assistant

- 記事は 20 分以内に完成し、専用のライターを使用するよりも 10 分の 1 の費用で済みます。
- Surfer AI を使用して、すぐにランク付けできる記事を数分で作成します。
- ボタンをクリックするだけで、業界全体で調査、作成、最適化できます。

AI Teian
Copied title and URL