CoDi は Microsoft の最新の AI モデルです。
- CoDi は、テキスト、オーディオ、ビデオ、および画像の入力を受け取り、それらをコンテンツに変換します。
- この AI モデルは障害のある人々にとって非常に役立つでしょう。
- CoDi は、AI を使用して人間とコンピューターのインタラクションを強化するプロジェクトです。

Microsoft はまさに AI の最前線にいます。 レドモンドに拠点を置くテクノロジー大手は、Windows 11 を含むあらゆるソフトウェアに AI を統合しています。 Copilot はすでに Insider Program に参加しています. 言うまでもなく、 Microsoft Teams は AI を使用して仕事を効率化しています. AI は次の分野への道を見つけました マイクロソフトストア 同じように。
ただこれが全てではありません。 ご存知かもしれませんが、Microsoft も AI 研究に多額の資金を投資してきました。 ロングメム, ファイ-1, コスモス2、 と オルカ13B これらは、今後の AI の存在方法に影響を与える AI モデルの一部にすぎません。
そして現在、マイクロソフトは、と呼ばれる別の AI モデルを考案中です。 コディ. どうやら、CoDi はクリエイティブなことなら何でもできるようです。 文字通り何でも。 このモデルにはすでにデモビデオがあります、Microsoft Research チームによって作成され、CoDi がどのように機能するかを示しています。
CoDi は、AI を使用して人間とコンピューターの対話を強化する Microsoft の Project i-Code プロジェクトの一部でもあります。
Microsoft によると、CoDi があなたのために何をしてくれるかは次のとおりです
CoDi は Composable Diffusion の略で、このモデルは Microsoft Azure Cognitive Services Research のチームがノースカロライナ大学チャペルヒル校と協力して開発しました。
文字通り、あらゆる種類の入力から、あらゆるものを生成できます。 ここで話しているのは、言語、画像、ビデオ、オーディオ、およびこれらの入力の組み合わせです。
CoDi はこれらの入力を取得して処理し、複数の種類の入力を同時に生成します。 これは以下のデモビデオで見ることができます。
言い換えれば、CoDi はプロンプト、画像、オーディオ クリップを含む状況に応じたリアルなビデオを生成します。 その使用は多くの人に非常に必要とされるでしょう。
CoDi を開発したチームは、このモデルの多くの使用例を考え出しました。 たとえば、障害のある人は、はるかに簡単にコンテンツを作成できるようになります。 学生はこれを使用して、魅力的で有益なプレゼンテーションやプロジェクトを作成することもできます。
このモデルをコンピュータで使用すると、ユーザー エクスペリエンスを完全に向上させることができます。 そして、それが一般公開されれば、わずか数個のアイテムを自由に使用するだけで、高度にインタラクティブなコンテンツを作成できるようになります。
あなたはそれについてどう思いますか? CoDi に興奮していますか? 以下のコメントセクションでお知らせください。