Microsoft の InstructDiffusion は、指示に従って画像を編集します。

InstructDiffusion は意味論的な意味を理解することができ、それを使用して画像を編集します。

  • InstructDiffusion は、過去の命令を使用して意味論的な意味を理解する能力を獲得できる AI です。
  • このモデルは、優れた一般化機能も備えています。
  • 視覚的な手がかりについて学習すると、モデルはそれを大幅に拡張して、さらに学習します。
マイクロソフトの指示拡散

マイクロソフトの最新AIモデル、 拡散を指示する、指示に従って、画像、またはアップロードできる画像を根本的に変換します。 Microsoft Research Asia によって開発されたこのモデルは、AI と人間の指示を組み合わせて、さまざまな視覚的なタスクを生成して完了するインターフェイスです。

言い換えれば、編集、変更、または変換したい画像を選択すると、InstructDiffusion がコンピュータ ビジョンを起動して、入力に基づいて画像を変更します。

マイクロソフトがリリース 数日前にこのモデルを作成しましたが、InstructDiffusion にはすでに デモプレイグラウンド、モデルを自分で試すことができます。

IntructDiffusion の主な革新は、モデルが画像に関する事前知識を必要とせず、代わりに拡散プロセスを使用してピクセルを操作することです。 このモデルは、セグメンテーション、キーポイント検出、復元などの多くの便利な機能を備えています。 実際には、InstructDiffusion は指示を使用して画像を変更します。

一例として、Microsoft Research Asia は、モデルに指示するだけで写真の透かしを削除することができました。

Microsoft の InstructDiffusion は、指示の背後にある意味を区別できます。

InstructDifffusion など、他の多くの Microsoft AI モデル、タスクを解決する際に革新的な行動が可能です。 Microsoft Research Asia は、InstructDiffusion が理解タスクと生成タスクを実装していると主張しています。

モデルは、セグメンテーションやキーポイント検出などの理解タスクを使用して、編集する領域とピクセルを特定します。

たとえば、モデルはセグメンテーションを使用して、「画像の右側の男性を赤く塗る」という指示の領域を適切に特定します。 キーポイント検出の場合、指示は次のようになります。画像の左端にある男性の膝を黄色で囲みます。

生成タスクは、編集タスクと復元タスクで構成されます。 InstructDiffusion は画像を編集するだけでなく、モデルは指示に基づいて画像の新しい要素も生成します。マイクロソフトの指示拡散

Microsoft InstructDiffusion の最も有望な機能は、受け取ったすべての命令をうまく一般化して、その背後にある意味を一貫して深く理解する能力です。 言い換えれば、モデルはユーザーが与えた指示を記憶しており、それを使用して自身をさらにトレーニングします。

InstructDiffusion が特定の命令に対してどのように動作するかを示す例。

しかし、モデルはまた、指示の背後にある意味を区別することも学習し、目に見えないタスクを解決したり、要素を生成する新しい方法を考案したりするようになります。 意味論的な意味を理解するこの機能により、InstructDifussion は他の同様のモデルよりも一歩進んでおり、それらを上回っています。

ただし、InstructDiffusion はさらに一歩進んだものです AGI到達まで: すべての命令の背後にある意味論的な意味を深く理解し、コンピューター ビジョンをうまく一般化できるこのモデルは、AI 開発を大きく前進させるでしょう。

Microsoft Research Asia では、それを試すことができます。 デモプレイグラウンド、しかし、それもできます そのコードを使用する 独自の AI モデルをトレーニングします。

このモデルについてどう思いますか? 試してみますか?

Surface Pro4とSurfaceBookは、ついにMicrosoftに実際の現金をもたらし始めました

Surface Pro4とSurfaceBookは、ついにMicrosoftに実際の現金をもたらし始めましたマイクロソフト表面

Microsoftは第3四半期の収益を公表しており、同社の市場戦略は非常にうまくいったようです。 一部の製品、特に電話では、他の製品の売上が急増する一方で、下降スパイラルが続いています。 最近のレポートから判断すると、MicrosoftにはXbox One、Surface Book、Surface Pro4の3つの主要な収益エンジンがあります。Surface Pro4とSurfaceBook...

続きを読む
注意してください! ノーベリウムフィッシング攻撃はあなたの個人データの後にあります

注意してください! ノーベリウムフィッシング攻撃はあなたの個人データの後にありますマイクロソフトフィッシング攻撃

マイクロソフトは、ノーベリウムハッカーグループが関与する新しいサイバー攻撃警告を発行しました。 悪意のある当事者が以前のUSAIDアカウントを使用しているため、攻撃の試みの信頼性が高まりました。政府機関および非政府機関にリンクされている3000を超えるアカウントがすでに攻撃されています。MicrosoftのTomBurtは、このフィッシングスキームが被害者に対してどのように機能するかを正確に...

続きを読む
電話アプリを使用すると、最新のAndroid写真にアクセスできます

電話アプリを使用すると、最新のAndroid写真にアクセスできますあなたの電話アプリマイクロソフトウインドウズ10

あなたの電話アプリはどんどん良くなっていき、追加された各機能はエキサイティングなものを提供します コンピューター上のスマートフォンコンテンツにアクセスするのが大好きなWindowsPCユーザーへのエクスペリエンス シームレスに。 アプリの最新のアップデートにより、ユーザーはPCで最新の2000枚のAndroid写真にアクセスできます。あなたが尋ねた、私たちは聞いた! ザ・ #あなたの電話 ア...

続きを読む