プロジェクト ルーミは人間のような反応が可能です。
- Project Rumi は、あなたの身体的表現を統合して、あなたの入力に対する意見を形成します。
- AI言語はあなたの態度に応じて応答します。
- Project Rumi は、AI モデルを人間に近づけることを可能にする AI の画期的な製品です。
Microsoft は過去数か月間、AI 研究に多くのリソースを投資してきました。 ロングメム、無制限のコンテキスト長を提供します。 コスモス2、空間概念を視覚化し、それに関する独自の入力が付属します。 それなら、あなたは持っています オルカ13B、AI モデルをトレーニングするためのオープンソースです。
もあります ファイ-1、Python の複雑なブロックを学習する能力が非常に優れています。 そしてマイクロソフトはクリエイティブ AI の研究も支援しており、 ディープラッパーなど、はい、ご想像のとおり、AI ラッパーです。
レドモンドに拠点を置くテクノロジー大手は、AI に関しては時代の先を行っています。 最近、Meta との提携を発表しました。 ラマ2を開発するこれは、これまでで最も多い 700 億個のパラメーターを持つ LLM です。
そして今、マイクロソフトも投資しているようです プロジェクト・ルーミ、対話にパラ言語入力を組み込むことができる AI モデル。 これは AI における画期的な進歩であり、他のモデルも人間のような応答システムの実現に近づくことになります。
Microsoft Project Rumiとは何ですか?
Microsoft Project Rumi は、ユーザーのすべての身体的表現を統合して、ユーザーの態度について意見を形成し、それに応じて応答することができる大規模な言語モデルです。 つまり、あなたが怒っているように見えた場合、モデルは実際にあなたの表情を読み取り、あなたの声のトーンを聞きます。
そして、あなたの態度に応じた答えが生まれます。
Project Rumi はマイクと Web カメラにアクセスすることでこれを行い、実際にあなたの顔を記録して身体的表情を理解します。
Project Rumi は、入力に関する現在の AI モデルの限界に対処するために Microsoft によって特許を取得しています。 たとえば、Bing AI はユーザーの表情を見ることができず、ユーザーが何かをするよう求めているときの声のトーンを聞くこともできません。 その結果、その答えはいくぶん人工的で、人間的ではないものになります。
Microsoft Project Rumi は、既存の技術オプションを利用して人間の表情をキャプチャすることで、これらの制限に対処します。 その代わりに、Project Rumi は人間の表情を学習し、それに基づいて動作を構築します。
Project Rumi は LLM であるため、このモデルは他の AI モデルのトレーニングに使用されます。 つまり、間もなく人間のような AI と対話できるようになるでしょう。 クールに聞こえるかどうか? どう思いますか?