マイクロソフトは間違いなくテクノロジーを洗練し、より人間らしいものにする時が来ています。
Microsoft は、Azure テキスト読み上げアバターのリリースを発表しました。 マイクロソフト・イグナイト カンファレンスは2023年11月14日から17日までシアトルで開催されます。 Azure アバターは現在パブリック プレビュー段階にあり、どこにいても Azure ユーザーがテキスト入力のみでアバターを作成できます。
のパブリック プレビュー リリースを発表できることを嬉しく思います。 Azure AIスピーチ テキスト読み上げアバター。ユーザーがテキスト入力で話すアバター ビデオを作成したり、人間の画像を使用してトレーニングされたリアルタイム インタラクティブ ボットを構築したりできる新機能です。
マイクロソフト
レドモンドに拠点を置くテクノロジー大手は、Azure のテキスト読み上げアバターが、この問題と戦うための適切なソリューションである可能性があると考えています。 従来のビデオ コンテンツ作成と、スタートアップなどの小規模企業は、このようなサービスから大きな恩恵を受ける可能性があります。 道具。
従来の動画コンテンツ制作では、動画撮影環境の整備、動画の撮影、編集など、多くの時間と予算が必要でした。 テキスト読み上げアバターを使用すると、ユーザーはより効率的にビデオを作成できます。 ユーザーはアバターを使用して、テキスト入力だけでトレーニングビデオ、製品紹介、顧客の声などを作成できます。
マイクロソフト
テキスト読み上げアバターは、さまざまなアプリケーションに使用できます。
- 旅行 Web サイトのチャットボット
- ライブコマーシャルでのバーチャル販売
- オンラインで教えて質問に答えてくれるAI先生
- 従業員の質問に答えるバーチャル人事
このツールは多くの企業にとって非常に便利ですが、人間の表現の全範囲が何らかの形で欠けているビデオも生成される可能性があります。 その理由は次のとおりです。
Azure のテキスト読み上げアバターは便利かもしれませんが、現実感がありません
Microsoft ではアバターを生成する 2 つの方法を提供していることを知っておくことが重要です。
- 事前構築されたテキスト読み上げアバター、Microsoft はユーザーが選択できるオプションのリストを提供します。 これらのアバターは、ユーザーから受け取った入力に基づいてさまざまな言語を話し、さまざまな声を発することができます。
- カスタムのテキスト読み上げアバターを使用すると、ユーザーはカスタマイズされたアバターを作成できます 現実の画像とビデオを使用します。 システムはそれらのリソースを取得し、それらの特性に一致するアバターを自動的に作成します。 重要な機能は、ユーザーが声と外見を提供すると、システムがユーザーに似たアバターを作成することです。
それでも、アバターには特定の表情が欠けており、そのため非常にロボットのように見えます。
Microsoft が製品に関するブログ投稿に投稿した 2 つのビデオの例を見てみましょう。 どちらも、Azure テキスト読み上げアバターを使用して生成されます。 最初のものは、以下に示すように、ユーザーが Azure アバターを使用してビデオ コンテンツを生成する方法を示すアバターを特徴としています。
YouTube のサムネイルからは、ビデオに表示されているモデルが実際にアバターであることはわかりませんが、ビデオを再生すると、完全に AI によって生成されたものであることがすぐにわかります。 アバターの表情と声のシンクロがちょっと変です。
Azure のテキスト読み上げアバター テクノロジーにより、インタラクティブなアバターの構築が可能になります (2 番目の例) 不気味の谷の感覚を表現するもの(人間のように振る舞うが、人間ではないもの) 人間)。
Microsoft が述べているように、インタラクティブ アバターは Azure OpenAI Service GPT-3.5 モデルを利用して、さまざまな言語での顧客との口頭での対話を含む顧客のクエリに応答します。 これだけでも信じられないほど便利ですが、やはり、このインタラクションは人工的で人間的なインタラクションがまったくないように見えるため、人によっては不快に感じるかもしれません。
ここを見てください:
やがて Microsoft がこの問題を解決する可能性があり、新たな AI テクノロジーの出現により、レドモンドを拠点とするテクノロジー巨人は Azure アバターを業界で普及するツールに変える可能性があります。 なぜ? なぜなら、企業はすでにこのツールを気に入っているからです。
当社では、最先端の AI サービスと視覚化サービスを 1 つのプラットフォームで独自に組み合わせているため、AI バンキング アバターに Azure AI サービスを使用しています。 さまざまな Azure AI Speech テキスト読み上げアバターを使用することで、次のレベルの顧客エクスペリエンスを生成し、銀行業務と銀行業務のやり取りを大幅に簡素化できるようになります。
Gerald Ertl 氏、コメルツ銀行 AG、マネージング ディレクター
ただし、Microsoft はこれらのアバターと顧客のインタラクションを考慮していません。 企業にとってははるかに安価なオプションになる可能性がありますが(そしてより高速でもあります)、マーケティング担当者は AI によって生成されたソリューションを作成できる必要があります。 外部ソースに頼らずにチュートリアル)、意味のある物理的表現が欠如しているため、これらのアバターは次のように見えます。 ロボット。
特に Copilot などのツールについて話している場合、AI を無視することはできません。 Windows 11 または マイクロソフト 365, しかし、人間に似せようとするとき、それは非常に不気味なものになる可能性があります。
マイクロソフトはこれらのアバターを改良する予定であり、それに疑いの余地はありませんが、今のところ、それらのアバターの 1 つを見るたびに、強制的にニヤニヤしたり、まったく表情を持たなかったりするたびに、背筋がゾクゾクするような感覚があります。
これらのアバターについてどう思いますか?