อวตารของการอ่านออกเสียงข้อความ Azure อาจรบกวนผู้ใช้ด้วยลักษณะหุบเขาอันแปลกประหลาด

ไมโครซอฟต์จะปรับแต่งเทคโนโลยีอย่างแน่นอนถึงเวลาที่จะทำให้มีความเป็นมนุษย์มากขึ้น

อวาตาร์ข้อความเป็นคำพูดสีฟ้า

Microsoft ประกาศเปิดตัวอวตารข้อความเป็นคำพูดของ Azure ที่ ไมโครซอฟต์ อิกไนต์ การประชุมที่จะจัดขึ้นที่ซีแอตเทิลตั้งแต่วันที่ 14 ถึง 17 พฤศจิกายน 2023 ขณะนี้อวตาร Azure อยู่ในการแสดงตัวอย่างสาธารณะแล้ว และผู้ใช้ Azure ทุกที่สามารถสร้างอวตารของตนได้ด้วยการป้อนข้อความเท่านั้น

เรารู้สึกตื่นเต้นที่จะประกาศการเปิดตัวตัวอย่างสู่สาธารณะของ คำพูด Azure AI อวตารข้อความเป็นคำพูด ซึ่งเป็นคุณสมบัติใหม่ที่ช่วยให้ผู้ใช้สามารถสร้างวิดีโออวตารพูดได้ด้วยการป้อนข้อความ และสร้างบอทเชิงโต้ตอบแบบเรียลไทม์ที่ได้รับการฝึกโดยใช้รูปภาพของมนุษย์

ไมโครซอฟต์

ยักษ์ใหญ่ด้านเทคโนโลยีจาก Redmond คิดว่าอวาตาร์การแปลงข้อความเป็นคำพูดของ Azure อาจเป็นทางออกที่เหมาะสมสำหรับการต่อสู้ การสร้างเนื้อหาวิดีโอแบบดั้งเดิม และบริษัทขนาดเล็ก เช่น สตาร์ทอัพ อาจได้รับประโยชน์อย่างมากจากสิ่งนี้ เครื่องมือ.

การสร้างเนื้อหาวิดีโอแบบดั้งเดิมต้องใช้เวลาและงบประมาณมาก รวมถึงการตั้งค่าสภาพแวดล้อมในการถ่ายวิดีโอ การถ่ายทำวิดีโอ การตัดต่อ ฯลฯ ด้วยอวาตาร์ข้อความเป็นคำพูด ผู้ใช้จะสามารถสร้างวิดีโอได้อย่างมีประสิทธิภาพมากขึ้น ผู้ใช้สามารถใช้อวตารเพื่อสร้างวิดีโอการฝึกอบรม การแนะนำผลิตภัณฑ์ คำรับรองจากลูกค้า ฯลฯ เพียงป้อนข้อความ

ไมโครซอฟต์

อวตารของการอ่านออกเสียงข้อความสามารถใช้กับแอปพลิเคชันต่างๆ:

  • แชทบอทสำหรับเว็บไซต์ท่องเที่ยว
  • การขายเสมือนจริงในโฆษณาสด
  • ครู AI ที่สอนออนไลน์และสามารถตอบคำถามได้
  • HR เสมือนเพื่อตอบคำถามของพนักงาน

แม้ว่าเครื่องมือนี้จะค่อนข้างมีประโยชน์สำหรับหลายๆ บริษัท แต่ก็ยังสามารถสร้างวิดีโอที่ขาดการแสดงออกของมนุษย์ได้ครบถ้วน นี่คือเหตุผล:

อวตารของการแปลงข้อความเป็นคำพูดของ Azure อาจมีประโยชน์ แต่ก็ไม่ได้ให้ความรู้สึกเหมือนจริง

สิ่งสำคัญคือต้องรู้ว่า Microsoft เสนอ 2 วิธีในการสร้างอวตาร:

  • อวาตาร์ข้อความเป็นคำพูดที่สร้างไว้ล่วงหน้าโดยที่ Microsoft แสดงรายการตัวเลือกที่ผู้ใช้สามารถเลือกได้ อวตารเหล่านี้จะสามารถพูดภาษาที่แตกต่างกันและมีเสียงที่แตกต่างกันตามข้อมูลที่ได้รับจากผู้ใช้
  • อวาตาร์ข้อความเป็นคำพูดที่กำหนดเองช่วยให้ผู้ใช้สามารถสร้างอวาตาร์ที่กำหนดเองได้ โดยใช้ภาพและวิดีโอในชีวิตจริง ระบบจะใช้ทรัพยากรเหล่านั้นและจะสร้างอวตารที่ตรงกับลักษณะเหล่านั้นโดยอัตโนมัติ คุณลักษณะที่สำคัญคือระบบจะสร้างอวตารให้มีลักษณะคล้ายกับผู้ใช้หากผู้ใช้ระบุเสียงและรูปลักษณ์ของตน

ถึงกระนั้นก็ตาม อวตารยังขาดการแสดงออกบางอย่าง ซึ่งเป็นข้อเท็จจริงที่ทำให้พวกเขาดูค่อนข้างเป็นหุ่นยนต์

มาดูตัวอย่างวิดีโอ 2 ตัวอย่างที่ Microsoft โพสต์ในบล็อกโพสต์เกี่ยวกับผลิตภัณฑ์ ทั้งสองถูกสร้างขึ้นโดยใช้อวาตาร์การอ่านออกเสียงข้อความของ Azure อย่างแรกดังที่คุณเห็นด้านล่าง มีอวตารที่แสดงให้เห็นว่าผู้ใช้สามารถสร้างเนื้อหาวิดีโอโดยใช้อวตารของ Azure ได้อย่างไร

จากภาพขนาดย่อของ YouTube คุณไม่สามารถบอกได้ว่าโมเดลที่นำเสนอในวิดีโอนั้นเป็นอวาตาร์จริงๆ แต่ทันทีที่คุณเล่นวิดีโอ จะเห็นได้ชัดว่าโมเดลนั้นสร้างขึ้นโดย AI ทั้งหมด การซิงโครไนซ์ระหว่างการแสดงออกทางสีหน้าของอวาตาร์และเสียงของพวกเขาค่อนข้างแปลก

เทคโนโลยีอวาตาร์แปลงข้อความเป็นคำพูดของ Azure ช่วยให้สามารถสร้างอวตารแบบโต้ตอบได้ ตัวอย่างที่สอง ที่แสดงความรู้สึกของหุบเขาอันแปลกประหลาด (สิ่งที่ทำเหมือนคน แต่ไม่ใช่ มนุษย์).

ตามที่ Microsoft กล่าว อวาตาร์แบบโต้ตอบใช้โมเดล Azure OpenAI Service GPT-3.5 เพื่อตอบคำถามของลูกค้า รวมถึงการสนทนาด้วยวาจากับลูกค้าในภาษาต่างๆ การทำเช่นนี้เพียงอย่างเดียวทำให้มีประโยชน์อย่างเหลือเชื่อ แต่ขอย้ำอีกครั้งว่า ปฏิสัมพันธ์นั้นดูไม่สมจริงและปราศจากปฏิสัมพันธ์ของมนุษย์ ซึ่งอาจรบกวนจิตใจสำหรับบางคนได้

ลองดูที่นี่:

ทันเวลา Microsoft อาจแก้ไขปัญหานี้ และด้วยเทคโนโลยี AI ใหม่ที่เกิดขึ้น ยักษ์ใหญ่ด้านเทคโนโลยีจาก Redmond สามารถเปลี่ยนอวตาร Azure ให้เป็นเครื่องมือที่ใช้ในอุตสาหกรรมได้ ทำไม เพราะบริษัทต่างๆ ชื่นชอบเครื่องมือนี้อยู่แล้ว

เรากำลังใช้บริการ Azure AI สำหรับ AI Banking Avatar ของเรา เนื่องจากการผสมผสานที่เป็นเอกลักษณ์ของบริการ AI และการแสดงภาพระดับแนวหน้าในแพลตฟอร์มเดียว ด้วยการใช้อวาตาร์ข้อความเป็นคำพูด Azure AI ที่แตกต่างกัน เราจะสามารถสร้างประสบการณ์ของลูกค้าในระดับต่อไป และทำให้การโต้ตอบทางธนาคารและการธนาคารง่ายขึ้นอย่างแท้จริง

เจอรัลด์ เอิร์ต กรรมการผู้จัดการ Commerzbank AG

อย่างไรก็ตาม Microsoft ไม่ได้คำนึงถึงการโต้ตอบของลูกค้ากับอวตารเหล่านี้ แม้ว่าพวกเขาจะเป็นตัวเลือกที่ถูกกว่ามากสำหรับบริษัทต่างๆ (และเร็วกว่าด้วย นักการตลาดควรจะสามารถสร้าง AI ที่สร้างขึ้นได้ บทช่วยสอนโดยไม่ต้องใช้แหล่งข้อมูลภายนอก) การขาดการแสดงออกทางกายภาพที่มีความหมายทำให้อวตารเหล่านี้ดูเหมือน หุ่นยนต์

AI ไม่สามารถละเลยได้ โดยเฉพาะอย่างยิ่งหากเรากำลังพูดถึงเครื่องมือต่างๆ เช่น Copilot on วินโดวส์ 11 หรือ ไมโครซอฟต์ 365แต่เมื่อมันอยากจะดูเหมือนมนุษย์ มันก็จะดูแปลกประหลาดทีเดียว

ไมโครซอฟต์จะปรับแต่งอวตารเหล่านี้อย่างไม่ต้องสงสัย แต่สำหรับตอนนี้ ฉันรู้สึกปวดหลังทุกครั้งที่มองไปที่หนึ่งในนั้น ยิ้มอย่างฝืนหรือไม่แสดงสีหน้าเลย

คุณคิดอย่างไรเกี่ยวกับอวตารเหล่านี้?

งานวันที่ 26 ตุลาคมของ Microsoft มีแนวโน้มที่จะมุ่งเน้นไปที่ Windows 10

งานวันที่ 26 ตุลาคมของ Microsoft มีแนวโน้มที่จะมุ่งเน้นไปที่ Windows 10Microsoft

Microsoft จะจัดงานในวันที่ 26 ตุลาคม 2559 ที่นิวยอร์กซิตี้ ซึ่งบริษัทจะจัดแสดงสิ่งที่จะมาพร้อม Windows 10 และเปิดตัวอุปกรณ์ของบุคคลที่หนึ่งในความคาดหมายของเหตุการณ์นี้ บริษัทได้อัปเดตเว็บไซต์ Micro...

อ่านเพิ่มเติม
คลาวด์ช่วยให้คุณปลอดภัยจากโนบีเลียม Microsoft กล่าว

คลาวด์ช่วยให้คุณปลอดภัยจากโนบีเลียม Microsoft กล่าวMicrosoftการโจมตีแบบฟิชชิ่ง

เมื่อสัปดาห์ที่แล้ว Microsoft เตือนผู้ใช้ users การโจมตีแบบฟิชชิ่งดำเนินการโดย กลุ่มแฮ็กเกอร์โนเบลบริษัท เสนอแผนปฏิบัติการที่จะช่วยป้องกันการโจมตีทางไซเบอร์ดังกล่าวในอนาคตTom Burt ของ Microsoft กล่...

อ่านเพิ่มเติม
การเปลี่ยนแปลง Cortana ใหม่จะช่วยให้คุณเพิ่มประสิทธิภาพการทำงาน

การเปลี่ยนแปลง Cortana ใหม่จะช่วยให้คุณเพิ่มประสิทธิภาพการทำงานMicrosoftCortana

ทุกคนที่รักแอปแบบอินเทอร์แอกทีฟคงคุ้นเคยกันดี Windows 10Cortana ของตัวเองมาก ผู้ช่วยเสียงนี้อยู่กับผู้ใช้ตั้งแต่ Windows 10 เวอร์ชันแรก โดยทำหน้าที่เป็น Alexa หรือ Google Assistant เวอร์ชันของ Micr...

อ่านเพิ่มเติม