InstructDiffusion สามารถเข้าใจความหมายเชิงความหมายได้ และจะใช้ความหมายเหล่านั้นเพื่อแก้ไขภาพของคุณ
- InstructDiffusion เป็น AI ที่สามารถใช้คำสั่งในอดีตเพื่อให้เข้าใจความหมายเชิงความหมายได้
- โมเดลนี้ยังมีความสามารถในการวางนัยทั่วไปที่น่าประทับใจอีกด้วย
- เมื่อเรียนรู้เกี่ยวกับภาพแล้ว โมเดลจะขยายออกไปอย่างมากเพื่อฝึกฝนตัวเองให้ดียิ่งขึ้น
โมเดล AI ล่าสุดของ Microsoft สั่งสอนการแพร่กระจายจะเปลี่ยนรูปภาพของคุณอย่างรุนแรง หรือรูปภาพใดๆ ที่คุณสามารถอัปโหลดได้ ตามคำแนะนำของคุณ โมเดลดังกล่าวพัฒนาโดย Microsoft Research Asia เป็นอินเทอร์เฟซที่รวบรวม AI และคำสั่งของมนุษย์เพื่อสร้างและทำงานด้านภาพที่หลากหลาย
กล่าวอีกนัยหนึ่ง คุณเลือกรูปภาพที่คุณต้องการแก้ไข เปลี่ยนแปลง หรือแปลง และ InstructDiffusion จะนำคอมพิวเตอร์วิทัศน์มาเปลี่ยนรูปภาพตามอินพุตของคุณ
ไมโครซอฟต์เปิดตัว กระดาษ สำหรับโมเดลเมื่อไม่กี่วันที่ผ่านมา และ InstructDiffusion ก็มีอยู่แล้ว สนามเด็กเล่นสาธิตที่คุณสามารถลองโมเดลได้ด้วยตัวเอง
นวัตกรรมที่สำคัญใน IntructDiffusion คือโมเดลไม่จำเป็นต้องมีความรู้เกี่ยวกับภาพมาก่อน แต่จะใช้กระบวนการกระจายเพื่อจัดการพิกเซลแทน โมเดลนี้มีคุณลักษณะที่เป็นประโยชน์มากมาย เช่น การแบ่งส่วน การตรวจจับจุดสำคัญ และการกู้คืน ในทางปฏิบัติ InstructDiffusion จะใช้คำแนะนำของคุณเพื่อเปลี่ยนรูปภาพ
ในตัวอย่างหนึ่ง Microsoft Research Asia สามารถลบลายน้ำบนภาพถ่ายได้ เพียงแค่สั่งให้โมเดลลบลายน้ำ
InstructDiffusion ของ Microsoft สามารถแยกแยะความหมายเบื้องหลังคำสั่งของคุณได้
InstructDiffusion เช่นเดียวกับอื่นๆ อีกมากมาย แบบจำลอง Microsoft AIมีความสามารถในการประพฤติตนเป็นนวัตกรรมใหม่เมื่อต้องแก้ไขปัญหางาน Microsoft Research Asia อ้างว่า InstructDiffusion ดำเนินงานด้านความเข้าใจและงานเชิงสร้างสรรค์
โมเดลจะใช้การทำความเข้าใจ เช่น การแบ่งส่วนและการตรวจจับจุดสำคัญ เพื่อค้นหาพื้นที่และพิกเซลที่คุณต้องการแก้ไข
ตัวอย่างเช่น โมเดลใช้การแบ่งส่วนเพื่อค้นหาพื้นที่ของคำสั่งต่อไปนี้: ทาสีผู้ชายทางด้านขวาของภาพเป็นสีแดง สำหรับการตรวจจับจุดสำคัญ คำสั่งจะเป็นดังนี้: ใช้สีเหลืองโอบรอบเข่าของชายที่อยู่ด้านซ้ายสุดของภาพ
งานสร้างประกอบด้วยงานแก้ไขและบูรณะ ไม่เพียงแต่ InstructDiffusion จะแก้ไขรูปภาพของคุณ แต่โมเดลจะสร้างองค์ประกอบใหม่สำหรับรูปภาพตามคำแนะนำของคุณ
คุณลักษณะที่มีแนวโน้มมากที่สุดของ Microsoft InstructDiffusion คือความสามารถในการสรุปคำสั่งทั้งหมดที่ได้รับได้สำเร็จ เพื่อสร้างความเข้าใจที่เหนียวแน่นและลึกซึ้งเกี่ยวกับความหมายเบื้องหลัง กล่าวอีกนัยหนึ่ง โมเดลจะจดจำคำสั่งที่คุณให้ไว้ และจะใช้คำสั่งเหล่านั้นเพื่อฝึกฝนตัวเองให้ดียิ่งขึ้นไปอีกได้สำเร็จ
แต่โมเดลยังจะเรียนรู้ที่จะแยกแยะความหมายที่อยู่เบื้องหลังคำสั่งของคุณ ซึ่งนำไปสู่การแก้ไขงานที่มองไม่เห็นและคิดวิธีใหม่ในการสร้างองค์ประกอบ ความสามารถในการเข้าใจความหมายเชิงความหมายนี้ทำให้ InstructDifussion ก้าวไปไกลกว่าโมเดลอื่นๆ ที่คล้ายกัน: มันมีประสิทธิภาพเหนือกว่าโมเดลเหล่านั้น
อย่างไรก็ตาม InstructDiffusion ก็เป็นอีกก้าวหนึ่งเช่นกัน เพื่อเข้าถึง AGI: ด้วยการเข้าใจความหมายเชิงความหมายเบื้องหลังทุกคำสั่งอย่างลึกซึ้ง และความสามารถในการสรุปภาพรวมของคอมพิวเตอร์วิทัศน์ได้สำเร็จ โมเดลดังกล่าวจะพัฒนาการพัฒนา AI ได้อย่างมาก
Microsoft Research Asia ให้คุณทดลองใช้งานได้ใน สนามเด็กเล่นสาธิตแต่คุณก็สามารถทำได้เช่นกัน ใช้รหัสของมัน เพื่อฝึกฝนโมเดล AI ของคุณเอง
คุณมีความคิดเห็นอย่างไรกับโมเดลนี้? คุณจะลองไหม?