InstructDiffusion-ს შეუძლია სემანტიკური მნიშვნელობების გაგება და გამოიყენებს მათ თქვენი სურათების რედაქტირებისთვის.
- InstructDiffusion არის AI, რომელსაც შეუძლია გამოიყენოს წარსული ინსტრუქციები სემანტიკური მნიშვნელობების გაგების უნარის მოსაპოვებლად.
- მოდელს ასევე აქვს შთამბეჭდავი განზოგადების შესაძლებლობები.
- მას შემდეგ, რაც ის შეიტყობს ვიზუალური ნიშნის შესახებ, მოდელი მნიშვნელოვნად გააფართოვებს მას, რათა კიდევ უფრო ივარჯიშოს.
Microsoft-ის უახლესი AI მოდელი, დიფუზიის ინსტრუქცია, რადიკალურად გარდაქმნის თქვენს სურათებს ან ნებისმიერ სურათს, რომელიც შეგიძლიათ ატვირთოთ, თქვენი ინსტრუქციის მიხედვით. მოდელი, შემუშავებული Microsoft Research Asia-ის მიერ, არის ინტერფეისი, რომელიც აერთიანებს AI და ადამიანის ინსტრუქციებს სხვადასხვა ვიზუალური ამოცანების გენერირებისთვის და შესასრულებლად.
სხვა სიტყვებით რომ ვთქვათ, თქვენ ირჩევთ სურათს, რომლის რედაქტირება, შეცვლა ან ტრანსფორმაცია გსურთ და InstructDiffusion მოუტანს თავის კომპიუტერულ ხედვას, რათა შეცვალოს სურათი თქვენი შეყვანის საფუძველზე.
Microsoft გამოუშვა ქაღალდი
მოდელისთვის რამდენიმე დღის წინ და InstructDiffusion-ს უკვე აქვს ა დემო მოედანი, სადაც შეგიძლიათ თავად სცადოთ მოდელი.IntructDiffusion-ის მთავარი ინოვაცია არის ის, რომ მოდელს არ სჭირდება სურათის წინასწარი ცოდნა, არამედ იყენებს დიფუზიის პროცესს პიქსელებით მანიპულირებისთვის. მოდელს შეუძლია ბევრი სასარგებლო ფუნქცია, როგორიცაა სეგმენტაცია, საკვანძო პუნქტის გამოვლენა და აღდგენა. პრაქტიკულად, InstructDiffusion გამოიყენებს თქვენს ინსტრუქციებს გამოსახულების შესაცვლელად.
ერთ მაგალითში, Microsoft Research Asia-მ შეძლო ჭვირნიშნის ამოღება ფოტოზე, უბრალოდ მოდელს ამის დავალებით.
Microsoft-ის InstructDiffusion-ს შეუძლია განასხვავოს თქვენი ინსტრუქციების მიღმა არსებული მნიშვნელობა
InstructDiffusion, ისევე როგორც მრავალი სხვა Microsoft AI მოდელები, შეუძლია ინოვაციური ქცევა, როდესაც საქმე ეხება ამოცანების გადაჭრას. Microsoft Research Asia ირწმუნება, რომ InstructDiffusion ახორციელებს გაგების ამოცანებს და გენერაციულ ამოცანებს.
მოდელი გამოიყენებს გაგების ამოცანებს, როგორიცაა სეგმენტაცია და საკვანძო წერტილების ამოცნობა იმ არეალის და პიქსელების დასადგენად, რომელთა რედაქტირებაც გსურთ.
მაგალითად, მოდელი იყენებს სეგმენტაციას, რათა წარმატებით დაადგინოს თქვენი შემდეგი ინსტრუქციის არეალი: შეღებეთ კაცი გამოსახულების მარჯვნივ. საკვანძო წერტილების აღმოსაჩენად, ინსტრუქცია იქნება: გამოიყენეთ ყვითელი, რათა შემოხაზოთ მამაკაცის მუხლი გამოსახულების მარცხნივ.
გენერაციული ამოცანები შედგება რედაქტირებისა და აღდგენითი ამოცანებისაგან. არა მხოლოდ InstructDiffusion დაარედაქტირებს თქვენს სურათს, არამედ მოდელი ასევე გამოიმუშავებს ახალ ელემენტებს სურათისთვის, თქვენი ინსტრუქციების საფუძველზე.
Microsoft InstructDiffusion-ის ყველაზე პერსპექტიული მახასიათებელია მისი უნარი წარმატებით განზოგადოს ყველა ინსტრუქცია, რომელიც მას იღებს, რათა ჩამოაყალიბოს მათ მიღმა არსებული მნიშვნელობის შეკრული და ღრმა გაგება. სხვა სიტყვებით რომ ვთქვათ, მოდელს დაიმახსოვრებს თქვენ მიერ მიცემული ინსტრუქციები და წარმატებით გამოიყენებს მათ საკუთარი თავის შემდგომი ვარჯიშისთვის.
მაგრამ მოდელი ასევე ისწავლის თქვენი ინსტრუქციების მიღმა არსებული მნიშვნელობების გარჩევას, მიიყვანს მას უხილავი ამოცანების გადაჭრაში და ელემენტების გენერირების ახალ გზებზე. სემანტიკური მნიშვნელობების გაგების ეს უნარი InstructDifussion-ს უფრო შორს აყენებს, ვიდრე სხვა მსგავს მოდელებს: ის აჯობებს მათ.
თუმცა, InstructDiffusion ასევე წინ გადადგმული ნაბიჯია AGI-მდე მისასვლელად: ყოველი ინსტრუქციის მიღმა სემანტიკური მნიშვნელობის ღრმად გაცნობიერებით და კომპიუტერული ხედვების წარმატებით განზოგადებათ, მოდელი მნიშვნელოვნად შეუწყობს ხელს ხელოვნური ინტელექტის განვითარებას.
Microsoft Research Asia საშუალებას გაძლევთ სცადოთ იგი ა დემო მოედანი, მაგრამ თქვენ ასევე შეგიძლიათ გამოიყენეთ მისი კოდი საკუთარი AI მოდელის მომზადება.
რა აზრის ხართ ამ მოდელზე? ეცდები?