InstructDiffusion je sposoben razumeti semantične pomene in jih bo uporabil za urejanje vaših slik.
- InstructDiffusion je umetna inteligenca, ki je sposobna uporabiti pretekla navodila za pridobitev sposobnosti razumevanja semantičnih pomenov.
- Model je zmožen tudi impresivnih zmožnosti posploševanja.
- Ko izve za vizualno iztočnico, jo bo model močno razširil, da se bo še bolj uril.
Microsoftov najnovejši model AI, Instruct Diffusion, bo radikalno spremenil vaše slike ali katero koli sliko, ki jo lahko naložite v skladu z vašimi navodili. Model, ki ga je razvil Microsoft Research Asia, je vmesnik, ki združuje AI in človeška navodila za ustvarjanje in dokončanje različnih vizualnih nalog.
Z drugimi besedami, izberete sliko, ki jo želite urediti, spremeniti ali preoblikovati, InstructDiffusion pa bo s svojim računalniškim vidom spremenil sliko na podlagi vašega vnosa.
Microsoft je izdal papir za model pred nekaj dnevi, InstructDiffusion pa že ima demo igrišče, kjer lahko model preizkusite tudi sami.
Ključna novost v IntructDiffusion je, da model ne potrebuje predhodnega znanja o sliki, ampak namesto tega uporablja postopek difuzije za manipulacijo slikovnih pik. Model ima veliko uporabnih funkcij, kot so segmentacija, zaznavanje ključnih točk in obnavljanje. Praktično bo InstructDiffusion uporabil vaša navodila za spremembo slike.
V enem primeru je Microsoft Research Asia lahko odstranil vodni žig na fotografiji tako, da je preprosto naročil modelu, naj to stori.
Microsoftov InstructDiffusion lahko razloči pomen vaših navodil
InstructDiffusion, kot mnogi drugi Microsoftovi modeli AI, je sposoben inovativnega vedenja pri reševanju nalog. Microsoft Research Asia trdi, da InstructDiffusion izvaja naloge razumevanja in generativne naloge.
Model bo uporabil naloge razumevanja, kot sta segmentacija in zaznavanje ključnih točk, da poišče območje in slikovne pike, ki jih želite urediti.
Na primer, model uporablja segmentacijo za uspešno lociranje območja vašega naslednjega navodila: človeka na desni strani slike pobarvajte rdeče. Za zaznavanje ključnih točk bi bilo navodilo: uporabite rumeno, da obkrožite koleno moškega na skrajni levi strani slike.
Generativne naloge so sestavljene iz montažnih in restavratorskih nalog. Ne samo, da bo InstructDiffusion uredil vašo sliko, ampak bo model ustvaril tudi nove elemente za sliko na podlagi vaših navodil.
Najbolj obetavna lastnost programa Microsoft InstructDiffusion je njegova zmožnost uspešnega posploševanja vseh prejetih navodil za oblikovanje kohezivnega in globokega razumevanja pomena za njimi. Z drugimi besedami, model si bo zapomnil navodila, ki ste mu jih dali, in jih bo uspešno uporabil za nadaljnje usposabljanje.
Toda model se bo prav tako naučil razlikovati pomene za vašimi navodili, kar ga bo vodilo k reševanju nevidnih nalog in do novih načinov za ustvarjanje elementov. Ta sposobnost razumevanja semantičnih pomenov postavlja InstructDifussion korak dlje od drugih podobnih modelov: prekaša jih.
Vendar je InstructDiffusion tudi korak dlje za dosego AGI: Z globokim razumevanjem semantičnega pomena za vsakim navodilom in sposobnostjo uspešnega posploševanja računalniških vizij bo model močno pospešil razvoj umetne inteligence.
Microsoft Research Asia vam omogoča, da ga preizkusite v a demo igrišče, lahko pa tudi uporabite njegovo kodo za usposabljanje lastnega modela AI.
Kakšno je vaše mnenje o tem modelu? Boste poskusili?