InstructDiffusion spēj izprast semantiskās nozīmes un izmantos tās attēlu rediģēšanai.
- InstructDiffusion ir AI, kas spēj izmantot iepriekšējās instrukcijas, lai iegūtu spēju izprast semantiskās nozīmes.
- Modelis spēj arī iespaidīgas vispārināšanas iespējas.
- Kad modelis uzzina par vizuālo norādi, tas to ievērojami paplašinās, lai apmācītu sevi vēl vairāk.

Microsoft jaunākais AI modelis, Norādīt difūziju, radikāli pārveidos jūsu attēlus vai jebkuru attēlu, ko varat augšupielādēt saskaņā ar jūsu norādījumiem. Microsoft Research Asia izstrādātais modelis ir saskarne, kas apvieno AI un cilvēka norādījumus, lai ģenerētu un izpildītu dažādus vizuālos uzdevumus.
Citiem vārdiem sakot, jūs izvēlaties attēlu, kuru vēlaties rediģēt, mainīt vai pārveidot, un InstructDiffusion ieviesīs savu datora redzējumu, lai mainītu attēlu, pamatojoties uz jūsu ievadīto informāciju.
Microsoft izlaida papīrs modelim pirms dažām dienām, un InstructDiffusion jau ir a demo rotaļu laukums, kur modeli var izmēģināt pats.
Galvenais IntructDiffusion jauninājums ir tāds, ka modelim nav nepieciešamas priekšzināšanas par attēlu, bet tā vietā tas izmanto difūzijas procesu, lai manipulētu ar pikseļiem. Modelis spēj izmantot daudzas noderīgas funkcijas, piemēram, segmentāciju, atslēgas punktu noteikšanu un atjaunošanu. Praktiski InstructDiffusion izmantos jūsu norādījumus, lai mainītu attēlu.
Vienā piemērā Microsoft Research Asia spēja noņemt ūdenszīmi no fotoattēla, vienkārši norādot modelim to darīt.
Microsoft InstructDiffusion spēj atšķirt jūsu norādījumu nozīmi
InstructDiffusion, tāpat kā daudzas citas Microsoft AI modeļi, spēj uz novatorisku uzvedību, kad runa ir par uzdevumu risināšanu. Microsoft Research Asia apgalvo, ka InstructDiffusion īsteno izpratnes uzdevumus un ģenerējošus uzdevumus.
Modelis izmantos izpratnes uzdevumus, piemēram, segmentāciju un atslēgas punktu noteikšanu, lai atrastu apgabalu un pikseļus, kurus vēlaties rediģēt.
Piemēram, modelī tiek izmantota segmentācija, lai veiksmīgi atrastu jūsu tālāk norādītās instrukcijas apgabalu: krāsojiet vīrieti attēla labajā pusē sarkanā krāsā. Atslēgpunktu noteikšanai norādījumi būtu šādi: izmantojiet dzelteno krāsu, lai apņemtu vīrieša ceļgalu attēla tālākajā kreisajā pusē.
Ģeneratīvos uzdevumus veido rediģēšanas un atjaunošanas uzdevumi. Ne tikai InstructDiffusion rediģēs jūsu attēlu, bet modelis arī ģenerēs jaunus attēla elementus, pamatojoties uz jūsu norādījumiem.
Microsoft InstructDiffusion daudzsološākā funkcija ir tā spēja veiksmīgi vispārināt visus saņemtos norādījumus, lai veidotu vienotu un dziļu izpratni par to nozīmi. Citiem vārdiem sakot, modelis atcerēsies norādījumus, ko tam devāt, un tas veiksmīgi izmantos tos, lai apmācītu sevi vēl tālāk.

Bet modelis arī iemācīsies atšķirt nozīmes aiz jūsu norādījumiem, kā rezultātā tas risinās neredzētus uzdevumus un izdomās jaunus veidus, kā ģenerēt elementus. Šī spēja izprast semantiskās nozīmes novieto InstructDifussion soli tālāk nekā citi līdzīgi modeļi: tas pārspēj tos.
Tomēr InstructDiffusion ir arī solis tālāk lai sasniegtu AGI: Dziļi izprotot katras instrukcijas semantisko nozīmi un spējot veiksmīgi vispārināt datora redzējumu, modelis ievērojami veicinās AI attīstību.
Microsoft Research Asia ļauj to izmēģināt a demo rotaļu laukums, bet jūs varat arī izmantojiet tā kodu lai apmācītu savu AI modeli.
Kāds ir jūsu viedoklis par šo modeli? Vai izmēģināsi?