InstructDiffusion on võimeline mõistma semantilisi tähendusi ja kasutab neid teie piltide redigeerimiseks.
- InstructDiffusion on tehisintellekt, mis suudab semantiliste tähenduste mõistmiseks kasutada varasemaid juhiseid.
- Mudel on võimeline ka muljetavaldavaks üldistusvõimeks.
- Kui mudel on visuaalse vihje tundma õppinud, laiendab see seda oluliselt, et end veelgi rohkem treenida.
Microsofti uusim AI mudel, Juhenda difusiooni, muudab teie pilte või mis tahes pilti, mille saate vastavalt teie juhistele üles laadida. Microsoft Research Asia välja töötatud mudel on liides, mis ühendab tehisintellekti ja inimese juhised, et luua ja täita mitmesuguseid visuaalseid ülesandeid.
Teisisõnu valite pildi, mida soovite redigeerida, muuta või teisendada, ja InstructDiffusion loob oma arvutinägemuse, et muuta pilti teie sisendi põhjal.
Microsoft avaldas paber mudeli jaoks paar päeva tagasi ja InstructDiffusionil on juba a demo mänguväljak, kus saad mudelit ise proovida.
IntructDiffusioni peamine uuendus on see, et mudel ei vaja pildi kohta eelnevaid teadmisi, vaid selle asemel kasutab see pikslitega manipuleerimiseks difusiooniprotsessi. Mudel on võimeline kasutama palju kasulikke funktsioone, nagu segmenteerimine, võtmepunkti tuvastamine ja taastamine. Praktiliselt kasutab InstructDiffusion teie juhiseid pildi muutmiseks.
Ühes näites suutis Microsoft Research Asia eemaldada fotolt vesimärgi, andes mudelile lihtsalt käsu seda teha.
Microsofti InstructDiffusion suudab eristada teie juhiste taga olevat tähendust
InstructDiffusion, nagu paljud teised Microsofti AI mudelid, on ülesannete lahendamisel võimeline uuenduslikuks käitumiseks. Microsoft Research Asia väidab, et InstructDiffusion rakendab mõistmisülesandeid ja generatiivseid ülesandeid.
Mudel kasutab mõistvaid ülesandeid, nagu segmenteerimine ja võtmepunktide tuvastamine, et leida ala ja pikslid, mida soovite redigeerida.
Näiteks kasutab mudel segmenteerimist teie järgmise juhise ala edukaks leidmiseks: värvige pildist paremal olev mees punaseks. Võtmepunkti tuvastamiseks oleks juhis järgmine: kasutage kollast, et ümbritseda kujutise vasakpoolses servas oleva mehe põlv.
Generatiivsed ülesanded koosnevad toimetamis- ja taastamisülesannetest. Mitte ainult InstructDiffusion ei muuda teie pilti, vaid mudel genereerib teie juhiste põhjal ka pildi jaoks uusi elemente.
Microsoft InstructDiffusioni kõige lootustandvam funktsioon on selle võime edukalt üldistada kõiki saadud juhiseid, et kujundada ühtne ja sügav arusaam nende taga olevast tähendusest. Teisisõnu jätab mudel meelde teie antud juhised ja kasutab neid edukalt enda edasiseks treenimiseks.
Kuid mudel õpib ka eristama teie juhiste taga olevaid tähendusi, viies selle lahendama seninägematuid ülesandeid ja leidma uusi viise elementide loomiseks. See semantiliste tähenduste mõistmise võime asetab InstructDifussioni sammu võrra kaugemale kui teised sarnased mudelid: see ületab neid.
Kuid InstructDiffusion on ka samm edasi AGI-ni jõudmiseks: Mõistes sügavalt iga juhise semantilist tähendust ja suutes edukalt üldistada arvutinägemusi, edendab mudel oluliselt tehisintellekti arengut.
Microsoft Research Asia võimaldab teil seda proovida a demo mänguväljak, aga saate ka kasutada selle koodi treenida oma tehisintellekti mudelit.
Mis on teie arvamused selle mudeli kohta? Kas proovite?