Microsofti InstructDiffusion redigeerib teie pilte teie juhiste järgi

InstructDiffusion on võimeline mõistma semantilisi tähendusi ja kasutab neid teie piltide redigeerimiseks.

InstructDiffusion on tehisintellekt, mis suudab semantiliste tähenduste mõistmiseks kasutada varasemaid juhiseid.
Mudel on võimeline ka muljetavaldavaks üldistusvõimeks.
Kui mudel on visuaalse vihje tundma õppinud, laiendab see seda oluliselt, et end veelgi rohkem treenida.

Microsofti uusim AI mudel, Juhenda difusiooni, muudab teie pilte või mis tahes pilti, mille saate vastavalt teie juhistele üles laadida. Microsoft Research Asia välja töötatud mudel on liides, mis ühendab tehisintellekti ja inimese juhised, et luua ja täita mitmesuguseid visuaalseid ülesandeid.

Teisisõnu valite pildi, mida soovite redigeerida, muuta või teisendada, ja InstructDiffusion loob oma arvutinägemuse, et muuta pilti teie sisendi põhjal.

Microsoft avaldas paber mudeli jaoks paar päeva tagasi ja InstructDiffusionil on juba a demo mänguväljak, kus saad mudelit ise proovida.

IntructDiffusioni peamine uuendus on see, et mudel ei vaja pildi kohta eelnevaid teadmisi, vaid selle asemel kasutab see pikslitega manipuleerimiseks difusiooniprotsessi. Mudel on võimeline kasutama palju kasulikke funktsioone, nagu segmenteerimine, võtmepunkti tuvastamine ja taastamine. Praktiliselt kasutab InstructDiffusion teie juhiseid pildi muutmiseks.

instagram story viewer

Ühes näites suutis Microsoft Research Asia eemaldada fotolt vesimärgi, andes mudelile lihtsalt käsu seda teha.

Microsofti InstructDiffusion suudab eristada teie juhiste taga olevat tähendust

InstructDiffusion, nagu paljud teised Microsofti AI mudelid, on ülesannete lahendamisel võimeline uuenduslikuks käitumiseks. Microsoft Research Asia väidab, et InstructDiffusion rakendab mõistmisülesandeid ja generatiivseid ülesandeid.

Mudel kasutab mõistvaid ülesandeid, nagu segmenteerimine ja võtmepunktide tuvastamine, et leida ala ja pikslid, mida soovite redigeerida.

Näiteks kasutab mudel segmenteerimist teie järgmise juhise ala edukaks leidmiseks: värvige pildist paremal olev mees punaseks. Võtmepunkti tuvastamiseks oleks juhis järgmine: kasutage kollast, et ümbritseda kujutise vasakpoolses servas oleva mehe põlv.

Generatiivsed ülesanded koosnevad toimetamis- ja taastamisülesannetest. Mitte ainult InstructDiffusion ei muuda teie pilti, vaid mudel genereerib teie juhiste põhjal ka pildi jaoks uusi elemente. microsoft instructeddiffusion

Microsoft InstructDiffusioni kõige lootustandvam funktsioon on selle võime edukalt üldistada kõiki saadud juhiseid, et kujundada ühtne ja sügav arusaam nende taga olevast tähendusest. Teisisõnu jätab mudel meelde teie antud juhised ja kasutab neid edukalt enda edasiseks treenimiseks.

Näide selle kohta, kuidas InstructDiffusion antud käsu puhul töötab.

Kuid mudel õpib ka eristama teie juhiste taga olevaid tähendusi, viies selle lahendama seninägematuid ülesandeid ja leidma uusi viise elementide loomiseks. See semantiliste tähenduste mõistmise võime asetab InstructDifussioni sammu võrra kaugemale kui teised sarnased mudelid: see ületab neid.

Kuid InstructDiffusion on ka samm edasi AGI-ni jõudmiseks: Mõistes sügavalt iga juhise semantilist tähendust ja suutes edukalt üldistada arvutinägemusi, edendab mudel oluliselt tehisintellekti arengut.

Microsoft Research Asia võimaldab teil seda proovida a demo mänguväljak, aga saate ka kasutada selle koodi treenida oma tehisintellekti mudelit.

Mis on teie arvamused selle mudeli kohta? Kas proovite?

Microsofti InstructDiffusion redigeerib teie pilte teie juhiste järgi

InstructDiffusion on võimeline mõistma semantilisi tähendusi ja kasutab neid teie piltide redigeerimiseks.

Microsofti InstructDiffusion suudab eristada teie juhiste taga olevat tähendust

Visual Studio 2015 C ++ kompilaatori varjatud koodid helistavad Microsofti telemeetriateenustele Microsoft Privaatsus

Miks omandas Microsoft LinkedIni?Linkedin Microsoft Pead Lugema

Microsoft laiendab Office 365 38 uue riigi ja 5 uue valuutaga Microsoft

Microsofti InstructDiffusion redigeerib teie pilte teie juhiste järgi

Microsofti InstructDiffusion suudab eristada teie juhiste taga olevat tähendust

Visual Studio 2015 C ++ kompilaatori varjatud koodid helistavad Microsofti telemeetriateenusteleMicrosoftPrivaatsus

Miks omandas Microsoft LinkedIni?LinkedinMicrosoftPead Lugema

Microsoft laiendab Office 365 38 uue riigi ja 5 uue valuutagaMicrosoft

Visual Studio 2015 C ++ kompilaatori varjatud koodid helistavad Microsofti telemeetriateenustele Microsoft Privaatsus

Miks omandas Microsoft LinkedIni?Linkedin Microsoft Pead Lugema

Microsoft laiendab Office 365 38 uue riigi ja 5 uue valuutaga Microsoft