InstructDiffusion este capabil să înțeleagă semnificațiile semantice și le va folosi pentru a vă edita imaginile.
- InstructDiffusion este un AI capabil să folosească instrucțiuni din trecut pentru a obține capacitatea de a înțelege semnificațiile semantice.
- Modelul este, de asemenea, capabil de capabilități impresionante de generalizare.
- Odată ce învață despre un indiciu vizual, modelul se va extinde foarte mult asupra acestuia pentru a se antrena și mai mult.
Cel mai recent model AI al Microsoft, Instruiți Difuziunea, îți va transforma radical imaginile sau orice imagine pe care o poți încărca, conform instrucțiunilor tale. Modelul, dezvoltat de Microsoft Research Asia, este o interfață care reunește AI și instrucțiuni umane pentru a genera și finaliza o varietate de sarcini vizuale.
Cu alte cuvinte, alegeți o imagine pe care doriți să o editați, să o modificați sau să o transformați, iar InstructDiffusion va genera viziunea computerizată pentru a schimba imaginea în funcție de intrarea dvs.
Microsoft a lansat hârtia pentru modelul de acum câteva zile, iar InstructDiffusion are deja un loc de joacă demonstrativ, unde poți încerca singur modelul.
Inovația cheie în IntructDiffusion este că modelul nu are nevoie de cunoștințe prealabile despre imagine, ci, în schimb, folosește un proces de difuzie pentru a manipula pixelii. Modelul este capabil de o mulțime de caracteristici utile, cum ar fi segmentarea, detectarea punctelor cheie și restaurarea. Practic, InstructDiffusion va folosi instrucțiunile tale pentru a schimba imaginea.
Într-un exemplu, Microsoft Research Asia a reușit să îndepărteze filigranul de pe o fotografie, prin simpla instruire modelului să facă acest lucru.
InstructDiffusion de la Microsoft este capabil să distingă semnificația din spatele instrucțiunilor dvs
InstructDiffusion, ca multe altele Modele Microsoft AI, este capabil de un comportament inovator atunci când vine vorba de rezolvarea sarcinilor. Microsoft Research Asia susține că InstructDiffusion implementează sarcini de înțelegere și sarcini generative.
Modelul va folosi sarcini de înțelegere, cum ar fi segmentarea și detectarea punctelor cheie pentru a localiza zona și pixelii pe care doriți să le editeze.
De exemplu, modelul folosește segmentarea pentru a localiza cu succes zona următoarei instrucțiuni: pictați în roșu omul din dreapta imaginii. Pentru detectarea punctelor cheie, o instrucțiune ar fi: folosiți galben pentru a înconjura genunchiul bărbatului din extrema stângă a imaginii.
Sarcinile generative sunt alcătuite din sarcini de editare și restaurare. Nu numai că InstructDiffusion vă va edita imaginea, dar modelul va genera și elemente noi pentru imagine, pe baza instrucțiunilor dumneavoastră.
Cea mai promițătoare caracteristică a Microsoft InstructDiffusion este capacitatea sa de a generaliza cu succes toate instrucțiunile pe care le primește pentru a forma o înțelegere coerentă și profundă a semnificației din spatele lor. Cu alte cuvinte, modelul își va aminti instrucțiunile pe care i le-ați dat și le va folosi cu succes pentru a se antrena și mai departe.
Dar modelul va învăța, de asemenea, să distingă semnificațiile din spatele instrucțiunilor tale, conducându-l să rezolve sarcini nevăzute și să vină cu noi modalități de a genera elemente. Această abilitate de a înțelege semnificațiile semantice plasează InstructDifussion cu un pas mai departe decât celelalte modele similare: le depășește.
Cu toate acestea, InstructDiffusion este, de asemenea, un pas mai departe pentru a ajunge la AGI: Înțelegând profund sensul semantic din spatele fiecărei instrucțiuni și fiind capabil să generalizeze cu succes viziunile computerizate, modelul va avansa mult dezvoltarea AI.
Microsoft Research Asia vă permite să îl încercați într-un loc de joacă demonstrativ, dar poți și tu folosește codul acestuia pentru a-ți antrena propriul model AI.
Ce pareri aveti despre acest model? Îl vei încerca?