Microsofts InstructDiffusion vil redigere bildene dine etter instruksjonene dine

InstructDiffusion er i stand til å forstå semantiske betydninger og vil bruke dem til å redigere bildene dine.

  • InstructDiffusion er en AI som er i stand til å bruke tidligere instruksjoner for å få muligheten til å forstå semantiske betydninger.
  • Modellen er også i stand til imponerende generaliseringsevner.
  • Når den først har lært om en visuell pekepinn, vil modellen utvide den kraftig for å trene seg selv ytterligere.
microsoft instruksjonsdiffusjon

Microsofts nyeste AI-modell, Instruer diffusjon, vil radikalt transformere bildene dine, eller et hvilket som helst bilde du kan laste opp, i henhold til instruksjonene dine. Modellen, utviklet av Microsoft Research Asia, er et grensesnitt som samler AI og menneskelige instruksjoner for å generere og fullføre en rekke visuelle oppgaver.

Med andre ord, du velger et bilde som du vil redigere, endre eller transformere, og InstructDiffusion vil få datasynet til å endre bildet basert på input.

Microsoft utgitt avisen for modellen for noen dager siden, og InstructDiffusion har allerede en demo lekeplass, hvor du kan prøve modellen selv.

Nøkkelinnovasjonen i IntructDiffusion er at modellen ikke trenger forkunnskaper om bildet, men i stedet bruker den en diffusjonsprosess for å manipulere piksler. Modellen er i stand til mange nyttige funksjoner som segmentering, nøkkelpunktdeteksjon og restaurering. Praktisk talt vil InstructDiffusion bruke instruksjonene dine for å endre bildet.

I ett eksempel var Microsoft Research Asia i stand til å fjerne vannmerket på et bilde ved ganske enkelt å instruere modellen om å gjøre det.

Microsofts InstructDiffusion er i stand til å skille betydningen bak instruksjonene dine

InstructDiffusion, som mange andre Microsoft AI-modeller, er i stand til innovativ oppførsel når det gjelder å løse oppgaver. Microsoft Research Asia hevder at InstructDiffusion implementerer forståelsesoppgaver og generative oppgaver.

Modellen vil bruke forståelsesoppgaver, som segmentering og nøkkelpunktdeteksjon for å finne området og piksler som du vil at den skal redigere.

For eksempel bruker modellen segmentering for å lykkes med å finne området for følgende instruksjon: mal mannen til høyre for bildet rød. For nøkkelpunktdeteksjon vil en instruksjon være: bruk gult for å omringe kneet til mannen helt til venstre i bildet.

De generative oppgavene består av redigerings- og gjenopprettingsoppgaver. Ikke bare InstructDiffusion vil redigere bildet ditt, men modellen vil også generere nye elementer for bildet, basert på instruksjonene dine.microsoft instruksjonsdiffusjon

Microsoft InstructDiffusions mest lovende funksjon er dens evne til å lykkes med å generalisere alle instruksjonene den mottar for å danne en sammenhengende og dyp forståelse av meningen bak dem. Modellen vil med andre ord huske instruksjonene du ga den, og den vil med hell bruke dem til å trene seg selv videre.

Et eksempel på hvordan InstructDiffusion fungerer på en gitt instruksjon.

Men modellen vil også lære å skille betydninger bak instruksjonene dine, noe som fører til at den løser usynlige oppgaver og kommer opp med nye måter å generere elementer på. Denne evnen til å forstå semantiske betydninger plasserer InstructDifussion et skritt lenger enn de andre lignende modellene: den utkonkurrerer dem.

InstructDiffusion er imidlertid også et skritt videre for å nå AGI: Ved å forstå den semantiske betydningen bak hver instruksjon, og være i stand til å generalisere datasyn, vil modellen i stor grad fremme AI-utviklingen.

Microsoft Research Asia lar deg prøve det i en demo lekeplass, men du kan også bruk dens kode å trene din egen AI-modell.

Hva er dine meninger om denne modellen? Vil du prøve det?

Full Windows 8-nettbrett under $ 100 på vei

Full Windows 8-nettbrett under $ 100 på veiMicrosoftWindows 8 Nettbrett

Akkurat nå er det allerede mange billig og gode Windows 8-nettbrett, med priser mellom $ 200 og $ 300, men det ser ut til at enda billigere skifer er på vei. I følge en fersk rapport kan et ikke så...

Les mer
Microsoft avdekker en ny telefon - og det er ikke det du forventer

Microsoft avdekker en ny telefon - og det er ikke det du forventerMicrosoftNokia

Microsoft avduket en ny telefon, og det er ikke den etterlengtede Overflatetelefon. Teknologigiganten lanserte Nokia 216, en funksjonstelefon på første nivå som fokuserer på tre elementer: apper, m...

Les mer
Microsoft bringer Office Insider-program til iPhone- og iPad-brukere

Microsoft bringer Office Insider-program til iPhone- og iPad-brukereMicrosoftMicrosoft Office Insider

Microsoft har vant seg til å være vert for betaprogrammer for de fleste viktige tjenester. Det er utvilsomt en god ting, ettersom det gir folk en sjanse til å prøve ut kommende funksjoner og implem...

Les mer