InstructDiffusion is in staat semantische betekenissen te begrijpen en zal deze gebruiken om uw afbeeldingen te bewerken.
- InstructDiffusion is een AI die instructies uit het verleden kan gebruiken om semantische betekenissen te begrijpen.
- Het model beschikt ook over indrukwekkende generalisatiemogelijkheden.
- Zodra het een visueel signaal leert, zal het model dit enorm uitbreiden om zichzelf nog verder te trainen.
Het nieuwste AI-model van Microsoft, Instrueer diffusie, zal uw afbeeldingen, of elke afbeelding die u kunt uploaden, radicaal transformeren volgens uw instructies. Het model, ontwikkeld door Microsoft Research Asia, is een interface die AI en menselijke instructies samenbrengt om een verscheidenheid aan visuele taken te genereren en te voltooien.
Met andere woorden, u kiest een afbeelding die u wilt bewerken, wijzigen of transformeren, en InstructDiffusion zal zijn computervisie tot stand brengen om de afbeelding te veranderen op basis van uw invoer.
Microsoft vrijgegeven de krant
voor het model een paar dagen geleden, en InstructDiffusion heeft al een demonstratie speeltuin, waar u het model zelf kunt uitproberen.De belangrijkste innovatie in IntructDiffusion is dat het model geen voorkennis van de afbeelding nodig heeft, maar in plaats daarvan een diffusieproces gebruikt om pixels te manipuleren. Het model biedt veel nuttige functies, zoals segmentatie, keypoint-detectie en herstel. In de praktijk zal InstructDiffusion uw instructies gebruiken om de afbeelding te wijzigen.
In één voorbeeld kon Microsoft Research Asia het watermerk van een foto verwijderen door het model eenvoudigweg de opdracht te geven dit te doen.
Microsoft's InstructDiffusion kan de betekenis achter uw instructies onderscheiden
InstructDiffusion, net als vele andere Microsoft AI-modellen, is in staat tot innovatief gedrag als het gaat om het oplossen van taken. Microsoft Research Asia beweert dat InstructDiffusion begripstaken en generatieve taken implementeert.
Het model gebruikt inzichtstaken, zoals segmentatie en keypoint-detectie, om het gebied en de pixels te lokaliseren die u wilt bewerken.
Het model gebruikt bijvoorbeeld segmentatie om met succes het gebied van uw volgende instructie te lokaliseren: schilder de man rechts van de afbeelding rood. Voor keypoint-detecties zou een instructie zijn: gebruik geel om de knie van de man uiterst links in het beeld te omcirkelen.
De generatieve taken bestaan uit bewerkings- en restauratieve taken. Niet alleen InstructDiffusion zal uw afbeelding bewerken, maar het model zal ook nieuwe elementen voor de afbeelding genereren, op basis van uw instructies.
De meest veelbelovende functie van Microsoft InstructDiffusion is het vermogen om met succes alle ontvangen instructies te generaliseren om een samenhangend en diep begrip te krijgen van de betekenis erachter. Met andere woorden: het model onthoudt de instructies die u hem hebt gegeven en zal deze met succes gebruiken om zichzelf nog verder te trainen.
Maar het model leert ook de betekenissen achter uw instructies te onderscheiden, waardoor het onzichtbare taken kan oplossen en nieuwe manieren kan bedenken om elementen te genereren. Dit vermogen om semantische betekenissen te begrijpen plaatst InstructDifussion een stap verder dan de andere vergelijkbare modellen: het presteert beter dan hen.
InstructDiffusion gaat echter ook nog een stap verder om AGI te bereikenDoor de semantische betekenis achter elke instructie diepgaand te begrijpen en in staat te zijn computervisies met succes te generaliseren, zal het model de AI-ontwikkeling enorm bevorderen.
Met Microsoft Research Asia kunt u het proberen in een demonstratie speeltuin, maar dat kan ook gebruik de code ervan om uw eigen AI-model te trainen.
Wat is uw mening over dit model? Ga je het proberen?