InstructDiffusion je schopen porozumět sémantickým významům a použije je k úpravě vašich obrázků.
- InstructDiffusion je AI schopná používat minulé instrukce k získání schopnosti porozumět sémantickým významům.
- Model je také schopen působivých možností zobecnění.
- Jakmile se naučí o vizuálním podnětu, model jej značně rozšíří, aby se ještě dále trénoval.
nejnovější model AI společnosti Microsoft, Pokyn Difuze, radikálně změní vaše obrázky nebo jakýkoli obrázek, který můžete nahrát, podle vašich pokynů. Model vyvinutý společností Microsoft Research Asia je rozhraní, které spojuje AI a lidské instrukce pro generování a plnění různých vizuálních úkolů.
Jinými slovy, vyberete si obrázek, který chcete upravit, změnit nebo transformovat, a InstructDiffusion vyvolá své počítačové vidění, aby změnil obrázek na základě vašeho vstupu.
Microsoft vydal papír pro model před několika dny a InstructDiffusion již má a demo hřiště, kde si model můžete sami vyzkoušet.
Klíčovou inovací v IntructDiffusion je to, že model nepotřebuje předchozí znalost obrázku, ale místo toho používá k manipulaci s pixely proces difúze. Model je schopen mnoha užitečných funkcí, jako je segmentace, detekce klíčových bodů a obnova. InstructDiffusion prakticky použije vaše pokyny ke změně obrázku.
V jednom příkladu společnost Microsoft Research Asia dokázala odstranit vodoznak z fotografie pouhým pokynem modelu, aby tak učinil.
InstructDiffusion společnosti Microsoft je schopen rozlišit význam vašich pokynů
InstructDiffusion, jako mnoho dalších Modely Microsoft AI, je schopen inovativního chování, pokud jde o řešení úkolů. Microsoft Research Asia tvrdí, že InstructDiffusion implementuje úkoly porozumění a generativní úkoly.
Model bude využívat úlohy porozumění, jako je segmentace a detekce klíčových bodů, k nalezení oblasti a pixelů, které chcete upravit.
Model například používá segmentaci k úspěšnému nalezení oblasti vašeho následujícího pokynu: namalujte muže napravo od obrázku červenou barvou. Pro detekci klíčových bodů by instrukce zněla: použijte žlutou k obkroužení kolena muže zcela vlevo na obrázku.
Generativní úlohy se skládají z editačních a obnovovacích úloh. Nejen, že InstructDiffusion upraví váš obrázek, ale model také vygeneruje nové prvky pro obrázek na základě vašich pokynů.
Nejslibnější funkcí Microsoft InstructDiffusion je jeho schopnost úspěšně zobecnit všechny pokyny, které obdrží, a vytvořit tak soudržné a hluboké porozumění významu, který se za nimi skrývá. Jinými slovy, model si zapamatuje pokyny, které jste mu dali, a úspěšně je použije k dalšímu tréninku.
Model se ale také naučí rozlišovat významy za vašimi instrukcemi, což jej povede k řešení neviditelných úkolů a vymýšlení nových způsobů generování prvků. Tato schopnost porozumět sémantickým významům staví InstructDifussion o krok dále než ostatní podobné modely: překonává je.
InstructDiffusion je však také o krok dále k dosažení AGI: Díky hlubokému porozumění sémantickému významu každého pokynu a schopnosti úspěšně zobecňovat počítačové vize tento model výrazně posune vývoj AI.
Microsoft Research Asia vám umožňuje vyzkoušet si to v a demo hřiště, ale můžete také použijte jeho kód trénovat svůj vlastní model umělé inteligence.
Jaké jsou vaše názory na tento model? Zkusíš to?