Το InstructDiffusion είναι ικανό να κατανοεί σημασιολογικές έννοιες και θα τις χρησιμοποιήσει για να επεξεργαστεί τις εικόνες σας.
- Το InstructDiffusion είναι ένα AI ικανό να χρησιμοποιεί προηγούμενες οδηγίες για να αποκτήσει την ικανότητα κατανόησης σημασιολογικών σημασιών.
- Το μοντέλο είναι επίσης ικανό για εντυπωσιακές δυνατότητες γενίκευσης.
- Μόλις μάθει για μια οπτική ένδειξη, το μοντέλο θα επεκταθεί σε μεγάλο βαθμό σε αυτό για να εξασκηθεί ακόμη περισσότερο.

Το πιο πρόσφατο μοντέλο AI της Microsoft, Instruct Diffusion, θα μεταμορφώσει ριζικά τις εικόνες σας ή οποιαδήποτε εικόνα μπορείτε να ανεβάσετε, σύμφωνα με τις οδηγίες σας. Το μοντέλο, που αναπτύχθηκε από τη Microsoft Research Asia, είναι μια διεπαφή που συνδυάζει οδηγίες τεχνητής νοημοσύνης και ανθρώπου για τη δημιουργία και την ολοκλήρωση μιας ποικιλίας οπτικών εργασιών.
Με άλλα λόγια, επιλέγετε μια εικόνα που θέλετε να επεξεργαστείτε, να αλλάξετε ή να μεταμορφώσετε, και το InstructDiffusion θα επιφέρει την όραση του υπολογιστή του για να αλλάξει την εικόνα με βάση τα σχόλιά σας.
Η Microsoft κυκλοφόρησε το χαρτί για το μοντέλο πριν από λίγες μέρες, και το InstructDiffusion έχει ήδη ένα επίδειξη παιδική χαρά, όπου μπορείτε να δοκιμάσετε το μοντέλο μόνοι σας.
Η βασική καινοτομία στο IntructDiffusion είναι ότι το μοντέλο δεν χρειάζεται προηγούμενη γνώση της εικόνας, αλλά αντίθετα, χρησιμοποιεί μια διαδικασία διάχυσης για να χειριστεί pixel. Το μοντέλο είναι ικανό για πολλά χρήσιμα χαρακτηριστικά, όπως τμηματοποίηση, ανίχνευση σημείων κλειδιού και επαναφορά. Πρακτικά, το InstructDiffusion θα χρησιμοποιήσει τις οδηγίες σας για να αλλάξει την εικόνα.
Σε ένα παράδειγμα, η Microsoft Research Asia μπόρεσε να αφαιρέσει το υδατογράφημα σε μια φωτογραφία, δίνοντας απλώς εντολή στο μοντέλο να το κάνει.
Το InstructDiffusion της Microsoft είναι σε θέση να διακρίνει το νόημα πίσω από τις οδηγίες σας
Το InstructDiffusion, όπως και πολλά άλλα Μοντέλα τεχνητής νοημοσύνης της Microsoft, είναι ικανός για καινοτόμο συμπεριφορά όταν πρόκειται για την επίλυση εργασιών. Η Microsoft Research Asia ισχυρίζεται ότι το InstructDiffusion υλοποιεί εργασίες κατανόησης και εργασίες δημιουργίας.
Το μοντέλο θα χρησιμοποιεί εργασίες κατανόησης, όπως τμηματοποίηση και ανιχνεύσεις σημείων κλειδιού για να εντοπίσει την περιοχή και τα εικονοστοιχεία που θέλετε να επεξεργαστεί.
Για παράδειγμα, το μοντέλο χρησιμοποιεί τμηματοποίηση για να εντοπίσει με επιτυχία την περιοχή της ακόλουθης εντολής: βάψτε το άτομο στα δεξιά της εικόνας με κόκκινο χρώμα. Για ανίχνευση σημείων κλειδιού, μια οδηγία θα ήταν: χρησιμοποιήστε το κίτρινο για να περικυκλώσετε το γόνατο του άνδρα στο αριστερό άκρο της εικόνας.
Οι εργασίες δημιουργίας αποτελούνται από εργασίες επεξεργασίας και αποκατάστασης. Όχι μόνο το InstructDiffusion θα επεξεργαστεί την εικόνα σας, αλλά το μοντέλο θα δημιουργήσει επίσης νέα στοιχεία για την εικόνα, με βάση τις οδηγίες σας.
Το πιο πολλά υποσχόμενο χαρακτηριστικό του Microsoft InstructDiffusion είναι η ικανότητά του να γενικεύει με επιτυχία όλες τις οδηγίες που λαμβάνει για να σχηματίσει μια συνεκτική και βαθιά κατανόηση του νοήματος πίσω από αυτές. Με άλλα λόγια, το μοντέλο θα θυμάται τις οδηγίες που του δώσατε και θα τις χρησιμοποιήσει με επιτυχία για να εκπαιδευτεί ακόμα περισσότερο.

Αλλά το μοντέλο θα μάθει επίσης να διακρίνει τις έννοιες πίσω από τις οδηγίες σας, οδηγώντας το να λύνει αόρατες εργασίες και να βρει νέους τρόπους για τη δημιουργία στοιχείων. Αυτή η ικανότητα κατανόησης σημασιολογικών σημασιών τοποθετεί το InstructDifussion ένα βήμα παραπέρα από τα άλλα παρόμοια μοντέλα: τα ξεπερνά.
Ωστόσο, το InstructDiffusion είναι επίσης ένα βήμα παραπέρα για να φτάσουμε στο AGI: Κατανοώντας σε βάθος το σημασιολογικό νόημα πίσω από κάθε οδηγία και έχοντας τη δυνατότητα να γενικεύει επιτυχώς τα οράματα υπολογιστών, το μοντέλο θα προωθήσει σημαντικά την ανάπτυξη τεχνητής νοημοσύνης.
Η Microsoft Research Asia σάς επιτρέπει να το δοκιμάσετε σε α επίδειξη παιδική χαρά, αλλά μπορείτε επίσης χρησιμοποιήστε τον κωδικό του για να εκπαιδεύσετε το δικό σας μοντέλο AI.
Ποια είναι η γνώμη σας για αυτό το μοντέλο; Θα το δοκιμάσετε;