Αν και απέχει από την τελική του εμπορική μορφή, το νέο εργαλείο παραγωγής εικόνων Τεχνητής Νοημοσύνης της Apple με την ονομασία MGIE (MultiModal Large Language Model’s-Guided Image Editing) είναι διαθέσιμο στο GitHub μαζί με μία εργασία για το εγχείρημα που περιέχει οδηγίες χρήσης.
Το εργαλείο της Apple βασίζεται σε ένα πολυτροπικό μεγάλο γλωσσικό μοντέλο που δέχεται προτροπές και οδηγίες μέσω κειμένου για να αλλάζει ή να επεξεργάζεται εικόνες. Επί του παρόντος μπορεί να πραγματοποιεί απλές εργασίες επεξεργασίας εικόνας -π.χ. αύξηση αντίθεσης, φωτεινότητας ή μεταβολής της ισορροπίας λευκού- ωστόσο πολλές φορές επιχειρεί να βγάλει εις πέρας και περισσότερο περίπλοκες εντολές όπως το να κάνει μία… πίτσα πιο υγιεινή, χρησιμοποιώντας περισσότερα λαχανικά στα υλικά της.
Το MGIE μπορεί επίσης να περικόψει ή να αλλάξει το μέγεθος των εικόνων, να «γεμίσει» περιθώρια ή να αλλάξει το χρώμα των ματιών, των μαλλιών ή των ρούχων και να αφαιρέσει αντικείμενα από μία σύνθεση.