DALL-E 3: τώρα σε «συμμαχία» με το ChatGPT!

Η OpenAI αποκαλύπτει το DALL-E 3. Η εφαρμογή Τεχνητής Νοημοσύνης για την παραγωγή εικόνων πλέον ενώνει τις δυνάμεις της με το ChatGPT!

Η τελευταία έκδοση του μοντέλου αξιοποιεί το GPT για να διευκολύνει τη δημιουργία πολύπλοκων και συνεκτικών εικόνων. Η OpenAI, η εταιρεία πίσω από το βασικό GPT, μόλις αποκάλυψε την ολοκαίνουργια έκδοση DALL-E 3. Και αυτή τη φορά, είναι η εικόνα που βρίσκεται ξανά στο προσκήνιο.

H τρίτη έκδοση της γεννήτριας εικόνων DALL-E υπόσχεται περισσότερη απόχρωση, λεπτομέρεια και πολυπλοκότητα. Το πρώτο σημείο που προτάθηκε από την OpenAI είναι η ακρίβεια των προτροπών. Ακόμη και οι καλύτερες αντίστοιχες εφαρμογές, όπως το Midjourney ή το DreamStudio, υποφέρουν από ένα κοινό πρόβλημα: τείνουν να αγνοούν ορισμένες λέξεις στο ερώτημα κειμένου. Για να επιτύχετε τα καλύτερα αποτελέσματα, πρέπει επομένως να μάθετε εμπειρικά να επικοινωνείτε με τον αλγόριθμο. Αυτό περιλαμβάνει πολλές δοκιμές λεξιλογίου και εκφράσεων για να βρεθούν εκείνες που είναι πιο πιθανό να ερμηνευθούν σωστά. Αυτή είναι μια άσκηση που μπορεί να είναι δύσκολη όταν ο χρήστης αναμένει ένα πολύ συγκεκριμένο αποτέλεσμα, εξ ου και ο όρος «πρότυπη μηχανική».

Το ChatGPT χρησιμοποιείται για τη σύνταξη προτροπών

Με το DALL-E 3, η OpenAI θέλει να βάλει τέλος σε αυτήν την κατάσταση πραγμάτων. «Τα σύγχρονα συστήματα μετατροπής κειμένου σε εικόνα τείνουν να αγνοούν λέξεις ή περιγραφές, κάτι που εκπαιδεύει τον χρήστη να μάθει άμεση μηχανική. Το DALL-E 3 αντιπροσωπεύει ένα μεγάλο βήμα προς τα εμπρός στην ικανότητά μας να παράγουμε εικόνες που προσκολλώνται ακριβώς στο παρεχόμενο κείμενο», λέει η εταιρεία.

Και για να γίνει αυτό, η εταιρεία έχει ήδη το τέλειο εργαλείο: το ChatGPT! Η νέα έκδοση του μοντέλου 3 είναι «εγγενώς χτισμένη» γύρω από το chatbot. Τώρα λειτουργεί ως ενδιάμεσος για να ερμηνεύσει κάθε λεπτομέρεια του αιτήματος. Το μοντέλο γλώσσας μπορεί επίσης να βοηθήσει τον χρήστη να δημιουργήσει εξαιρετικά λεπτομερείς προτροπές, έτσι ώστε το DALL-E να κατανοεί ακριβώς τι αναμένεται από αυτό χωρίς να καταφύγει σε προηγμένες τεχνικές άμεσης μηχανικής.

Και αν το αρχικό αποτέλεσμα δεν είναι κατάλληλο, δεν πειράζει. Το μόνο που έχετε να κάνετε είναι να περάσετε ξανά από το ChatGPT για να ζητήσετε συγκεκριμένες αλλαγές όσον αφορά το χρώμα, το σχήμα, το στυλ, μια συγκεκριμένη λεπτομέρεια… Με άλλα λόγια, η OpenAI έχει τραβήξει όλα τα στάδια για να προσφέρει μέγιστο βαθμό ελέγχου με ένα ελάχιστο προσπάθειας και τεχνικής εξειδίκευσης. Στα παραδείγματα που προτείνει η OpenAI, σημειώνουμε επίσης ότι το DALL-E 3 είναι ικανό να δημιουργεί συνεκτικά κείμενα. Αυτό είναι κάτι που οι γεννήτριες εικόνων είχαν πρόβλημα να κάνουν μέχρι πρότινος. Για παράδειγμα, η τελευταία έκδοση του Midjourney εξακολουθεί να παράγει αρκετά… εξωτικά αποτελέσματα.

Προστασία δημοσίων προσώπων

Η εταιρεία έχει, ωστόσο, επιβάλει συγκεκριμένο όρια. Οι μηχανικοί έχουν ενοποιήσει τις διασφαλίσεις που υπάρχουν ήδη στο DALL-E και στο DALL-E 2 που εμποδίζουν τον χρήστη να δημιουργήσει περιεχόμενο βίας, πορνογραφικό υλικό και ρητορική μίσους.
Επιπλέον, το DALL-E 3 έχει σχεδιαστεί έτσι ώστε να απορρίπτει ερωτήματα που αναφέρουν ρητά ένα δημόσιο πρόσωπο. Στόχος είναι να αποτραπεί η χρήση του για σκοπούς προπαγάνδας ή παραπληροφόρησης.

Σεβασμός της πνευματικής ιδιοκτησίας

Το άλλο σημαντικό σημείο αυτής της ενημέρωσης είναι ότι η OpenAI φαίνεται να έχει λάβει υπόψη τις πολυάριθμες επικρίσεις που έχουν απευθυνθεί στους διάφορους παραγωγούς εικόνων σχετικά με την πνευματική ιδιοκτησία. Από εδώ και πέρα, το DALL-E θα αρνείται αιτήματα που του ζητούν να μιμηθεί το στυλ ενός ζωντανού καλλιτέχνη. Αυτό θα κλείσει την πόρτα σε πολλές απόπειρες παραποίησης/απομίμησης.

Από την άλλη πλευρά, αυτό το σύστημα προστασίας θα είναι σίγουρα ατελές. Η ακρίβεια αυτής της τρίτης έκδοσης είναι ένα δίκοπο μαχαίρι. Θεωρητικά, ένας αρκετά οξυδερκής χρήστης θα είναι πάντα σε θέση να επιτύχει ένα αρκετά κοντινό αποτέλεσμα. Θα πρέπει απλώς να είστε σε θέση να περιγράψετε το στυλ του εν λόγω καλλιτέχνη με μεγάλη ακρίβεια χωρίς να τον ονομάσετε ρητά.

Ως ελάχιστη δικλείδα ασφαλείας, η OpenAI προσφέρει δύο λύσεις που επιτρέπουν σε έναν καλλιτέχνη να αρνηθεί να χρησιμοποιήσει τη δουλειά του για την εκπαίδευση του DALL-E. Το πρώτο είναι να συμπληρώσει μια σχετική φόρμα. Αλλά αν θέλετε να προστατέψετε έναν μεγάλο αριθμό από αυτά, όπως αυτά που διατηρείτε στο διαδικτυακό σας χαρτοφυλάκιο, το ιδανικό είναι να απαγορεύσετε την πρόσβαση στο πρόγραμμα ανίχνευσης GPTBot.

Αυτό θα περιορίσει σημαντικά την ικανότητα του DALL-E 3 να μιμείται τα εν λόγω έργα. Με την προϋπόθεση όμως ότι δεν έχουν ήδη ενσωματωθεί στο μοντέλο. Και αυτό είναι δυστυχώς αδύνατο να προσδιοριστεί στην πράξη, αφού τα δεδομένα πηγής δεν διατηρούνται μετά την ενσωμάτωση στο μοντέλο.

Το DALL-E3 θα κυκλοφορήσει επίσημα τον ερχόμενο Οκτώβριο για τους πελάτες των προσφορών ChatGPT Plus και ChatGPT Enterprise.

-----------
Κάποιες από τις αναρτήσεις μας μπορεί να περιέχουν συνδέσμους συνεργατών. Το Gizchina Greece μπορεί να λαμβάνει ένα μικρό ποσοστό, εάν κάνετε κλικ σε έναν σύνδεσμο και αγοράσετε κάποιο προιόν. Αν θέλετε περισσότερες λεπτομέρειες, εδώ μπορείτε να μάθετε πώς χρησιμοποιούμε τους συνδέσμους συνεργατών. Σας ευχαριστούμε για την υποστήριξη!

-----------

Ακολουθήστε το Gizchina Greece στο Google News για να μαθαίνετε πρώτοι και άμεσα, όλα τα τεχνολογικά νέα! Αν ψάχνετε HOT προσφορές, κάντε εγγραφή στο κανάλι μας στο Telegram!

[Πηγή] :

le journal du geek

All about China… στα ελληνικά!

Αφήνεις το κινητό στην πρίζα για πολλή ώρα; Δες τι κάνεις λάθος…

OnePlus: αυτά είναι τα SoC των νέων Nord 4 και Nord CE 4 Lite

Infinix GT 20 Pro: το κορυφαίο smartphone που ΔΕΝ μπορείς να αποκτήσεις!

Apple: χωρίς Mini LED οθόνες τελικά τα νέα iPad Air 12.9″

FOSSiBOT DT1 Lite: rugged tablet με Android 13 και FaceID; Εδώ, με 115€!

BMAX I9 Plus: ταμπλέτα με Android 12 και κορυφαίο VFM στα 69€! [Deal Alert!]

Samsung Unpacked: θα πραγματοποιηθεί στις 10 Ιουλίου – τι θα δούμε;

Apple Watch X: πιθανή χρήση λεπτότερης μητρικής πλακέτας

Zeblaze GTR 3 Pro: AMOLED οθόνη, σκελετός από ατσάλι με 24€!

1080P Wireless Security Camera: προσιτή ασφάλεια σε FHD, με έγχρωμη οθόνη μόλις 32€!

Hiseeu 8MP Security Camera: για πλήρη έλεγχο και ασφάλεια, σε προσφορά!

DLNRG PD320 Power Station: μπαταρία 320Wh για διακοπές, ΜΟΛΙΣ 101€!

1080P Wireless Security Camera: προσιτή ασφάλεια σε FHD, με έγχρωμη οθόνη μόλις 32€!

Hiseeu 8MP Security Camera: για πλήρη έλεγχο και ασφάλεια, σε προσφορά!

DLNRG PD320 Power Station: μπαταρία 320Wh για διακοπές, ΜΟΛΙΣ 101€!

1080P Wireless Security Camera: προσιτή ασφάλεια σε FHD, με έγχρωμη οθόνη μόλις 32€!

Hiseeu 8MP Security Camera: για πλήρη έλεγχο και ασφάλεια, σε προσφορά!

DLNRG PD320 Power Station: μπαταρία 320Wh για διακοπές, ΜΟΛΙΣ 101€!

EUROBIKE Cityrun-26 Electric City Bike: ολοκαίνουριο σε δυνατή προσφορά!!!

ANBERNIC RG35XX: «Nintendo τσέπης» με retro games από 45€!

Αφήνεις το κινητό στην πρίζα για πολλή ώρα; Δες τι κάνεις λάθος…

OnePlus: αυτά είναι τα SoC των νέων Nord 4 και Nord CE 4 Lite

Infinix GT 20 Pro: το κορυφαίο smartphone που ΔΕΝ μπορείς να αποκτήσεις!

DALL-E 3: τώρα σε «συμμαχία» με το ChatGPT!

Το ChatGPT χρησιμοποιείται για τη σύνταξη προτροπών

Προστασία δημοσίων προσώπων

Σεβασμός της πνευματικής ιδιοκτησίας

About the Author Στέλιος Αθανασoύλιας

More Stories

Xiaomi Mijia 1S: νέο κουπόνι για την ρομποτική σκούπα της Xiaomi!

DALL-E 3: τώρα σε «συμμαχία» με το ChatGPT!

Το ChatGPT χρησιμοποιείται για τη σύνταξη προτροπών

Προστασία δημοσίων προσώπων

Σεβασμός της πνευματικής ιδιοκτησίας

Next post Tronsmart Bang Max: το αδιάβροχο, RGB Bluetooth ηχείο, με ισχύ 130W σε σούπερ τιμή!

Previous post ALLDOCUBE GT BOOK: VFM laptop με 12GB RAM, 512GB SSD - μόλις 219€!

About the Author Στέλιος Αθανασoύλιας

More Stories