Το ChatGPT μπορεί πλέον να «βλέπει, να ακούει και να μιλάει» ή, τουλάχιστον, να κατανοεί προφορικές λέξεις, να απαντά με μια «συνθετική» φωνή και να επεξεργάζεται εικόνες, όπως ανακοίνωσε η OpenAI.
Η ενημέρωση του chatbot – η μεγαλύτερη από την εισαγωγή του GPT-4 – επιτρέπει στους χρήστες να συμμετέχουν σε φωνητικές συνομιλίες με την εφαρμογή για κινητά του ChatGPT και να επιλέγουν μεταξύ πέντε διαφορετικών φωνών. Οι χρήστες θα μπορούν επίσης να μοιράζονται εικόνες με το ChatGPT και να επισημαίνουν τα κομμάτια της φωτογραφίας που θέλουν να εστιάσει το chatbot μέσω εντολών.
Οι αλλαγές θα είναι διαθέσιμες στους χρήστες που πληρώνουν συνδρομή τις επόμενες δύο εβδομάδες. Η φωνητική λειτουργία θα περιορίζεται στην εφαρμογή iOS και Android. Οι δυνατότητες επεξεργασίας εικόνας θα είναι διαθέσιμες σε όλες τις πλατφόρμες.
Η ανάπτυξη των νέων αυτών δυνατοτήτων εντάσσεται στο πλαίσιο της γενικότερης προπάθειας των εταιρειών OpenAI, Microsoft, Google και Anthropic να κερδίσουν τον «αγώνα» της τεχνητής νοημοσύνης.
Ειδικότερα, οι τεχνολογικοί κολοσσοί αγωνίζονται να λανσάρουν όχι μόνο νέες εφαρμογές chatbot, αλλά και νέες δυνατότητες. Η Google ανακοίνωσε μια σειρά από ενημερώσεις στο chatbot Bard και η Microsoft πρόσθεσε την οπτική αναζήτηση στο Bing.
Νωρίτερα φέτος, η επένδυση της Microsoft στο OpenAI με επιπλέον 10 δισεκατομμύρια δολάρια, την κατέστησε τη μεγαλύτερη στον κλάδο της τεχνητής νοημοσύνης για το έτος, σύμφωνα με το PitchBook.
Tags
Τεχνολογία