DeepSeek: Τι είναι και πώς λειτουργεί

 

Η DeepSeek είναι μια κινεζική εταιρεία τεχνητής νοημοσύνης που ιδρύθηκε το 2023 από τον Liang Wenfeng, συνιδρυτή του hedge fund High-Flyer. Η εταιρεία εστιάζει στην ανάπτυξη ανοιχτού κώδικα μεγάλων γλωσσικών μοντέλων (LLMs) και έχει την έδρα της στο Hangzhou, Zhejiang, Κίνα. 

Το μοντέλο DeepSeek-R1 προσφέρει απαντήσεις συγκρίσιμες με άλλα σύγχρονα LLMs, όπως το GPT-4 της OpenAI, παρά το γεγονός ότι εκπαιδεύτηκε με σημαντικά χαμηλότερο κόστος -περίπου 6 εκατομμύρια δολάρια, σε σύγκριση με τα 100 εκατομμύρια δολάρια που απαιτήθηκαν για το GPT-4 το 2023- και χρησιμοποιώντας το ένα δέκατο της υπολογιστικής ισχύος ενός αντίστοιχου LLM. 

Στις 10 Ιανουαρίου 2025, η DeepSeek κυκλοφόρησε την πρώτη της δωρεάν εφαρμογή chatbot, βασισμένη στο μοντέλο DeepSeek-R1, για iOS και Android. Μέχρι τις 27 Ιανουαρίου, το DeepSeek-R1 είχε ξεπεράσει το ChatGPT ως η πιο κατεβασμένη δωρεάν εφαρμογή στο App Store των ΗΠΑ, προκαλώντας πτώση 18% στην τιμή της μετοχής της Nvidia. 

Οι καταναλωτές έχουν εκδηλώσει ζωηρό ενδιαφέρον για την τεχνολογία της DeepSeek, με την εφαρμογή AI assistant που κυκλοφόρησε στις αρχές του μήνα να σκαρφαλώνει στην πρώτη θέση του Apple App Store στις Ηνωμένες Πολιτείες και σε άλλες χώρες.

Πώς λειτουργεί 

Η διεπαφή της εφαρμογής είναι παρόμοια με εκείνη των ανταγωνιστών της, όπως το ChatGPT: Με την πληκτρολόγηση οποιασδήποτε ερώτησης ή αιτήματος, παράγει απαντήσεις – αν και προσώρας δεν δημιουργεί εικόνες. Η εφαρμογή είναι προς το παρόν διαθέσιμη σε συσκευές iOS και Android χωρίς χρέωση. 

Όπως και άλλα μοντέλα τεχνητής νοημοσύνης, το μοντέλο που τροφοδοτεί την DeepSeek, μπορεί να επεξεργαστεί και να φιλτράρει τεράστιους όγκους δεδομένων για να αναγνωρίσει μοτίβα, να κάνει προβλέψεις και να επιλύσει προβλήματα. 

Το μοντέλο έχει «εκπαιδευτεί» σε δεδομένα μέχρι τον Ιούλιο, οπότε δεν γνωρίζει για πιο πρόσφατα γεγονότα. Ωστόσο, μια επιλογή αναζήτησης μπορεί να σαρώσει πιο πρόσφατες πληροφορίες και τίτλους.

Νεότερη Παλαιότερη

نموذج الاتصال