Liang Wenfeng: Ο 40χρονος «σπασίκλας» της DeepSeek που φέρνει πανικό στις ΗΠΑ
Τετάρτη, 29/01/2025 - 17:19Ποιος βρίσκεται πίσω από τη DeepSeek, του κινεζικού αντιπάλου του ChatGPT, που είναι πολύ πιο φτηνή σε σχέση με τους αμερικανικούς κολοσσούς της τεχνητής νοημοσύνης (ΑΙ), και προκαλεί πανικό στις ΗΠΑ και πτώση στο χρηματιστήριο της Γουόλ Στριτ;
Ο λόγος για τον 39χρονο Liang Wenfeng, ιδρυτή της κινεζικής νεοσύστατης επιχείρησης τεχνητής νοημοσύνης, ο οποίος έγινε μέσα σε λίγες εβδομάδες το πρόσωπο της τεχνολογικής βιομηχανίας της Κίνας.
Ως «σπασίκλας» των μαθηματικών που είχε όραμα να δημιουργήσει τεχνητή νοημοσύνη ανθρώπινου επιπέδου, ο Liang μίλησε στους συναδέλφους του νωρίτερα στην καριέρα του για τα σχέδιά του, αλλά αντιμετωπίστηκε με σκεπτικισμό.
«Όταν τον πρωτογνωρίσαμε, ήταν ένας πολύ σπασίκλας με απαίσιο χτένισμα που μιλούσε για τη δημιουργία ενός cluster 10.000 τσιπ για να εκπαιδεύσει τα δικά του μοντέλα. Δεν τον πήραμε στα σοβαρά», δήλωσε στους Financial Times ένας από τους συνεργάτες του.
«Δεν μπορούσε να εκφράσει το όραμά του παρά μόνο να πει: Θέλω να το φτιάξω αυτό και θα αλλάξει το παιχνίδι».
Γιος δύο δασκάλων δημοτικού σχολείου, ο Liang μεγάλωσε στην πόλη-λιμάνι Zhanjiang και ήταν μαθητής με άριστα και πάθος για τα μαθηματικά.
Δίδασκε μόνος του μαθηματικά εκτός των μαθημάτων, ενώ στο γυμνάσιο, και ο πρώην δάσκαλός του είπε στους δημοσιογράφους ότι πάντα φρόντιζε να μπορεί να ισορροπεί «εργασία και ξεκούραση, σαν να μπορούσε να μάθει καλά κάθε μάθημα χωρίς να ξοδεύει πολύ χρόνο στη μελέτη».
Έχοντας σπουδάσει μαθηματικά πανεπιστημιακού επιπέδου ενώ ήταν ακόμα νεαρός έφηβος, ο Liang συνέχισε να σπουδάζει τεχνολογία πληροφοριών στο διάσημο Πανεπιστήμιο Zhejiang της Κίνας.
Το κολέγιο εδρεύει στο Χανγκτσόου, ένα τεχνολογικό κέντρο, αλλά ξεκίνησε την καριέρα του στα χρηματοοικονομικά.
Η πρώτη εταιρεία
Λίγα χρόνια μετά την αποφοίτησή του ίδρυσε την επενδυτική εταιρεία Jacobi, που πήρε το όνομά της από τον Γερμανό μαθηματικό Carl Jacobi.
Το 2015, ίδρυσε το High-Flyer, το οποίο θα γινόταν ένα από τα κορυφαία hedge funds της Κίνας και θα του δημιουργούσε μια περιουσία, χρησιμοποιώντας τεχνητή νοημοσύνη και αλγορίθμους για να εντοπίζει μοτίβα που θα επηρέαζαν τις τιμές των μετοχών.
Η ομάδα του χρησιμοποιούσε μικροτσίπ της Nvidia και λέγεται ότι πήρε τους καλύτερους ανθρώπους του μαζί του από την εταιρεία για να ιδρύσει την DeepSeek το 2023.
Ο Liang προσέλαβε πολλούς νέους απόφοιτους από τα κορυφαία σχολεία της Κίνας, λέγοντας σε πρόσφατη συνέντευξή του ότι τα κριτήρια επιλογής της εταιρείας του ήταν το «πάθος και η περιέργεια».
Λέγεται ότι εμπλέκεται σε μεγάλο βαθμό στην καθημερινή λειτουργία της εταιρείας και προωθεί μια ελεύθερη και συνεργατική κουλτούρα, σύμφωνα με έναν πρώην υπάλληλο.
Κοιμόταν στο γραφείο
Ο διευθύνων σύμβουλος λέγεται ότι δούλευε μέχρι αργά τη νύχτα με την ομάδα του, αναφέρει η Wall Street Journal, και κοιμόταν ακόμη και στο γραφείο καθώς έτρεχαν να ολοκληρώσουν τα έργα.
Η απόφασή του να καταστήσει τον κώδικα της DeepSeek ανοιχτού κώδικα ήταν καθοριστική, καθώς ήθελε να αντισταθεί στην τάση των μεγάλων τεχνολογικών εταιρειών.
«Για τους τεχνολόγους, το να παρακολουθούν άλλοι τη δουλειά σου δίνει μια μεγάλη αίσθηση ολοκλήρωσης», δήλωσε σε συνέντευξή του πέρυσι στο 36Kr. «Ο ανοιχτός κώδικας είναι περισσότερο μια κουλτούρα παρά μια εμπορική συμπεριφορά και η συνεισφορά σε αυτόν μας κερδίζει το σεβασμό».
Το Πεκίνο άρχισε επιτέλους να δίνει προσοχή στην DeepSeek τις τελευταίες εβδομάδες, με τους ειδικούς να λένε ότι ενώ αρχικά δεν ήταν «ο εκλεκτός» των κινεζικών νεοφυών επιχειρήσεων τεχνητής νοημοσύνης, η ταχεία άνοδός της θα την οδηγήσει στο να έχει πρόσβαση σε πόρους και να θεωρείται παράδειγμα.
Με τα σχέδια του Liang για την DeepSeek να αποδίδουν τώρα, τα κινεζικά κρατικά μέσα ενημέρωσης πανηγύρισαν για το έργο της εταιρείας που δείχνει ότι ακόμη και με περιορισμένη υπολογιστική ισχύ, οι εταιρείες μπορούν να «δημιουργήσουν θαύματα».
Αναγνώριση από το Πεκίνο
Ο Liang, σύμφωνα με το Reuters, είχε κρατήσει εξαιρετικά χαμηλό προφίλ μέχρι τις 20 Ιανουαρίου, όταν ήταν ένα από τα εννέα άτομα που κλήθηκαν να δώσουν ομιλία σε ένα συνέδριο κεκλεισμένων των θυρών που διοργάνωσε ο πρωθυπουργός της Κίνας Λι Κιάνγκ.
Πέρυσι και το 2023 έδωσε δύο σπάνιες συνεντεύξεις στο κινεζικό μέσο ενημέρωσης Waves, αλλά πέρα από αυτό έχει μείνει κυρίως μακριά από τα φώτα της δημοσιότητας.
Στο συνέδριο, η νεανική εμφάνιση του millennial ήρθε σε αντίθεση με τους γκριζομάλληδες ακαδημαϊκούς, αξιωματούχους και επικεφαλής κρατικών ομίλων που κάθονταν γύρω του, όπως έδειξαν φωτογραφίες και βίντεο που δημοσίευσε ο κινεζικός ραδιοτηλεοπτικός οργανισμός CCTV.
Όμως το γεγονός ότι ο Liang προσκλήθηκε να μοιραστεί τις απόψεις του σχετικά με την πολιτική της κινεζικής κυβέρνησης υπογραμμίζει την αναγνώριση από το Πεκίνο του ρόλου της DeepSeek στην πιθανή ανατροπή της παγκόσμιας τάξης τεχνητής νοημοσύνης, υπέρ της Κίνας.
Η DeepSeek λάνσαρε την περασμένη εβδομάδα έναν δωρεάν βοηθό τεχνητής νοημοσύνης που, σύμφωνα με την εταιρεία, χρησιμοποιεί λιγότερα δεδομένα σε ένα κλάσμα του κόστους των σημερινών υπηρεσιών, προκαλώντας παγκόσμιο «ξεπούλημα» στις μετοχές τεχνολογίας.
Πέρυσι, ο διευθύνων σύμβουλος της Baidu Robin Li μίλησε σε παρόμοιο συνέδριο υπό την προεδρία του Κινέζου πρωθυπουργού. Ο Li, ο οποίος ανακοίνωσε ότι ο πρώτος αντίπαλος του ChatGPT της Κίνας θα γίνει τον Μάρτιο του 2023, δήλωσε σε συνέντευξή του την ίδια χρονιά ότι η Κίνα δεν θα αναδημιουργήσει ποτέ την επιτυχία του OpenAI που υποστηρίζεται από τη Microsoft και ότι οι κινεζικές επιχειρήσεις θα πρέπει να επικεντρωθούν στην εφαρμογή των υφιστάμενων μοντέλων τεχνητής νοημοσύνης για εμπορικούς σκοπούς.
Υπό την ηγεσία του Liang, η DeepSeek απέφυγε σκόπιμα την κατασκευή εφαρμογών. Αντ’ αυτού, συγκέντρωσε το ερευνητικό ταλέντο και τους πόρους της στη δημιουργία ενός μοντέλου που θα μπορούσε να ταιριάξει ή και να βελτιώσει το OpenAI, και ελπίζει ότι στο μέλλον θα συνεχίσει να επικεντρώνεται σε μοντέλα αιχμής που θα χρησιμοποιηθούν από άλλες εταιρείες για την κατασκευή προϊόντων τεχνητής νοημοσύνης που απευθύνονται σε καταναλωτές και επιχειρήσεις.
Η προσέγγιση του Liang ξεχώρισε σε μια κινεζική τεχνολογική βιομηχανία που είχε συνηθίσει να παίρνει καινοτομίες από το εξωτερικό, από εφαρμογές για smartphone έως ηλεκτρικά οχήματα, και να τις επεκτείνει γρήγορα, συχνά πολύ πιο γρήγορα από τις χώρες στις οποίες έγιναν για πρώτη φορά οι εφευρέσεις.
«Η Τεχνητή Νοημοσύνη της Κίνας δεν μπορεί να βρίσκεται στη θέση να ακολουθεί για πάντα. Συχνά λέμε ότι υπάρχει ένα χάσμα ενός ή δύο ετών μεταξύ της Τεχνητής Νοημοσύνης της Κίνας και των Ηνωμένων Πολιτειών, αλλά το πραγματικό χάσμα είναι η διαφορά μεταξύ πρωτοτυπίας και μίμησης», δήλωσε ο Liang σε συνέντευξή του στο Waves τον Ιούλιο του περασμένου έτους.
Οι συνεντεύξεις του Liang αποκαλύπτουν την πεποίθηση ότι η τεχνολογική βιομηχανία της Κίνας είχε φτάσει σε ένα σταυροδρόμι όπου δεν είχε την αυτοπεποίθηση αλλά όχι και το κεφάλαιο που απαιτείται για να εμπλακεί σε θεμελιώδεις καινοτομίες στον τομέα της έρευνας και ανάπτυξης.
Η δωρεάν εφαρμογή του DeepSeek
Η κυκλοφορία του R1, του τελευταίου μοντέλου της κινεζικής start-up, αρχικά δεν τράβηξε την προσοχή στις ΗΠΑ.
Όμως, αυτό το σαββατοκύριακο η DeepSeek (κάτω ο Liang Wenfeng, διευθύνων σύμβουλος της εταιρείας) έγινε η δωρεάν εφαρμογή την οποία κατέβασαν περισσότερο oι χρήστες από το αμερικανικό διαδικτυακό κατάστημα της Apple, ξεπερνώντας το ChatGPT της OpenAI, που ξεκίνησε την κούρσα της τεχνητής νοημοσύνης στα τέλη του 2022.
Το R1 είναι “εντυπωσιακό”, δήλωσε χθες Δευτέρα το βράδυ ο Σαμ Άλτμαν, επικεφαλής της OpenAI. “Κυρίως με δεδομένο όσα μπορούν να προσφέρουν με αυτή την τιμή”, πρόσθεσε στο X.
Οι δυνατότητες του νέου κινεζικού μοντέλου, οι οποίες θεωρούνται ισάξιες με εκείνες των αμερικανικών ηγετών του κλάδου, προκαλούν ανησυχία καθώς αποκτήθηκαν με ελάχιστο κόστος.
Διαβάστε επίσης: DeepSeek: Η κινεζική τεχνητή νοημοσύνη που απείλησε την αμερικανική υπεροχή έγινε στόχος μαζικής κυβερνοεπίθεσης
Η start-up έχει αναφέρει ότι δαπάνησε μόνο 5,6 εκατομμύρια δολάρια για την ανάπτυξή του, ένα ποσό αμελητέο σε σχέση με τα δισεκατομμύρια που επένδυσαν οι αμερικανικές εταιρείες, κυρίως για εξαρτήματα αιχμής.
“Μας παρακινεί ιδιαίτερα που έχουμε έναν νέο ανταγωνιστή”, δήλωσε ο Άλτμαν, διαβεβαιώνοντας ότι η OpenAI θα “προφανώς θα προσφέρει πολύ καλύτερα μοντέλα”.
“Το DeepSeek R1 είναι η στιγμή Σπούτνικ της ΑΙ”, δήλωσε ο Μαρκ Αντρέεσεν, επενδυτής στον τομέα της τεχνολογίας, παρομοιάζοντας το R1 με την εκτόξευση του πρώτου τεχνητού δορυφόρου από την Σοβιετική Ένωση το 1957, ένα γεγονός που είχε ξαφνιάσει τον δυτικό κόσμο.
Ανταγωνισμός ΗΠΑ-Κίνας και η κατάρρευση της Nvidia
Για να διατηρήσουν την κυρίαρχη θέση τους στον τομέα της τεχνητής νοημοσύνης οι ΗΠΑ επέβαλαν ελέγχους στις εξαγωγές των ημιαγωγών αιχμής.
Καθώς είναι κινεζική, η DeepSeek δεν είχε κατά συνέπεια πρόσβαση στα ακριβά και υπερσύγχρονα τσιπ της καλιφορνέζικης εταιρείας Nvidia, τα οποία χρησιμοποιούνται για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, όπως το ChatGPT.
“Εάν η Κίνα ξεπεράσει γρήγορα τις ΗΠΑ στην κούρσα της ΑΙ, η οικονομία της τεχνητής νοημοσύνης θα ανατραπεί”, προειδοποίησε η Καθλίν Μπρουκς, διευθύντρια ερευνών στην XTB, σε σημείωμα προς τους πελάτες.
Η Nvidia, η οποία απογειώθηκε τα τελευταία δύο χρόνια χάρη στη μεγάλη ζήτηση για τα εξαρτήματά της, κατέρρευσε στο αμερικανικό χρηματιστήριο χθες, χάνοντας σχεδόν 590 δισεκατομμύρια δολάρια.
Ο Σάτια Ναντέλα, επικεφαλής της Microsoft, δήλωσε στα κοινωνικά δίκτυα ότι μια φθηνότερη τεχνητή νοημοσύνη είναι ωφέλιμη για όλους. Αλλά στο Παγκόσμιο Οικονομικό Φόρουμ του Νταβός την περασμένη εβδομάδα ζήτησε να “πάρουμε πάρα πολύ σοβαρά τις εξελίξεις στην Κίνα”.
Η εταιρεία του σχεδιάζει να επενδύσει 80 δισεκατομμύρια δολάρια στην τεχνητή νοημοσύνη φέτος. Η Meta (Facebook, Instagram) ανακοίνωσε από την πλευρά της την Παρασκευή ότι οι κεφαλαιακές της δαπάνες θα αυξηθούν τουλάχιστον κατά 60 δισεκατομμύρια δολάρια φέτος, κυρίως λόγω της ΑΙ.