Τα τελευταία τρία χρόνια, ο κλάδος της τεχνητής νοημοσύνης βρίσκεται σε μια διαρκή προσπάθεια για την κατασκευή και εκπαίδευση μοντέλων. Αυτό σημαίνει μεγαλύτερα μοντέλα με μεγαλύτερα clusters και περισσότερη υπολογιστική ισχύ, απαιτώντας μεγαλύτερες ποσότητες δεδομένων, υπολογιστική ικανότητα και χρήματα.
Καθώς τα μοντέλα αρχίζουν να συγκλίνουν ως προς τις δυνατότητές τους και οι προμηθευτές πλατφορμών τεχνητής νοημοσύνης επιδιώκουν πλέον να περιορίσουν ή να διαχειριστούν την πρόσβαση στα πιο ισχυρά και ακριβά μοντέλα τους, αυτές οι εταιρείες μετατοπίζονται από την αξίωση για μερίδιο στην αγορά προς πιο επιχειρηματικά προσανατολισμένες και πρακτικές ανάγκες χρέωσης και μέτρησης της πρόσβασης σε αυτά τα μοντέλα. Οι εταιρείες τεχνητής νοημοσύνης αρχίζουν να μοιάζουν περισσότερο με παραδοσιακές εταιρείες υπολογιστικού νέφους παρά με πρωτοποριακά ερευνητικά εργαστήρια τεχνητής νοημοσύνης.
Το επόμενο πεδίο μάχης στην τεχνητή νοημοσύνη είναι η συμπερασματολογία, η πράξη της εκτέλεσης εκπαιδευμένων μοντέλων σε πραγματικά προϊόντα, για πραγματικούς χρήστες, εκατομμύρια ή δισεκατομμύρια φορές την ημέρα. Το διακύβευμα μετατοπίζεται από την αύξηση της ισχύος και της ικανότητας προς την προσιτή τιμή, την ιδιωτικότητα και την κατανάλωση ενέργειας. Πρόσφατες αναφορές από παράγοντες της αγοράς δείχνουν ότι οι επενδυτές παρακολουθούν μια μετακίνηση από τη ζήτηση που απαιτεί εντατική εκπαίδευση προς τη συμπερασματολογία, όπου αυτόνομοι πράκτορες και υπηρεσίες τεχνητής νοημοσύνης που λειτουργούν συνέχεια δημιουργούν ένα σταθερό επίπεδο κατανάλωσης τεχνητής νοημοσύνης.
Η εξαγωγή συμπερασμάτων είναι το μακροπρόθεσμο παιχνίδι
Τα μεγάλα, υψηλής απόδοσης πρωτοποριακά μοντέλα απαιτούν μήνες εκπαίδευσης και δισεκατομμύρια δολάρια σε υλικό, ενέργεια, δίκτυα και ανθρώπινο δυναμικό. Ωστόσο, μόλις το μοντέλο τεθεί σε λειτουργία, η προσοχή στρέφεται στην παραγωγή εσόδων από τη λειτουργία του, κάτι που είναι γνωστό ως “εξαγωγή συμπερασμάτων”. Κάθε εντολή, ερώτηση, συμπλήρωση κώδικα, επεξεργασία εικόνας, απάντηση εξυπηρέτησης πελατών και ροή εργασιών με τη συμμετοχή πράκτορα συνεπάγεται ένα κόστος για την εξαγωγή συμπερασμάτων.
Η προσέγγιση των δύο φάσεων από τη βιομηχανία της τεχνητής νοημοσύνης στην ανάπτυξη και στη λειτουργικοποίηση μοντέλων είναι παρόμοια με την προσέγγιση των εταιρειών cloud computing. Αυτές οι εταιρείες επενδύουν σημαντικά στην ανάπτυξη data centers που μπορούν να χειριστούν μεγάλα, μεταβλητά φορτία. Μόλις πραγματοποιηθεί η μεγάλη επένδυση κεφαλαίου, το ενδιαφέρον μετατοπίζεται στη δημιουργία εσόδων βάσει κατανάλωσης. Υπό αυτή την έννοια, η τεχνητή νοημοσύνη δεν είναι κάτι καινούργιο.
Η εκπαίδευση μοιάζει με ένα έργο κεφαλαίου υψηλής έντασης. Η εξαγωγή συμπερασμάτων μοιάζει με μετρητή παροχής υπηρεσιών κοινής ωφέλειας. Μόλις η τεχνητή νοημοσύνη γίνει μια υπηρεσία που οι άνθρωποι θα χρησιμοποιούν όλη μέρα, ο ανταγωνισμός δεν θα αφορά μόνο την ποιότητα του μοντέλο, αλλά και το πού λαμβάνει χώρα η εξαγωγή συμπερασμάτων, πόσο κοστίζει, ποιος τη διαχειρίζεται, πόσο γρήγορα ανταποκρίνεται και αν ταιριάζει στα συστήματα που χρησιμοποιούν ήδη οι εταιρείες.
Γι’ αυτό και μετατοπίζεται το κέντρο βάρους της αγοράς. Η McKinsey εκτιμά ότι η εξαγωγή συμπερασμάτων θα ξεπεράσει την εκπαίδευση μοντέλων ως το κυρίαρχο αντικείμενο εργασίας των data centers τεχνητής νοημοσύνης μέχρι το 2030, αντιπροσωπεύοντας πάνω από το 50% του cloud computing της τεχνητής νοημοσύνης και περίπου το 30%-40% της συνολικής παγκόσμιας ζήτησης των data centers. Αντιλαμβανόμενη τη μετάβαση από την ανάπτυξη μοντέλων στην εξαγωγή συμπερασμάτων, η Nvidia προωθεί πλέον την GPU Blackwell με βάση το συνολικό κόστος ιδιοκτησίας για την εξαγωγή συμπερασμάτων, υποστηρίζοντας ότι η βελτιστοποίηση πλήρους στοίβας μπορεί να μειώσει το συνολικό κόστος ιδιοκτησίας έως και 35 φορές.
Το νέο πλεονέκτημα είναι το κόστος ανά απάντηση
Η πρόκληση για τα μοντέλα τεχνητής νοημοσύνης είναι ότι πολλά μοντέλα μπορούν να δίνουν παρόμοια αποτελέσματα. Τα μοντέλα δέχονται άμεσες εισαγωγές, είτε μέσω συνομιλίας είτε μέσω διεπαφών βασισμένων σε API, και παρέχουν γενικές εξόδους που μπορούν να χρησιμοποιηθούν σε ένα ευρύ φάσμα εφαρμογών. Αυτό καθιστά τα μοντέλα τεχνητής νοημοσύνης πολύ λιγότερο “κολλημένα” και το ανταγωνιστικό τους πλεονέκτημα πιο επιφανειακό, σε αντίθεση με τις εταιρείες cloud computing που έχουν καταστήσει σε μεγάλο βαθμό πολύ πιο δύσκολη την αλλαγή λόγω των ειδικών για κάθε προμηθευτή ενσωματώσεων με δυνατότητες αποθήκευσης, επεξεργασίας και λειτουργιών δεδομένων.
Αυτή η πραγματικότητα ευνοεί τους πελάτες που μπορούν να κατανέμουν τις εργασίες τεχνητής νοημοσύνης μεταξύ διαφορετικών μοντέλων στο cloud και τοπικών μοντέλων. Μια απλή εργασία δεν απαιτεί το πιο ακριβό μοντέλο. Ένα πιο περίπλοκο ερώτημα μπορεί να χρειάζεται εξειδικευμένη επεξεργασία. Μια επιχειρηματική ροή εργασιών υψηλής αξίας μπορεί να δικαιολογεί τη χρήση ενός μεγαλύτερου μοντέλου, αλλά μόνο αν το αποτέλεσμα οδηγεί σε μετρήσιμη εξοικονόμηση κόστους ή έσοδα. Καθώς οι συμπεράσματα των μοντέλων τεχνητής νοημοσύνης γίνονται πιο ακριβά, οι οργανισμοί θα έχουν κίνητρο να “κουμπώνουν” κάθε εργασία στο φθηνότερο σύστημα που μπορεί να την εκτελέσει αποτελεσματικά.
Οι εταιρείες τεχνητής νοημοσύνης πρέπει να δώσουν μεγαλύτερη προσοχή στο ευρύτερο οικοσύστημα, πέρα από τις απλές δυνατότητες των μοντέλων. Αυτό αντικατοπτρίζει ό,τι συνέβη στον χώρο του cloud computing, όπου οι πρώτοι που εισήλθαν στην αγορά επικεντρώθηκαν μόνο στις ακατέργαστες δυνατότητες αποθήκευσης και υπολογιστικής ισχύος. Με την πάροδο του χρόνου, αυτές οι πλατφόρμες ωρίμασαν και ξεπέρασαν τις απλές δυνατότητες υποδομής ως υπηρεσίας (IaaS) για να προσφέρουν αξιοπιστία, εργαλεία προγραμματιστών, ασφάλεια, υπηρεσίες δεδομένων, συστήματα χρέωσης και εταιρικές συμβάσεις. Οι συμπεράσματα τεχνητής νοημοσύνης ακολουθούν αυτή την πορεία. Το μοντέλο αποτελεί ένα επίπεδο. Το λειτουργικό σύστημα γύρω από το μοντέλο μπορεί να συγκεντρώνει μεγάλο μέρος της αξίας.
Η Nvidia φαίνεται να το έχει καταλάβει αυτό. Τον Μάρτιο ο τεχνολογικός κολοσσός έστειλε το μήνυμα ότι η επεξεργασία δεδομένων (inference) αποτελεί σημαντική ευκαιρία για έσοδα, ενώ το Reuters ανέφερε ότι ο Jensen Huang έκανε λόγο για μια εν δυνάμει ευκαιρία ύψους 1 τρισ. δολαρίων για τα τσιπ τεχνητής νοημοσύνης Blackwell και Rubin έως το 2027. Η ευρύτερη προσπάθεια της εταιρείας να εισέλθει στον τομέα των “εργοστασίων τεχνητής νοημοσύνης” καθιστά την υποδομή της όχι μόνο μηχανή εκπαίδευσης, αλλά και σύστημα παραγωγής για tokens, πράκτορες και εφαρμογές.
Η τεχνητή νοημοσύνη ως στρατηγική
Η στροφή προς την εξαγωγή συμπερασμάτων εξηγεί επίσης την έκρηξη ενδιαφέροντος για την τοπική τεχνητή νοημοσύνη και την τεχνητή νοημοσύνη επί της συσκευής. Η εκτέλεση κάθε αιτήματος μέσω ενός data center που βασίζεται στο cloud είναι ακριβή. Μπορεί να προκαλεί καθυστερήσεις αλλά και ενδοιασμούς σχετικά με την προστασία της ιδιωτικότητας. Μπορεί να επιβαρύνει τα δίκτυα και την παροχή ρεύματος του data center. Για πολλές εργασίες, η φθηνότερη λύση είναι να μετακινηθεί το μοντέλο πιο κοντά στον χρήστη.
Η Apple έχει θέσει αυτή τη λογική στο επίκεντρο της Apple Intelligence. Η εταιρεία αναφέρει ότι το σύστημά της είναι ενσωματωμένο σε iPhone, iPad και Mac μέσω επεξεργασίας εντός της συσκευής, με πιο σύνθετα αιτήματα να δρομολογούνται στο Private Cloud Compute που λειτουργεί σε Apple silicon. Ο οδηγός απορρήτου της Apple για το iPhone αναφέρει ότι τα αιτήματα αναλύονται για να προσδιοριστεί αν μπορούν να υποβληθούν σε επεξεργασία στη συσκευή και ότι τα δεδομένα που αποστέλλονται στο Private Cloud Compute δεν αποθηκεύονται ούτε είναι προσβάσιμα στην Apple.
Η “χρυσή εποχή” της τεχνητής νοημοσύνης δεν έχει τελειώσει, αφού θα συνεχίσουν να ρέουν κεφάλαια στον κλάδο. Έχει τελειώσει, όμως, με την έννοια ότι η ευκολία να σκάψουμε και να βρούμε γρήγορα χρυσό φτάνει στο τέλος της. Η κατασκευή ενός πανίσχυρου και εντυπωσιακού μοντέλου δεν αρκεί πλέον. Θα μπορούσε κανείς να υποστηρίξει ότι τα περισσότερα από τα υπάρχοντα μοντέλα είναι ήδη αρκετά καλά για τις περισσότερες από τις εργασίες στις οποίες τα χρησιμοποιούμε και ότι οι σταδιακές βελτιώσεις θα προσφέρουν περισσότερα οφέλη από τις καινοτομίες. Το μεγαλύτερο κέρδος βρίσκεται πλέον στο επίπεδο της χρησιμότητας, όπου η νοημοσύνη παρέχεται όπως η ισχύς, η ευρυζωνικότητα ή ο αποθηκευτικός χώρος στο cloud. Εκεί επικεντρώνονται πλέον οι εταιρείες τεχνητής νοημοσύνης, προσφέροντας μοντέλα που βελτιστοποιούνται, ενσωματώνονται και καταναλώνονται συνέχεια.
