Η φινλανδική νεοφυής επιχείρηση τεχνητής νοημοσύνης Silo AI δημοσίευσε ένα νέο μοντέλο γλώσσας ανοικτού κώδικα (LLM) στις 12 Νοεμβρίου. Το νέο μοντέλο Poro, που πήρε το όνομά του από τον τυπικό σκανδιναβικό τάρανδο που περιπλανιέται στην τούνδρα, είναι το δεύτερο σημαντικό LLM ανοικτού κώδικα που προέρχεται από την Ευρώπη μετά το γαλλικό Mistral AI. Προς το παρόν καλύπτει τα φινλανδικά, τα αγγλικά και ορισμένες γλώσσες κωδικοποίησης, αλλά το σχέδιο της Silo AI είναι να το επεκτείνει ώστε να λειτουργεί και για τις 24 επίσημες γλώσσες της Ευρωπαϊκής Ένωσης.
“Προσωπικά πιστεύω ότι τελικά θα υπάρξουν πολλές εναλλακτικές λύσεις ανοιχτού κώδικα εκεί έξω. Ο πιο ασφαλής δρόμος προς τα εμπρός είναι να πάμε πραγματικά σε ανοιχτό κώδικα και να έχουμε πλήρη ορατότητα στο πώς έχουν κατασκευαστεί αυτά τα μοντέλα και ποια είναι η αρχιτεκτονική τους”, δήλωσε ο Peter Sarlin, CEO της Silo AI στη συνέντευξη του VentureBeat. Το Poro κυκλοφορεί υπό την άδεια Apache 2.0 License.
Σύμφωνα με την εταιρεία, η Silo AI με έδρα το Ελσίνκι είναι το μεγαλύτερο ιδιωτικό εργαστήριο τεχνητής νοημοσύνης με περισσότερους από 300 υπαλλήλους. Αν και πρόκειται για ιδιωτική εταιρεία, η καινοτομία της βασίζεται στη συνεργασία του δημόσιου τομέα και στη στήριξη της ΕΕ. Το μοντέλο Poro κατασκευάζεται από τον βραχίονα της Silo AI για τη γεννητική τεχνητή νοημοσύνη SiloGen σε συνεργασία με το Πανεπιστήμιο του Turku και το χρηματοδοτούμενο από τον Ορίζοντα Ευρώπη έργο High Performance Language Technologies (HPLT). Το HPLT έχει ως στόχο να συνδυάσει μεγάλες ποσότητες δεδομένων από πολλές γλώσσες. Διαθέτει συνολικά 13 petabytes δεδομένων που έχουν ανιχνευθεί στο διαδίκτυο και το σύνολο δεδομένων του για τα φινλανδικά περιέχει πάνω από 10 δισεκατομμύρια λέξεις.
Η εκπαίδευση του Poro τροφοδοτείται από τον ταχύτερο υπερυπολογιστή LUMI της Ευρώπης, ο οποίος βρίσκεται στο Kajaani της Φινλανδίας. Ο LUMI χρηματοδοτείται μέσω της κοινής επιχείρησης EuroHPC και έχει λάβει κάποια πρόσθετη χρηματοδότηση από το Ευρωπαϊκό Ταμείο Περιφερειακής Ανάπτυξης (ΕΤΠΑ).
Το Poro αποκτά το ανταγωνιστικό του πλεονέκτημα έναντι των LLM που αναπτύσσονται για τις ευρέως χρησιμοποιούμενες γλώσσες μέσω μιας καινοτόμου τεχνικής διασταυρούμενης εκπαίδευσης. Το μοντέλο τροφοδοτείται πρώτα με δύο γλώσσες και στη συνέχεια υπολογίζει τη μεταξύ τους σχέση. Αυτό επιτρέπει στο Poro να αναζητά απαντήσεις στα αγγλικά ακόμη και αν ο χρήστης έχει εισάγει μια ερώτηση στα φινλανδικά.
Αν και η φιλοδοξία της Silo AI είναι να καταστήσει το Poro έναν πραγματικό ευρωπαϊκό ανταγωνιστή της παγκόσμιας μεγάλης τεχνολογίας, δεν ανταγωνίζεται μόνο τα μεγαθήρια από την άλλη πλευρά του Ατλαντικού. Το μοντέλο ωθεί το γαλλικό Mistral και το γερμανικό Aphec Alpha, και το 2024 αναμφίβολα θα εισαγάγει νέους ανταγωνιστές ΑΙ ανοιχτού κώδικα και από άλλες χώρες της ΕΕ.