Μια καινοτόμα λύση για την ψηφιακή μεταγραφή ιστορικών χειρόγραφων εγγράφων ανέπτυξαν και διέθεσαν ανοιχτά τα Εθνικά Αρχεία της Σουηδίας (Riksarkivet), προσφέροντας πολύτιμο εργαλείο σε οργανισμούς που διαχειρίζονται πολιτιστικό απόθεμα και αρχειακό υλικό.
Η νέα αυτή τεχνολογία βασίζεται στην τεχνητή νοημοσύνη και επιτρέπει την αυτόματη αναγνώριση χειρόγραφου κειμένου — μια διαδικασία που μέχρι σήμερα απαιτούσε μεγάλο ανθρώπινο κόπο και εξειδίκευση. Η εξέλιξη αυτή ανοίγει νέες δυνατότητες για τη διατήρηση, την ανάδειξη και την αξιοποίηση ιστορικών τεκμηρίων.
Δύο ανοιχτά εργαλεία για τη μεταγραφή χειρόγραφων
Η λύση του Riksarkivet περιλαμβάνει:
- SwedishLionLibre: ένα μοντέλο τεχνητής νοημοσύνης ειδικά εκπαιδευμένο για να «διαβάζει» σουηδικά χειρόγραφα της περιόδου 1600–1900, ξεπερνώντας τους περιορισμούς των παραδοσιακών εργαλείων αναγνώρισης χαρακτήρων.
- HTRflow: μια ευέλικτη και φιλική στην χρήση πλατφόρμα, σχεδιασμένη για τη διαχείριση έργων μεταγραφής και ψηφιοποίησης. Υποστηρίζει διάφορες μορφές αρχείων, παρέχει εργαλεία ελέγχου της ακρίβειας και προσφέρει δυνατότητα παραμετροποίησης ανάλογα με το είδος των εγγράφων.
Τα εργαλεία αυτά μπορούν να χρησιμοποιηθούν είτε με το συγκεκριμένο σουηδικό μοντέλο, είτε με άλλα μοντέλα τεχνητής νοημοσύνης που έχουν εκπαιδευτεί σε διαφορετικές γλώσσες ή είδη γραφής.
Πρακτική εφαρμογή και ανοιχτή διάθεση
Τα Εθνικά Αρχεία της Σουηδίας χρησιμοποιούν ήδη εσωτερικά τη συγκεκριμένη τεχνολογία, αποδεικνύοντας την πρακτική της αξία. Επιπλέον, έχουν επιλέξει να διαθέσουν όλο τον κώδικα και την τεκμηρίωση ανοιχτά, με ελεύθερη άδεια χρήσης και επανάχρησης. Αυτό καθιστά τη λύση άμεσα αξιοποιήσιμη από άλλους δημόσιους οργανισμούς και πολιτιστικά ιδρύματα σε ολόκληρη την Ευρώπη.
Δυνατότητες για ελληνικούς φορείς
Η χρήση τεχνολογιών αναγνώρισης χειρόγραφου κειμένου μπορεί να προσφέρει σημαντικά οφέλη και στην ελληνική πραγματικότητα, ειδικά για:
- Δημόσια αρχεία και βιβλιοθήκες που διαθέτουν πλούσιο ιστορικό υλικό.
- Ερευνητικά ιδρύματα που αναλύουν ιστορικές πηγές.
- Φορείς πολιτισμού που επιθυμούν να προσφέρουν πρόσβαση σε ψηφιοποιημένες συλλογές.
Η επανάχρηση τέτοιων λύσεων μειώνει τον χρόνο και το κόστος των έργων ψηφιοποίησης και ενισχύει την προσβασιμότητα των πολιτιστικών τεκμηρίων για την κοινωνία και την επιστήμη.
Χρήσιμοι σύνδεσμοι
Hugging Face – Swedish Lion Libre: https://huggingface.co/Riksarkivet
Τεχνική τεκμηρίωση: https://ai-riksarkivet.github.io/htrflow/latest/
HTRflow- Blog παρουσίασης: https://huggingface.co/blog/Gabriel/htrflow