26.07.2022 Views

ΠΡΑΚΤΙΚΑ 4ου ΠΑΝΕΛΛΗΝΙΟΥ ΣΥΝΕΔΡΙΟΥ ΨΗΦΙΟΠΟΙΗΣΗΣ ΠΟΛΙΤΙΣΤΙΚΗΣ ΚΛΗΡΟΝΟΜΙΑΣ –EUROMED 2021

Το συνέδριο πραγματοποιήθηκε στην Ελλάδα 30 – 3 Οκτωβρίου 2021, στην Αθήνα, στις υπερσύγχρονες εγκαταστάσεις του Εργαστηρίου Μη - Καταστροφικών Ελέγχων και Μεθοδολογιών Διάγνωσης Συστημάτων, Πανεπιστημιούπολη 2-Αιγάλεω Αττικής. Copyright: Δίκτυο «ΠΕΡΡΑΙΒΙΑ» Α΄ Έκδοση: Ιούνιος 2022 Για την Ελληνική Γλώσσα: Δίκτυο «ΠΕΡΡΑΙΒΙΑ» Γλώσσες: Ελληνική (gre) Γλώσσα πρωτοτύπου: Ελληνική (gre) ISBN: 978-618-85119-1-0 Επιμέλεια- Υπεύθυνος: ΚΩΝ. ΣΚΡΙΑΠΑΣ-ΔΙΚΤΥΟ «ΠΕΡΡΑΙΒΙΑ» E-Mail: perrevianet@gmail.com ΤΗΛΕΦΩΝΑ ΕΠΙΚΟΙΝΩΝΙΑΣ: +30-6974-881944 FAX: +30-24210-71200 Διεύθυνση Αλληλογραφίας: Κωνσταντά 247-249 -ΒΟΛΟΣ (Τ.Κ. 38 222) E-Mail: euromed.greece@gmail.com

Το συνέδριο πραγματοποιήθηκε στην Ελλάδα 30 – 3 Οκτωβρίου 2021, στην Αθήνα, στις υπερσύγχρονες εγκαταστάσεις του Εργαστηρίου Μη - Καταστροφικών Ελέγχων και Μεθοδολογιών Διάγνωσης Συστημάτων, Πανεπιστημιούπολη 2-Αιγάλεω Αττικής.

Copyright: Δίκτυο «ΠΕΡΡΑΙΒΙΑ»
Α΄ Έκδοση: Ιούνιος 2022

Για την Ελληνική Γλώσσα: Δίκτυο «ΠΕΡΡΑΙΒΙΑ»
Γλώσσες: Ελληνική (gre)
Γλώσσα πρωτοτύπου: Ελληνική (gre)

ISBN: 978-618-85119-1-0

Επιμέλεια- Υπεύθυνος: ΚΩΝ. ΣΚΡΙΑΠΑΣ-ΔΙΚΤΥΟ «ΠΕΡΡΑΙΒΙΑ»
E-Mail: perrevianet@gmail.com
ΤΗΛΕΦΩΝΑ ΕΠΙΚΟΙΝΩΝΙΑΣ: +30-6974-881944 FAX: +30-24210-71200
Διεύθυνση Αλληλογραφίας: Κωνσταντά 247-249 -ΒΟΛΟΣ (Τ.Κ. 38 222)
E-Mail: euromed.greece@gmail.com

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

4 ο Πανελλήνιο Συνέδριο Ψηφιοποίησης Πολιτιστικής Κληρονομιάς

EUROMED 2021, 30/9 - 3/10/2021

μοντέλου, το οποίο αποτελείται από νευρωνικό δίκτυο, εφαρμόστηκε η τεχνική regularization dropout

(διαγραφή τυχαίων νευρώνων του δικτύου) με rate 20% για τη μείωση του φαινομένου του overfitting

και την καλύτερη γενίκευση του μοντέλου. Τα αποτελέσματα δείχνουν ότι το μοντέλο COSMOS,

εκπαιδευμένο ειδικά στον τομέα της ελληνικής μυθολογίας, αποδίδει καλύτερα από το προεκπαιδευμένο

μοντέλο που εκπαιδεύτηκε στο corpus OntoNotes 8 (βλ. Πίνακα 1). Αυτό είναι

αναμενόμενο, καθώς το μοντέλο COSMOS έχει μάθει να αναγνωρίζει συγκεκριμένα γλωσσικά μοτίβα

που εμφανίζονται στα κείμενα της ελληνικής μυθολογίας. Παρατηρούμε ότι η αναγνώριση τοποθεσίας

δεν είναι τόσο καλή όσο η αναγνώριση προσώπου. Αυτό μπορεί να εξηγηθεί από το γεγονός ότι τα

ακατέργαστα κείμενα περιέχουν σημαντικά περισσότερες αναφορές σε πρόσωπα παρά τοποθεσίες,

καθιστώντας την αναγνώριση τοποθεσίας πιο δύσκολη στην εκπαίδευση.

Πίνακας 1: Απόδοση ανά οντότητα του προ-εκπαιδευόμενου μοντέλου και του μοντέλου COSMOS

4.1.2 Υποσύστημα Ανάκτησης Πληροφοριών

Είναι υπεύθυνο για την αναζήτηση και την ανάκτηση των πληροφοριών που αναζητά ο τελικός χρήστης

και αποτελείται από:

COSMOS Web Service: Ένα RESTful API που αναπτύχθηκε στο NodeJS 9 χρησιμοποιώντας το

framework Fastify 10 . Το API παρέχει endpoints για την αναζήτηση και την ανάκτηση δεδομένων που

είναι αποθηκευμένα στο COSMOS Document Store και στη COSMOS Graph Database.

COSMOS Graph Database: Μια βάση δεδομένων γράφου Neo4j που περιέχει τις συνδέσεις μεταξύ

των κειμένων μυθολογίας σε μορφή γράφου. Για την προσπέλαση του γράφου και ανάκτηση

πληροφορίας από αυτόν χρησιμοποιήθηκε η γλώσσα ερωτημάτων Cypher 11 .

Όταν ένα τμήμα του συστήματος, όπως το Σύστημα Παρουσίασης Γνώσης, θέλει να αποκτήσει

πρόσβαση στις συνδεδεμένες πληροφορίες που είναι αποθηκευμένες στη βάση δεδομένων γράφου,

εκτελεί ένα http request στο κατάλληλο endpoint του COSMOS Web Service. To Web Service θέτει

8

Onto Notes homepage, https://catalog.ldc.upenn.edu/LDC2013T19, τελευταία πρόσβαση 2020/10/26.

9

Nodejs, https://nodejs.org/en/about/, τελευταία πρόσβαση 2020/10/26.

10

Fastify homepage, https://www.fastify.io/, τελευταία πρόσβαση 2020/10/26.

11

Cypher, The Graph Query Language, https://neo4j.com/cypher-graph-query-language/, τελευταία πρόσβαση

2020/10/26.

859

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!