20.02.2024 Aufrufe

IT-Nachwuchsforschung in Österreich

Das OCG Journal ist die Mitgliederzeitschrift der Österreichischen Computer Gesellschaft (OCG). Das erste OCG Journal des Jahres widmet sich erneut der IT-Nachwuchsforschung in Österreich. Ausgewählte Jungforscher*innen präsentieren ihre spannende Arbeit im Bereich der Informatik.

Das OCG Journal ist die Mitgliederzeitschrift der Österreichischen Computer Gesellschaft (OCG). Das erste OCG Journal des Jahres widmet sich erneut der IT-Nachwuchsforschung in Österreich. Ausgewählte Jungforscher*innen präsentieren ihre spannende Arbeit im Bereich der Informatik.

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

WIE KANN MAN SICH SCHÜT-<br />

ZEN?<br />

Der Schutz des Kontextes <strong>in</strong> LLMs vor<br />

Prompt Injections ist wichtig, aber herausfordernd.<br />

Da der Kontext e<strong>in</strong> zentraler<br />

Teil des LLM Anweisungspakets<br />

ist und die Prompts der Nutzer*<strong>in</strong>nen<br />

e<strong>in</strong>schließt, sollte er ke<strong>in</strong>e sensiblen Informationen<br />

be<strong>in</strong>halten. Zusätzlich ist es<br />

entscheidend, das Backend der Applikation<br />

vom LLM zu trennen und bewährte<br />

Sicherheitsmaßnahmen wie Prepared<br />

Statements zu nutzen, um SQL Injections<br />

durch Prompts zu verh<strong>in</strong>dern.<br />

E<strong>in</strong>e effektive Strategie zur Sicherung<br />

der Applikation ist es auch, die Kontexte<br />

<strong>in</strong>nerhalb der Nutzersitzungen zu begrenzen,<br />

um das Risiko von Angriffen zu<br />

reduzieren.<br />

Insgesamt s<strong>in</strong>d Prompt Injections nur<br />

schwer über klassisches Blacklist<strong>in</strong>g oder<br />

Filter<strong>in</strong>g zu begrenzen, da diese über<br />

natürliche Sprache formuliert werden.<br />

E<strong>in</strong> Angriff kann also verschiedensten<br />

Sprachkonstruktionen entspr<strong>in</strong>gen, was<br />

solche Ansätze zur Abwehr schwierig gestaltet.<br />

Des Weiteren kann man solche<br />

Filter umgehen, <strong>in</strong>dem man die Anweisungen<br />

verschlüsselt und diese vom LLM<br />

entschlüsseln lässt.<br />

Zusammenfassend lässt sich sagen, dass<br />

LLMs nicht als vertrauenswürdige Quelle<br />

zur Datenverarbeitung betrachtet<br />

werden sollten. Nutzer*<strong>in</strong>nen haben direkten<br />

Zugriff auf den Anweisungscode<br />

des LLMs, wodurch die Ausgaben des<br />

Modells als potenziell nicht vertrauenswürdig<br />

gelten. Dies erfordert besondere<br />

Aufmerksamkeit und angemessene Sicherheitsvorkehrungen.<br />

Carol<strong>in</strong>e<br />

Lawitschka<br />

ist Masterstudent<strong>in</strong><br />

für Artificial Intelligence<br />

an der JKU<br />

sowie für Philosophie<br />

an der Universität Wien. Derzeit<br />

ist sie an der Unversität Wien als<br />

Researcher <strong>in</strong> der Forschungsgruppe<br />

für Security und Privacy tätig.<br />

Transparenz und Nachvollziehbarkeit des Forschungsprozesses<br />

von Josef Taha<br />

FAIRE Forschung mit<br />

dynamischen Daten<br />

Die Welt der Forschung ist im Wandel<br />

– dynamische Datenströme s<strong>in</strong>d<br />

das Rückgrat vieler Wissenschafts- und<br />

Forschungsfelder. Die Fähigkeit, diese<br />

Daten nicht nur zu analysieren, sondern<br />

auch die Forschung zu e<strong>in</strong>em späteren<br />

Zeitpunkt exakt reproduzieren zu<br />

können, ist von entscheidender Bedeutung.<br />

Hier setzt VRE+ an, e<strong>in</strong> Konzept,<br />

das durch die Integration diverser<br />

Open-Source-Tools e<strong>in</strong>e modulare und<br />

FAIR-konforme virtuelle Forschungsumgebung<br />

darstellt.<br />

In der Wissenschaft rücken Reproduzierbarkeit<br />

und Transparenz, besonders<br />

<strong>in</strong> Bereichen wie Mach<strong>in</strong>e Learn<strong>in</strong>g, immer<br />

stärker <strong>in</strong> den Vordergrund. Es ist<br />

entscheidend, sowohl Ergebnisse als<br />

auch den gesamten Forschungsprozess<br />

nachvollziehen zu können, <strong>in</strong>sbesondere<br />

bei dynamischen Daten, die sich stetig<br />

ändern. Die FAIR-Pr<strong>in</strong>zipien – F<strong>in</strong>dability,<br />

Accessibility, Interoperability und Reusability<br />

– spielen dabei e<strong>in</strong>e Schlüsselrolle,<br />

<strong>in</strong>dem sie die Effizienz und Integrität wissenschaftlicher<br />

Arbeit steigern 1 .<br />

VRE+: FAIR, MODULAR UND<br />

OPEN-SOURCE<br />

VRE+ ist e<strong>in</strong>e an der TU Wien entwickelte,<br />

modulare und FAIRE Architektur für<br />

virtuelle Forschungsumgebungen, die<br />

auf den folgenden Open-Source-Komponenten<br />

basiert: JupyterHub, B<strong>in</strong>der,<br />

GitLab, InvenioRDM und DBRepo 2 . Diese<br />

Architektur zielt darauf ab, die Reproduzierbarkeit<br />

und Transparenz <strong>in</strong> der Datenforschung<br />

zu optimieren, <strong>in</strong>sbesondere<br />

im Umgang mit dynamischen Daten 3.<br />

InvenioRDM und DBRepo dienen hierbei<br />

als FAIR-konforme Datenrepositories.<br />

Während InvenioRDM für die Verwaltung<br />

von Dateien und Forschungsartefakten<br />

genutzt wird, spezialisiert sich DBRepo<br />

auf die Handhabung strukturierter relationaler<br />

Daten sowie Echtzeitdaten, die<br />

sich kont<strong>in</strong>uierlich ändern. GitLab kommt<br />

für das versionierte Management von<br />

Forschungscodes <strong>in</strong> Form von Jupyter<br />

Notebooks zum E<strong>in</strong>satz. JupyterHub und<br />

B<strong>in</strong>der bilden die Rechenumgebung für<br />

die Forschung und ermöglichen das automatisierte<br />

Aufsetzen von Forschungsumgebungen<br />

mit e<strong>in</strong>em Klick.<br />

VALIDIERUNG M<strong>IT</strong>TELS LUFT-<br />

QUAL<strong>IT</strong>ÄTSDATEN<br />

Die Luftqualitätsüberwachung <strong>in</strong> <strong>Österreich</strong><br />

diente als Test-Anwendungsbeispiel<br />

für die Evaluierung von VRE+. Sie umfasste<br />

zwei Datenquellen: (i) historische<br />

10 OCG Journal | 01 • 2024

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!