O+P Fluidtechnik 7-8/2023

INTERVIEW 

Herr Makansi, Sie haben Ihre Ideen für ein Forschungsvorhaben 

zur agentenbasierten Regelung und Steuerung von Fluidsystemen 

bereits mehrfach einem Fachpublikum vorgestellt. Was ist 

kurz gesagt der Kern Ihres Ansatzes? Wer sind die Agenten? Was 

ist das Ziel? 

Zustand 

Agent 

Handlungsregel 

Aktion 

Der Kern des angesprochenen Forschungsvorhabens ist, die 

Potenziale der künstlichen Intelligenz zur Lösung komplexer 

Regel- und Steueraufgaben für fluidtechnische Anwendungen 

nutzbar zu machen. In diesem Kontext ist meistens auch von 

Agenten die Rede. Damit sind Software-Agenten gemeint, die 

gewissermaßen eigenständig, gemäß eines angelernten Verhaltens, 

mit der Umgebung interagieren. Spannend ist hierbei, dass 

das Anlernen dieser Agenten in Teilen den menschlichen Lernprozess 

imitiert, indem einem Agenten durch Belohnung und 

Bestrafung mitgeteilt wird, welches Verhalten von ihm gefordert 

ist. Dieser Lern- bzw. Trainingsprozess läuft algorithmisch ab 

und ist daher gut automatisierbar. Das Ziel ist, in einem teilautomatisierbaren 

Entwicklungsprozess Agenten zu erhalten, 

die eine hochperformante Maschinensteuerung ermöglichen. 

T 

p x 

U 

U 

Reinforcement 

Learning 

Algorithmus 

U 

Umgebung 

Optimierung 

Belohnung 

In der Vielzahl von Anwendungen, in der wir beeindruckende 

Leistungen von Algorithmen und maschinellem Lernen bereits 

gesehen haben - was wäre am ehesten mit Ihrem Ansatz 

vergleichbar? 

DER AGENT „LERNT“, WELCHE 

AKTIONEN IN WELCHEN SITUA- 

TIONEN AUSZUFÜHREN SIND 

In der Tat findet maschinelles Lernen immer stärkeren Einzug 

in vielfältigste Anwendungen, von Computerspielen über autonomes 

Fahren bis hin zu Investmentplanung und Chatsystemen. 

Auch wenn sie alle im Hintergrund auf ähnlichen Konzepten 

basieren, gibt es doch anwendungsspezifische Eigenheiten, 

wie etwa die Beschaffenheit und Verfügbarkeit der Daten 

oder Anforderungen an die Zuverlässigkeit trainierter 

Agenten. Im Bereich industrieller Anwendungen finden wir 

meist die Situation vor, dass wir zum einen sicherheitstechnische 

Rahmenbedingungen einhalten müssen und zum anderen 

qualitativ hochwertige Daten eher rar sind. Hinsichtlich 

der sicherheitstechnischen Ansprüche können wir viele Parallelen 

zum autonomen Fahren finden. Wir können aus Sicherheits- 

und Kostengründen die Agenten nicht einfach frei im 

Feld, an realen Maschinen oder Fahrzeugen, üben lassen. Eine 

mögliche Lösung, die wir im angestrebten Forschungsvorhaben 

verfolgen wollen, besteht darin, die Agenten im Vorfeld 

an Simulationsmodellen des Zielsystems vorzutrainieren, sodass 

der Trainingsaufwand am realen System reduziert werden 

kann. Darüber hinaus müssen wir für unsere fluidtechnischen 

Anwendungen, ebenso wie beim autonomen Fahren, absichern, 

dass trainierte Agenten keine Unfall- oder Gefahrensituationen 

verursachen, um sie in Verkehr bringen zu können. 

Dafür möchten wir in dem geplanten Projekt die aktuell in der 

Umsetzung befindlichen rechtlichen Rahmenbedingungen, 

wie die EU-Maschinenrichtlinie und den Vorschlag der Richtlinie 

über KI-Haftung aufgreifen und unsere technischen Lösungen 

danach ausrichten und auf Konformität prüfen. 

01 Schematische Darstellung des Reinforcement Learning- 

Prozesses mit der Rolle des Agenten 

Es ist also keine Künstliche Intelligenz, die dahinter sitzt – 

oder doch? 

Der Ausdruck „Künstliche Intelligenz“ wird meist als Synonym 

für allerlei Systeme verwendet, die mit maschinellem Lernen 

arbeiten. Das ist auch naheliegend, da es Analogien zum 

menschlichen Lernprozess gibt und die entsprechenden Systeme 

auch meist darauf abzielen, menschenähnliches Verhalten 

zu replizieren. Dahinter stecken dann aber doch im Wesentlichen 

skalierbare mathematische Strukturen wie neuronale Netze 

und dazu passende Optimierungsalgorithmen, die von Menschen 

konfiguriert werden und mit von Menschen ausgewählten 

Informationen gespeist werden. Folglich haben diese „künstlichen 

Intelligenzen“ keine eigene Intelligenz, sondern können 

lediglich Aufgaben innerhalb eines Rahmens ausführen, für den 

sie programmiert wurden. 

Was hat die agentenbasierte Regelung mit Condition Monitoring 

gemeinsam und wo unterscheidet sie sich? 

Die wahrscheinlich größte Gemeinsamkeit dieser beiden Techniken 

ist, dass sie beide im Kontext von maschinellem Lernen 

und industriellen Anwendungen Erwähnung finden. Ansonsten 

besteht ein wesentlicher Unterschied zwischen den beiden 

Techniken in ihrer Funktionsweise und ihren Zielen. Bei der 

agentenbasierten Regelung ist das Ziel, dass ein Agent „erlernt“, 

welche Aktionen in welchen Situationen auszuführen sind, um 

ein von der Umgebung gewünschtes Verhalten herbeizuführen. 

Dafür kommen Methoden des sogenannten Reinforcement 

Learnings (deutsch: bestärkendes Lernen) zum Einsatz, bei 

denen der Lernprozess auf Interaktion mit der Umgebung, also 

gewissermaßen einem Trial-and-Error-Prinzip, beruht. Das Ziel 

des Condition Monitorings ist hingegen, den Zustand eines Sys- 

www.oup-fluidtechnik.de O+P Fluidtechnik 2023/07-08 23

Vorherige Seite

Nächste Seite

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

O+P Fluidtechnik 7-8/2023

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?