Reinforcement Learning mit Simulink-Modellen

Maschinelles Lernen fasst viele Methoden zusammen, die mit der Generierung von Wissen aus Erfahrung verbunden sind. Überwachtes Lernen befasst sich mit der Erstellung von Modellen, die auf Daten basieren. Unüberwachtes Lernen beschäftigt sich mit der Identifizierung von Strukturen in Daten. Beim bestärkenden Lernen, dem sogenannten Reinforcement Learning, das manchmal als Unterkategorie des überwachten Lernens gesehen wird, geht es um eine Strategie, die durch Ausprobieren gelernt wird und die zu einer maximalen Belohnung führt. Die Belohnungsfunktion muss dabei für jeden Anwendungsfall definiert werden.

Benchmark und Schnittstelle

Um Benchmarking mehrerer Agenten in derselben Umgebung zu ermöglichen, wurde die Open-Source-Bibliothek OpenAI Gym entwickelt. Es bietet eine Sammlung von Umgebungen, von invertierten Pendeln bis hin zu Videospielen, die in der Programmiersprache Python entwickelt wurden. OpenAI Gym ist aber mehr als nur eine Sammlung von Umgebungen. Es definiert eine einheitliche Schnittstelle für alle Umgebungen und Implementierungen der neusten Lernmethoden. In der Praxis bedeutet das, dass man innerhalb weniger Minuten ohne Modellierungs- oder Schnittstellenentwicklungsaufwand eine Umgebung und eine Lernmethode herunterladen und den Lernprozess starten kann. Neue Umgebungen können hinzugefügt werden. Diese haben eine fest definierte Struktur (auch als Dateisystem, aber auch als Komponentenmodell) und müssen ein Umgebungsmodell beinhalten.

Abbildung 3: Generierung einer Simulink-OpenAI-Gym-Umgebung – Bild: Inst. f. Steuerungstechn. der Werkzeugm.

Modelle in der Steuerungstechnik

Modellierung in der Produktionstechnik ist aber weit entfernt von einfachen Python-Skripten. Existierende Modelle können die Realität mit der benötigten Genauigkeit abbilden. Sie werden in Simulationsumgebungen wie Matlab Simulink entwickelt. Manche werden als digitaler Zwilling der realen Maschine bezeichnet. Das Matlab Python Interface bietet eine Schnittstelle für die gesamte Entwicklungsumgebung nach Python und der Matlab/Simulink Coder bietet die Möglichkeit, für verschiedene Plattformen C/C++-Codes zu generieren und zu kompilieren (inklusive C/C++-Schnittstelle). Beide Optionen können verwendet werden, um einen Wrapper für die Simulation zu entwickeln, der nach der OpenAI-Gym-Struktur ausgelegt ist. Die Matlab-Schnittstellen und die OpenAI-Gym-Schnittstelle bieten aber für alle Simulationen dieselben Interaktionsmöglichkeiten. Dies erlaubt die automatisierte Generierung von einer Zwischenschicht, die von einer Seite als OpenAi-Gym-Umgebung erkannt wird und von der anderen Seite alle Informationen an die Matlab-Schnittstellen weiterleitet.

Bild: Beckhoff Automation GmbH & Co. KG

Linux-basierte Echtzeitsteuerung für Twincat

Mit der Twincat Runtime für Echtzeit-Linux will Beckhoff neue Anwendungsmöglichkeiten für die Echtzeitsteuerung erschließen.

Bild: Red Lion Europe GmbH

Neue Funktionen für Edge-Plattform

Red Lion präsentiert neue Dehnungsmessstreifen-Module sowie J1939- und CAN-Protokoll-Sleds für die Intelligent-Edge-Automation-Plattform FlexEdge.

Bild: Wago GmbH & Co. KG

I/O-System XTR von Wago

Vor zehn Jahren hieß es bei Wago das erste Mal: XTR. Die Ausführung für „eXTReme“ Umgebungsbedingungen sollte dem Wago I/O System 750 neue Anwendungen und Branchen erschließen. Das betonte die Titelstory des damaligen SPS-MAGAZINs zur Hannover Messe 2014. Eine Dekade später hat die Redaktion bei Wago nachgehakt, ob dieser Plan aufgegangen ist und in welchen Bereichen das XTR-System heute vor allem zu finden ist.

Bild: Phoenix Contact GmbH & Co. KG

Logikmodule mit einfacher Modbus/RTU-Anbindung

Mit der Vernetzung über RS485-Modbus/RTU wird PLC Logic, eine Kombination aus Schaltgerät und Steuerung von Phoenix Contact, einfach und sicher in übergeordnete Automatisierungssysteme integriert.

Bild: MHJ-Software GmbH & Co. KG

Effektive Prüfungsvorbereitung

In der Regel können Auszubildende ihre SPS-Programme erst testen, wenn die realen IHK-Prüfungsmodelle aufgebaut sind.

Bild: NXP Semiconductors GmbH

Damit lassen sich intelligente Edge-Anwendungen besser entwickeln

Die neuen MCUs der NXP MCX A-Serie nutzen die neueste Version der FRDM-Entwicklungsplattform. Mit ihrer ausgewogenen und kostenoptimierten Kombination aus verbesserter Leistung und autonomer Peripherie schaffen sie die Grundlage für intelligente Edge-Anwendungen.

Bild: B&R Industrie-Elektronik GmbH

Programmiertool

Mit Automation Studio hat B&R ein einheitliches Programmierwerkzeug für alle Teilaufgaben des Engineering geschaffen. Die Version 6 wurde bereits vor einiger Zeit angekündigt und soll nun ab Juni 2024 verfügbar sein. Mit dem Copilot ergänzt dann zudem ein Programmierbegleiter mit künstlicher Intelligenz den Werkzeugkasten.

Reinforcement Learning mit Simulink-Modellen

Benchmark und Schnittstelle

Modelle in der Steuerungstechnik

OpenAI Gym-Schnittstelle

Das könnte Sie auch Interessieren

Automation TV

Weitere Beiträge

Linux-basierte Echtzeitsteuerung für Twincat

Neue Funktionen für Edge-Plattform

I/O-System XTR von Wago

Logikmodule mit einfacher Modbus/RTU-Anbindung

Effektive Prüfungsvorbereitung

Damit lassen sich intelligente Edge-Anwendungen besser entwickeln

Programmiertool

Mehr Infos

Andere TeDo-Seiten

Herausgeber