Zur letzten SPS hat B&R die Erweiterung seiner Kooperation mit MVTec um den AI-Prozessor-Hersteller Hailo bekannt gegeben. Als erste Anwendung haben Sie seinerzeit eine Deep-OCR-Entwicklung auf Ihrer Smart Camera in Aussicht gestellt. Wie ist hier der aktuelle Status?
Andreas Waldl: Die Entwicklung des Deep-OCR ist bereits abgeschlossen und das Produkt seit Anfang September verfügbar. Das Resultat hat nicht nur die ersten Kunden, sondern auch uns selbst positiv überrascht. Dass die Qualität der Zeichenerkennung bei unterschiedlichen Schriftarten hervorragend ist, davon konnten wir uns ja bereits bei der Designentscheidung überzeugen, dass aber auch starke Grauwertschwankungen im Hintergrund, minimaler Kontrast und schlechte Druckqualität so problemlos weggesteckt werden, war in dieser Form nicht zu erwarten.
Wie sieht es dabei mit der Geschwindigkeit aus?
Das Deep-Learning-Netzwerk schafft das Lesen einer Zeile, trotz minimaler Verlustleistung im Chip, bereits ab ca. 25ms. Das ist durchaus schnell und lässt bei vielen Anwendungen auch noch ausreichend Platz für zusätzliche Aufgabenstellungen, die auf der Smart Camera verarbeitet werden können.
Ich gehe davon aus, dass sich B&R aber nicht nur mit OCR beschäftigt. Gibt es mittlerweile auch weitere (AI-)Projekte?
Wir arbeiten aktuell an der AI-gestützten Erkennung von Anomalien. Genauer gesagt an Global Context – Anomaly Detection. Hier haben wir bereits erfolgreich die ersten Proof of Concepts (PoC) mit Kunden abgeschlossen und stellen das Produkt erstmalig auf der SPS 2023 vor. Die Serienverfügbarkeit der Lösung ist bereits für das erste Halbjahr 2024 geplant.
Ist KI nicht möglicherweise zu komplex für den klassischen Automatisierungsanwender mit nur begrenzter Vision-Erfahrung?
Anomaly Detection unterscheidet sich in der Anwendung kaum von herkömmlicher Bildverarbeitung, wenn es richtig eingesetzt und im Kontext der Automatisierung in eine integrierte Bildverarbeitung eingebunden wird. Die Komplexität fängt dann an, wenn Netzwerke nachtrainiert werden müssen, sei es, weil es für eine eindeutige Unterscheidung zusätzliches Bildmaterial benötigt wird oder sich Gut-/Schlecht-Ergebnisse zu sehr überschneiden. Ein Problem ist auch, dass regelbasierte Algorithmen und Deep Learning häufig ein Entweder/Oder und kein Sowohl-als-auch sind oder im besten Fall nur nebeneinander existieren. B&R geht hier einen Schritt weiter und ermöglicht dem Anwender die volle Freiheit, diese zwei Ansätze zu kombinieren – sowohl im Pre- als im Post-Processing.
Was verstehen sie darunter?
Nehmen wir als Beispiel das Global Context – Anomaly-Detection-Netzwerk. Dieses generiert als Ergebnis einen Anomalie-Score und eine Heatmap, also quasi die Landkarte, auf der die Anomalien zu sehen sind. Typischerweise wird bei der Evaluierung eines trainierten Netzwerks versucht, durch Gut- und Schlechtbilder einen passenden Schwellwert zu definieren, der eine eindeutige Unterscheidung ermöglicht. Häufig gibt es hier aber die bereits erwähnte Überlappung, was die Angelegenheit kompliziert macht. Durch Analyse der false positive und false negative Ergebnisse und einem neuerlichen Review der Trainingsdaten sowie einem abschließenden neuen Training wird dann üblicherweise versucht, einen robusten Schwellwert zu erhalten, was nicht immer möglich ist.
Und was macht B&R hier anders?
B&R stellt zwar auch diese AI-generierten Scores zur Verfügung, ermöglicht jedoch parallel, die Heatmap mit regelbasierten Algorithmen zu bewerten. So kann mit sehr einfachen und verständlichen Parametern eine Unterscheidung zwischen sehr großen oder sehr stark ausgeprägten Abweichungen erfolgen. Das Kriterium einer Bewertung kann aber auch einfach die Anzahl vieler kleiner Abweichungen oder deren Mittelwert in sensiblen Bereichen sein. Damit reduziere ich nicht nur die Komplexität beim Training des Deep-Learning-Netzwerks. Diese Vorgehensweise ermöglicht auch eine nachvollziehbare Skalierung der Fehlerschwelle und erhöht damit deutlich die Effizienz einer Maschine. Das ist etwa der Fall, wenn bei einem bestimmten Produkt beispielsweise Abweichung A kein Problem ist oder fertigungstechnisch gar nicht ausgeschlossen werden kann, während Abweichung B entscheidend die Qualität beeinflusst. Eine ausschließlich auf den Anomalie-Score beschränkte Bewertung würde dagegen unnötigen Ausschuss produzieren. Eine zusätzliche Bewertung mit regelbasierten Algorithmen ist nicht nur leichter nachvollziehbar und zur Laufzeit einfach adaptierbar, sondern ermöglicht auch eine regelbasierte Klassifizierung von Ergebnissen in verschiedenen Qualitätsklassen.
Mittlerweile beschäftigen sich auch andere SPS-Hersteller mit der Integration der Bildverarbeitung in die Steuerungswelt, d.h. die SPS- und Vision-Welten wachsen immer weiter zusammen?
Ja, und das ist gut so. Dass der Weg den B&R eingeschlagen hat Nachahmer findet, zeigt nur, dass der große Mehrwert, der in einer integrierten Bildverarbeitung steckt, langsam, aber sicher erkannt wird. Das war vor knapp 25 Jahren nicht viel anders, als B&R den Weg ging, die Antriebstechnik vollständig in die Automatisierungswelt zu integrieren. Der Performancegewinn einer Maschine durch die Integration, aber auch die Freiheitsgrade beim Zusammenspiel der unterschiedlichen Disziplinen bilden zusammen den entscheidenden Wettbewerbsvorteil moderner Produktionsmaschinen.