Smart Kamera

Edge-Learning-OCR für die Zeichenerkennung auf Verpackungslinien

Edge Learning, eine benutzerfreundliche Form der künstlichen Intelligenz, bietet eine schnelle und zuverlässige Möglichkeit zur Automatisierung von Lieferketten mit optischer Zeichenerkennung. Edge Learning ist der regelbasierten OCR überlegen und einfacher als Deep-Learning-basierte Systeme zu konfigurieren.
 Das Bildverarbeitungssystem In-Sight 3800 von Cognex arbeitet mit KI-basierenden Edge-Learning-Tools und traditionellen regelbasierten Algorithmen und ermöglicht damit leistungsfähige Lösungen, unter anderem zum schnellen Lesen von Zeichen.
Das Bildverarbeitungssystem In-Sight 3800 von Cognex arbeitet mit KI-basierenden Edge-Learning-Tools und traditionellen regelbasierten Algorithmen und ermöglicht damit leistungsfähige Lösungen, unter anderem zum schnellen Lesen von Zeichen.Bild: Cognex Germany Inc.

Viele Branchen sehen sich mit zunehmenden Compliance-Anforderungen, der Nachfrage der Verbraucher nach detaillierten Verpackungsinformationen auf Losebene und dem Wettbewerbsdruck in Bezug auf Geschwindigkeit und Effizienz der Lieferkette konfrontiert. Wegen strenger Vorschriften zur Rückverfolgbarkeit und zum Schutz vor Fälschungen hat die Pharmaindustrie eine Vorreiterrolle bei der Nutzung der optischen Zeichenerkennung (Optical Character Recognition, OCR) zur Gewährleistung der Sicherheit über die gesamte Lieferkette hinweg übernommen. Dies erforderte erhebliche Investitionen, den Aufbau von Fachwissen und einen langen Lernprozess.

Angesichts unterschiedlicher Schriftarten und Trägermaterialien, sowie der komplexen visuellen Umgebung von Fertigungs- und Logistiklinien war die Automatisierung von OCR-Applikationen schon immer eine Herausforderung, die nur mit geschulten Automatisierungsingenieuren, hohem Zeiteinsatz und einem beträchtlichen finanziellen Engagement zu lösen war. Selbst bei bester Leistung konnten herkömmliche OCR-Systeme in puncto Genauigkeit allerdings nie annähernd 100 Prozent erreichen, was manuelle Eingriffe erforderte und den Durchsatz einschränkte.

Die Anforderungen an Geschwindigkeit und Genauigkeit von Hochgeschwindigkeits-Lieferketten zeigen nun die Grenzen der herkömmlichen OCR auf. Edge Learning, eine benutzerfreundliche Form der KI, bietet hingegen eine schnelle und zuverlässige Möglichkeit zur Automatisierung von Lieferketten mit OCR.

 Der erste Teil des Anlernens bei Edge-Learning-Systemen erfolgt anhand eines für die industrielle Automatisierung optimierten Datensatzes, der Anwender ergänzt den zweiten Teil um Bilder seines spezifischen Anwendungsfalls.
Der erste Teil des Anlernens bei Edge-Learning-Systemen erfolgt anhand eines für die industrielle Automatisierung optimierten Datensatzes, der Anwender ergänzt den zweiten Teil um Bilder seines spezifischen Anwendungsfalls. Bild: Cognex Germany Inc.

OCR-Anwendungsfälle und Herausforderungen

OCR kommt bereits seit langer Zeit in verschiedenen Anwendungen zum Einsatz. Dabei haben sich vier wesentliche Einsatzfelder herauskristallisiert:

  • Umwandlung von Codes in eine digitale Form, mit der sich jedes Teil oder Produkt in der Lieferkette verfolgen lässt,
  • Auffinden und Verifizieren alphanumerischer Zeichen,
  • Bestätigung, dass der gedruckte Code mit dem Teil oder Produkt und dem Barcode übereinstimmt,
  • Überprüfung, ob der entsprechende Code korrekt gedruckt wurde.

Trotz aller Praxistauglichkeit bringen herkömmliche OCR-Systeme gewisse Herausforderungen bei ihrer Nutzung mit sich. So erfordern sie eine präzise Beleuchtung und müssen mit unterschiedlich reflektierenden Materialien, einer großen Designvarianz von Verpackungen sowie mit teilweise unsauberen Drucken zurechtkommen. Wird auch nur eine dieser Bedingungen nicht optimal erfüllt, so erhöht sich die Fehlerquote. Edge Learning hat das Thema OCR verändert, indem es sowohl die Geschwindigkeit als auch die Genauigkeit verbessert und eine einfachere Anwendung in einer größeren Anzahl von Branchen und Situationen ermöglicht.

 Edge Learning ist insbesondere für Aufgabenstellungen in den Bereichen Klassifizierung, 
Montageprüfung und Zeichenlesen geeignet.
Edge Learning ist insbesondere für Aufgabenstellungen in den Bereichen Klassifizierung, Montageprüfung und Zeichenlesen geeignet. Bild: Cognex Germany Inc.

Intelligentere KI für einfachere OCR

Mit Hilfe von Edge Learning können hochentwickelte KI-Algorithmen auf die spezifischen Anforderungen von Hochgeschwindigkeits-Lieferketten ausgerichtet werden, so dass OCR schnell und präzise ist, einfach eingesetzt und schnell trainiert werden kann. Herkömmliche regelbasierte OCR kann unter idealen Bedingungen eine Genauigkeitsrate von bis zu 98% erreichen. Bei den Mengen, die in modernen Lieferketten gehandhabt werden, führt diese Rate immer noch zu vielen Ausschussteilen, was den Gesamtdurchsatz verringert. Vortrainierte Edge-Learning-Algorithmen übertreffen diese Genauigkeitsrate, denn sie sind auf die Herausforderungen beim Lesen von Text unter den Bedingungen von Fertigungs-, Prüf- und Logistiklinien zugeschnitten, die mit hoher Geschwindigkeit arbeiten. Die Edge-Learning-Verarbeitung wird dabei auf dem Gerät selbst durchgeführt, direkt an der Fertigungs- bzw. Logistiklinie, ohne dass eine Kommunikation mit einem anderen Prozessor erforderlich ist. Dies führt zu Geschwindigkeitsvorteilen gegenüber herkömmlichen OCR-Systemen.

Vortrainierte Edge-Learning-Tools: genau und schnell

Komplexere KI-gestützte Deep-Learning-Algorithmen sind ebenfalls in der Lage, OCR durchzuführen. Sie erreichen unter optimalen Bedingungen eine Genauigkeit von nahezu 100 Prozent und können jede Art von Text lesen lernen. Ihr Nachteil: Sie sind zu langsam für den unmittelbaren Einsatz an Fertigungs- bzw. Logistiklinien, erfordern hochentwickelte Prozessoren sowie umfangreiches Fachwissen bei der Implementierung. Für die jeweilige Anwendung vorab trainierte Edge-Learning-Tools erreichen aufgrund ihrer Spezifität die Genauigkeit von generalisierten Deep Learning-Systemen und sind dabei in der Lage, die von der Industrie geforderten Geschwindigkeiten zu erzielen.

Smart-Kamera für Edge-Learning-OCR

Die herausragende Geschwindigkeit und Genauigkeit von Edge-Learning-Tools wird dabei im besten Fall durch eine hochentwickelte Hardware wie dem Bildverarbeitungssystem In-Sight 3800 von Cognex gewährleistet. Diese Smart-Kamera verfügt über einen leistungsstarken Sensor, eine integrierte Beleuchtung, ein Autofokus-Flüssiglinsen-Objektiv für eine schnelle Fokussierung und hohe Geschwindigkeiten sowie einen integrierten Prozessor. Ihre HDR+-Funktion ermöglicht verkürzte Belichtungszeiten, wodurch sich Anwendungen mit schnelleren Liniengeschwindigkeiten realisieren lassen. Das kleine Gehäuse ist unempfindlich gegen Vibrationen. Die Kamera ist einfach zu platzieren, mit Strom zu versorgen und mit einer Fertigungs- bzw. Logistiklinie zu verbinden, um Bilder zu erzeugen, die perfekt für die Edge-Learning-OCR geeignet sind.

Trainingsaufwand reduziert

Herkömmliche regelbasierte OCR-Bildverarbeitungssysteme haben einen hohen Programmieraufwand bei der Einrichtung. Sie erfordern Zeit, Fachwissen und eine Neuprogrammierung, wenn sich die Anforderungen ändern. Im Gegensatz dazu werden Deep Learning-basierte Systeme trainiert, indem man ihnen spezifische, mit Tags versehene Bilder der entscheidenden Merkmale vorlegt. Deep Learning kann erstaunliche Fähigkeiten entwickeln, um feine Unterscheidungen zu treffen und Texte unter einer Vielzahl von schwierigen Bedingungen exakt zu lesen. Um diese Genauigkeit zu erreichen, können jedoch Hunderte oder sogar Tausende von markierten Bildern für das Training erforderlich sein.

Für die vortrainierte Edge-Learning-OCR reicht dagegen bereits eine kleine Zahl an Bildern zum spezifischen Anwendungsfall aus, um die Fähigkeit zu entwickeln, die gewünschten Schriften zu lesen. Für dieses spezifische Training der OCR ist zudem kein spezielles Wissen über Bildverarbeitung oder KI-Algorithmen erforderlich, sondern lediglich die Kenntnis der erforderlichen OCR-Aufgabe.

Einfache Implementierung

Auch in Bezug auf die Implementierung bieten Edge Learning-basierende OCR-Systeme Vorteile im Vergleich zu regelbasierten oder Deep-Learning-Bildverarbeitungssystemen. So sind damit weder unterschiedliche Schriftenbibliotheken noch detaillierte Analysen der möglichen Fehllesung verschiedener Symbole nötig. Herkömmliche OCR-Programme verwenden eine Reihe spezifischer Techniken, um die Gefahr der Fehllesung eines Symbols zu verringern, z.B. spezielle Schriftenbibliotheken oder eine Feldeinteilung, die eine sorgfältige Definition jeder möglichen Stelle in einem Code und die Festlegung des Typs erfordert, so dass z.B. die Ziffer 8 in einem definierten numerischen Feld nicht fälschlicherweise als ein ‚B‘ gelesen werden kann.

Wenn die Edge-Learning-OCR einen Fehler macht, lernt sie durch eine einfache Korrektur durch den Bediener, ähnliche Fehler in Zukunft zu vermeiden. Sie lernt von selbst, welche Merkmale für Genauigkeit sorgen, ohne spezielle Programmierung, Feldeinteilung oder andere zeitaufwendige Verfahren.

KI-Optionen integriert

Mit seinem Bildverarbeitungssystem In-Sight 3800 bietet Cognex Anwendern eine leistungsfähige Option für die Realisierung schneller, präziser Prüfanwendungen auf Basis von künstlicher Intelligenz an. Das für Hochgeschwindigkeits-Produktionslinien konzipierte System stellt ein umfangreiches Vision-Toolset, leistungsstarke Bildverarbeitungsfunktionen und eine flexible Software zur Verfügung, um vollständig integrierte Lösungen für eine breite Palette von Prüfanwendungen zu liefern. Wesentliches Element ist der umfangreiche Werkzeugsatz, der sowohl die auf KI-basierende Edge-Learning-Technologie als auch traditionelle regelbasierte Algorithmen umfasst. Damit lassen sich somit zahlreiche Anwendungen zum Lesen von Klarschrift und zur Fehlererkennung an Codes in unterschiedlichen Branchen, wie etwa in den Bereichen Automotive, Lebensmittelproduktion und Logistik, schnell und zuverlässig realisieren. Auf diese Weise steht Anwendern eine effiziente Möglichkeit zur Verfügung, die Rückverfolgbarkeit von Produkten entlang der Lieferketten mit OCR zu maximieren.

Das könnte Sie auch Interessieren

Weitere Beiträge

Bild: Matuschek Messtechnik GmbH
Bild: Matuschek Messtechnik GmbH
Präzisionsanalyse elektrischer und mechanischer Motordaten

Präzisionsanalyse elektrischer und mechanischer Motordaten

Mit einer modularen Erweiterungskarte zur Auswertung auch mechanischer Signale elektrischer Motoren und anderer Antriebskomponenten höherer Leistungsklassen hat die Matuschek Meßtechnik GmbH ihren POWERAnalyzer LK-601 komplettiert. Das mehrkanalfähige Leistungsmessgerät zur Datenerfassung und -analyse ist einerseits hoch präzise, andererseits flexibel wie ein Datenerfassungssystem (DAQ). Industrieanwendungen bis zur End-Of-Line-Prüfung lassen sich mit ihm ebenso optimieren wie Prozesse in Forschung und Entwicklung an stationären Prüfständen.

mehr lesen