Machine Learning – so finden Sie den richtigen Algorithmus

15.04.2020Autor / Redakteur: B.Sc. Informatik Benjamin Ullrich / Nico Litzel

Intelligente, selbstlernende Maschinen sind elementarer Bestandteil der Industrie 4.0. Damit Machine Learning auch bei zunehmender Komplexität erfolgreich eingesetzt werden kann, ist die Wahl des passenden Algorithmus ausschlaggebend. Entscheidungsbäume sind hier ein probates Mittel, um schnell den Weg zum richtigen Ansatz zu finden.

Anbieter zum Thema

MicroConsult Academy GmbH

RTI Real-Time Innovations

elunic AG

Welcher Algorithmus ist der richtige? Am Schluss des Entscheidungsbaums stehen mögliche Algorithmen, die bei der Datenverarbeitung helfen können.
(Bild: Elunic AG)

Die größte Herausforderung im Bereich Machine Learning in der Qualitätssicherung ist die Datenlage. Bei Bilddaten zählt vor allem die Quantität bei hinreichender Qualität. Das bedeutet, die Daten müssen eine ausreichende Auflösung haben, um die Klassen optisch unterscheiden zu können. Zu berücksichtigen sind dabei Reflektionen, Perspektive und Schattierungen. Zudem sollten die Beispieldaten jeder Klasse – das heißt, je Fehlertyp sowie Bilddaten mit und ohne Defekt – ausgewogen und in hoher Menge verfügbar sein.

Bei Maschinendaten sind die Qualitätskriterien etwas anders: Ist die Messfrequenz ausreichend? Sind Fremdeinflüsse wie Vibration, beispielsweise durch Nachbarmaschinen, minimiert? Ist der Zusammenhang von Betriebsdaten und Sensordaten nachvollziehbar? Optimalerweise sind hier historische Daten von Fehlerzuständen ausreichend. Insgesamt entscheidet sowohl die Qualität und Quantität der Daten als auch die zugrundeliegende kausale Abhängigkeit der Einflussgrößen und Zielgrößen darüber, inwieweit die automatische Qualitätssicherung beziehungsweise die Erkennung von Defekten und Fehlern gelingt. Zugleich entscheiden die Daten aber auch darüber, welche Algorithmen angewendet werden müssen, um die gewünschten Ergebnisse zu erzielen.

Für Deep-Learning-Algorithmen ist, sofern nicht vortrainierte Modelle verwendet werden können, häufig eine große Menge Beispieldaten notwendig, um überhaupt Zusammenhänge aus den Daten erlernen zu können. Der Einsatz von Deep Learning bietet sich dann an, wenn folgende Indikatoren zutreffend sind: Zum einen nämlich dann, wenn die wesentlichen Unterscheidungsmerkmale der Klassen nicht ohne Weiteres von einem Menschen in für den Computer verständliche Symbolik (Zahlen) gebracht werden kann. Zum anderen ist Deep Learning anwendbar, wenn die Daten ein komplexes Format aufweisen, es beispielsweise um Bilder oder Sprache geht. Aber auch dann, wenn viele Daten oder ein vortrainiertes Modell zur Verfügung stehen oder kein explizites Domänenwissen vorhanden ist.

Anwendungen mit deutlich kleineren Datenmengen werden häufig mithilfe des klassischen Machine Learning unter Einsatz von manueller Merkmalsextraktion (Feature Engineering) von Domänenexperten umgesetzt. Hier gibt es allerdings eine hohe Anzahl verschiedener Ansätze, die insgesamt die Komplexität auf Seiten des personellen (Domänenexperte) deutlich in die Höhe treibt.

Den richtigen Algorithmus finden

Machine Learning, Deep Learning und Künstliche Intelligenz – auf dem Weg hin zum passenden Algorithmus sind die relevanten Aspekte in den Entscheidungen die Menge an Beispieldaten (sind ausreichend Beispieldaten für Deep Learning vorhanden?) sowie die Kennzeichnung (Labeling) der Maschinendaten. (Geht es um Supervised oder Unsupervised Learning?)

Ebenso ist zu unterscheiden, ob beispielsweise eine Vorhersage kontinuierlicher Werte (Regression), eine Kategorisierung (Classification) oder eine Erkennung ungewöhnlicher Messwerte (Anomalien) durchgeführt werden soll. Konkret bedeutet das beispielsweise: Soll der Algorithmus eine Kategorisierung vornehmen, also etwa anhand eines Bildes zwischen verschiedenen Fehlertypen unterscheiden oder geht es um die Prognose eines Zahlenwertes, wie der Schätzung der Restlebenszeit eines Bauteils anhand von Sensordaten? Oder müssen unnatürliche Abweichungen der Daten vom Normalzustand erkannt werden, wie eine ungewöhnliche Korrelation von Vibration und Betriebstemperatur einer Maschine in einer normalen Produktionssituation?

Der Entscheidungsbaum als Lösungsansatz

Um herauszufinden, welcher Algorithmus nun der richtige ist, führt häufig der Weg an empirischen Ansätzen nicht vorbei. Da es sich bei Künstlicher Intelligenz und im Speziellen bei Machine Learning um ein groß gewachsenes Sortiment an Algorithmen handelt, kann es hilfreich sein, sich anhand der Charakteristiken Stück für Stück an den geeigneten Algorithmus heranzutasten. Dieser Weg beschreibt eine Verzweigung von Entscheidungen – einen sogenannten Entscheidungsbaum. Am Schluss des Entscheidungsbaums stehen mögliche Algorithmen, die bei der Datenverarbeitung helfen können. Dennoch spielen Erfahrungswerte weiterhin eine große Rolle und können beispielsweise die Anzahl der zu untersuchenden Ansätze deutlich reduzieren.

Chancen für die Qualitätssicherung

In der produzierenden Industrie wird Deep Learning sehr häufig im Bereich der visuellen Qualitätskontrolle und Fehlererkennung eingesetzt und verdrängt schrittweise das klassische, regelbasierte Vorgehen im Computer Vision. So findet Deep Learning beispielsweise Anwendung in der automatisierten Erkennung und Ausschleusung defekter Solar-Panels in der Solarindustrie. In der Medizinbranche werden Tabletten oder medizinisches Equipment auf Beschädigungen oder Einschlüsse in Behältnissen geprüft.

Trotz aller Mühen kann als Resultat herauskommen, dass mit den vorhandenen Daten keine ausreichenden Ergebnisse zu erzielen sind. Damit dieser Fall frühzeitig erkannt und die Aufwände minimal bleiben, muss ein erfahrenes Team die jeweiligen Fälle zu Beginn richtig bewerten und die Realisierbarkeit analysieren.

Der Entscheidungsbaum bietet dann eine effiziente Möglichkeit, den Weg von der Wahl des richtigen Algorithmus bis hin zum Start des Machine-Learning-Prozesses zu beschleunigen. Denn durch eine sorgfältige Vorbereitung und eindeutige Definition der benötigten Ergebnisse mithilfe des Entscheidungsbaums im Voraus, können unnötige Testreihen und Fehlversuche umgangen werden.

Der Autor: Benjamin Ullrich ist Managing Partner, Elunic AG
(Bild: BERLI BERLINSKI)

Der Trend der automatischen Qualitätssicherung wird sich deshalb nicht aufhalten lassen. Allein in China gibt es Produktionsstätten, in denen mehr als 10.000 Mitarbeiter nur für die Qualitätssicherung zuständig sind. Mithilfe des Entscheidungsbaum kann der richtige Machine-Learning-Algorithmus, der die automatisierte Ausschleusung defekter Teile ermöglicht, schnell gefunden werden. Der Einsatz des Entscheidungsbaums bietet also eine große Chance für die Qualitätssicherung und wird in vielen Fällen sehr genau untersucht.

Dieser Beitrag stammt von unserem Partnerportal BigData-Insider.de.

(ID:46502235)