Articles
Das Kraftpaket 405B
Llama 3.1 405B ist ein bahnbrechendes Modell, das als erstes KI-Modell mit Open Weight mit der Leistung von Closed-Source-Giganten wie GPT-4 und Claude 3.5 Sonnet mithalten kann. Mit dieser Entwicklung wird die Kluft zwischen offenen und geschlossenen Modellen deutlich verringert und der Zugang zu modernsten KI-Funktionen demokratisiert. Die Offenheit von Llama 3.1 ermöglicht es der Community, das Modell selbst zu verfeinern und anzupassen, was eine Welle von spezialisierten, leistungsstarken Modellen auslösen könnte, die auf verschiedene Bedürfnisse zugeschnitten sind.
Zugänglich für alle
Das 8B-Modell von Llama 3.1 stellt einen großen Fortschritt für Hardware in Verbraucherqualität dar. Es übertrifft die Leistung von GPT 3.5 bei vielen Benchmarks und kann gleichzeitig lokal und kostenlos betrieben werden. Dieser Fortschritt ermöglicht es Entwicklern und Forschern, auf dem neuesten Stand der Technik zu sein, und gibt ihnen die Möglichkeit, Innovationen zu entwickeln, ohne eine teure Infrastruktur zu benötigen.
Wichtige Verbesserungen
Llama 3.1 enthält mehrere wichtige Verbesserungen:
- 128K Kontext Länge für alle Modelle: Dies ermöglicht eine bessere Verarbeitung längerer Eingaben, wodurch komplexere Aufgaben und längere Unterhaltungen möglich sind.
- Mehrsprachige Unterstützung für acht Sprachen: Dies erweitert die Verwendbarkeit des Modells in verschiedenen sprachlichen Kontexten und macht es vielseitiger und umfassender einsetzbar.
- Verbesserte Fähigkeiten zur Argumentation und zum Einsatz von Werkzeugen: Durch diese Anpassung ist das Modell besser in der Lage, logische Schlussfolgerungen zu ziehen und sogar externe Tools effektiv zu nutzen.
- Verbesserte Befolgung von Anweisungen und Chat-Leistung: Das Modell versteht jetzt Anweisungen besser und führt sie aus, was zu genaueren und kohärenten Antworten in Chat-Anwendungen führt.
Was dies für die Zukunft bedeutet
Die Veröffentlichung von Llama 3.1, insbesondere des 405B-Modells, stellt einen wichtigen Meilenstein in der Open-Source-KI dar. Sie verspricht, Innovationen zu beschleunigen, neue Anwendungen zu ermöglichen und die Grenzen dessen, was mit lokal betriebenen Modellen möglich ist, zu erweitern. Wenn sich dieser Trend fortsetzt, können wir davon ausgehen, dass in naher Zukunft noch leistungsfähigere und leichter zugängliche KI-Tools auf den Markt kommen werden.
Stay tuned, wenn die Community beginnt, diese bahnbrechenden Modelle zu erforschen und auszubauen!
Sie wollen mehr über Künstliche Intelligenz und deren Modelle lernen? Dann ist unsere KI Schulung genau das Richtige für Sie!
Hier finden Sie weitere Informationen.
Kontakt
Region
Sebastian Kouba
Sebastian treibt mit seiner Expertise in generativer KI unsere In-House AI-Innovation voran. Wenn er nicht bei der Arbeit ist, lässt er seine Jugend auf dem Beachvolleyballfeld wieder aufleben oder bereitet den perfekten Cappuccino zu.
Cloud-Infrastruktur
Damit Microservices klein genug bleiben, um diesen Namen zu verdienen, muss es einfach sein, neue Microservices zu erstellen. Zusätzlich zu der Code-Basis ist dafür einige Infrastruktur notwendig, die sich über verschiedene Services hinweg im Prinzip wenig unterscheidet.
Es ist daher sinnvoll, diese wiederkehrenden Elemente von einem dedizierten Infrastruktur-Team verwalten und warten zu lassen. Dazu gehören folgende Elemente:
Bereitstellung von Rechenressourcen
Um Ressourcen gut nutzen zu können, hat sich im letzten Jahrzehnt Container-Technologie als gewinnbringendes Konzept herausgestellt. Hierbei werden einzelne Prozesse durch Linux-Kernel-Features voneinander abgekapselt, was eine gemeinsame Nutzung von Rechenressourcen durch voneinander unabhängige Prozesse erleichtert. Wesentlich für die Nutzung von Container-Technologie ist, dass einzelne Container jederzeit (etwa auf einem anderen Rechner) neu gestartet werden können, da so eine orchestrierte hohe Auslastung der verfügbaren Rechenzeit erreicht wird. Der de-facto-Standard für die Orchestrierung von Containern ist das Open-Source-System Kubernetes, das bei guter Konfiguration eine Schnittstelle für Entwickler zum einfachen Deployment von Containern (und anderen Ressourcen) bereitstellt.
Da eine gute Konfiguration eines Kubernetes-Clusters eine relativ komplexe Aufgabe ist, sollte hierfür ein spezialisiertes Team etabliert werden, dass sich unter anderem mit der Netzwerkarchitektur, Kommunikation zwischen Containern, Secret Management und grundlegendem Logging und Monitoring in Zusammenhang mit Kubernetes beschäftigt.
Netzwerk-Konnektivität
Die innere Einfachheit von Microservices wird dadurch erkauft, dass viel Komplexität in die Kommunikation zwischen Services verlagert wird. Dafür ist es wichtig, dass Microservices eine Netzwerkverbindung zueinander und in Richtung Internet aufbauen können. Die Verbindung sollte automatisch durch mTLS abgesichert werden. Diese Automatisierung kann am besten auch durch ein zentrales Infrastruktur-Team gewährleistet werden.
Auch grundlegende Allow-Lists für den Zugriff auf Services sollten durch die Microservice-Teams einfach eingerichtet werden können, und gegebenenfalls sollten aus Compliance-Gründen manche Netzwerkregeln durch das Infrastruktur-Team verbindlich festgesetzt werden. Die Kommunikation zwischen Microservices ist erheblich leichter zu erreichen, wenn die Infrastruktur bei einem einzelnen Cloud-Provider gehostet wird.
Persistenz
Microservice-Container sollten jederzeit neu gestartet werden können, ohne Daten zu verlieren. Das impliziert, dass persistente Datenhaltung außerhalb der Microservices stattfinden muss, typischerweise in Datenbanken oder in persistenten Volumes. Neben allgemeinen Schwierigkeiten wie Authentifizierung und Autorisierung, sowie der Konnektivität zu den Datenhaltungssystemen bestehen hier spezialisierte Herausforderungen wie die Erstellung von Daten-Backups und Snapshots, um die Wiederherstellbarkeit persistenter Daten gewährleisten zu können.
Für verschiedene Bedürfnisse sollten verschiedene Typen von Datenbanken zur Verfügung gestellt werden, aus denen Microservice-Teams auswählen können: etwa eine SQL-Datenbank, eine Dokumentendatenbank und ein Cache-System. Das ist wichtig, um die Technologieoffenheit bei der Umsetzung von Microservices zu gewährleisten, sodass die Microservice-Teams die beste Technologie für ihren Anwendungsfall auswählen können.
Die Bereitstellung von Datenbanken oder Volumes sollte möglichst automatisiert erfolgen, wofür eine enge Zusammenarbeit mit dem Kubernetes-Team notwendig ist.
Wir planen Ihre Microservice-Architektur. Und bieten noch so viel mehr im Bereich agile Softwareentwicklung. Überzeugen Sie sich selbst.
Logging und Monitoring
Um Fehlerfälle reproduzieren und beheben zu können, ist es entscheidend, dass es einen einfachen Weg gibt, um auf die produzierten Logs der einzelnen Microservices zugreifen zu können. Hierfür ist der Industriestandard ein Elastic Stack, der bestenfalls von einem zentralen Team gehosted und gemanaged wird, damit die Microservice-Teams sich nicht um das Setup von Logging-Infrastruktur kümmern müssen. Auch andere Lösungen als ein Elastic Stack sind hier denkbar, doch eine Standardlösung sollte zentral vorgegeben werden, und auch das Log-Format (beispielsweise JSON mit bestimmten vorgegebenen Feldern) sollte über Microservices hinweg standardisiert sein.
Logs müssen auch über mehrere Services hinweg miteinander verknüpft werden können, insbesondere auch über REST-Requests oder asynchrones Messaging hinweg. Hierfür ist Request Tracing via OpenTelemetry geeignet, indem die Traces über Requests hinweg propagiert werden, beispielsweise mit Hilfe der B3-Spezifikation. Zusätzlich können die so entstehenden Traces natürlich dafür genutzt werden, Bottlenecks bei Requests zu erkennen und zu beheben.
Auch ein Monitoring-/Alerting-Stack (typischerweise mit Hilfe von Prometheus und Grafana) sollte zentral maintained sein und mit standardisierten Metriken sowie individuell konfigurierbaren Metriken gefüllt werden können. Alerts sollten individuell durch die Microservice-Teams einstellbar sein.
API-Design
Je nach Microservice können die Anforderungen an die APIs zur Kommunikation mit dem Microservice sehr unterschiedlich sein. Dennoch kann es sinnvoll sein, gemeinsame Anforderungen an die API-Struktur (beispielsweise HATEOAS oder gRPC) zu stellen, die nur in begründeten Ausnahmefällen nicht berücksichtigt werden. Für HTTP-APIs kann OpenAPI eine gute Lösung für die Dokumentation darstellen.
Gegebenenfalls kann man sich dafür entscheiden, die Bereitstellung von OpenAPI-Spezifikationen für Microservices verpflichtend zu gestalten, sodass sich die Entwickler von Clients auf die Existenz dieser Spezifikationen verlassen können. In jedem Fall sollte ein gemeinsames Schema für die Dokumentation von APIs (inklusive Fehlerfällen) geschaffen werden, damit es einfacher wird, relevante Dokumentation zu finden.
Messaging
Asynchrone Kommunikation über Messaging-Systeme kann wesentlich dabei helfen, das Gesamtsystem resilient zu gestalten. Die durch die Asynchronität entstehende temporäre Inkonsistenz bei der Datenhaltung wird bewusst in Kauf genommen („Eventual Consistency“), um schnellere Requests und eine Entkopplung verschiedener Microservices zu erreichen.
Damit Kommunikation über Messaging zwischen verschiedenen Microservices funktioniert, sollte das Messaging-System selbst von einem zentralen Team bereitgestellt und verwaltet werden. Das Format der Messages sollte wie bei den APIs mithilfe eines gemeinsamen Schemas dokumentiert werden.
Authentifizierung und Autorisierung
Authentifizierung und Autorisierung sind zentrale Aufgaben, die nicht von einzelnen Microservice-Teams erledigt werden können. Hierfür sollte eine zentrale Lösung, beispielsweise basierend auf OpenID, bereitgestellt werden.
Zusammenfassung
Eine Microservice-Architektur kann gerade für komplexe Systeme eine gute Lösung sein, um schnell Verbesserungen am System sowie neue Features zu implementieren. Dadurch entstehen allerdings Abhängigkeiten zwischen Microservices und somit auch zwischen den Microservice-Teams.
Die hier beschriebenen Querschnittskonzepte helfen dabei, Konsistenz, Sicherheit und Effizienz in einem Microservice-Umfeld sicherzustellen.
Kontakt
Region
Sie möchten mehr erfahren oder haben Sie eine Frage? Dann treten Sie mit uns in Kontakt!
Microservices sind ein Design-Pattern in der Softwarearchitektur, das zum Ziel hat, durch kleinere Teams und konzentriertere Verantwortlichkeiten Kommunikationswege zu verkürzen und so zu einer geringeren Time-to-market zu gelangen.
Die grundlegenden Ideen von Microservices gehen auf die Unix-Prinzipien zurück, die bereits 1978 von Doug McIlroy formuliert wurden. Laut ihm sollten Programme so gestaltet werden, dass sie:
- genau eine Aufgabe haben und diese dafür gut erfüllen,
- hintereinander geschachtelt werden können, sodass ein Programm die Eingabe für ein anderes Programm produziert,
- früh getestet und gegebenenfalls wieder aufgegeben werden können,
- Tools für wiederkehrende Aufgaben bei der Entwicklung nutzen.
Microservices werden durch die folgenden Eigenschaften charakterisiert:
- Single Purpose: Wie bei den Unix-Prinzipien sollte ein Microservice genau eine Aufgabe gut erfüllen.
- Encapsulation: Microservices haben das alleinige Eigentum an ihren Daten. Sie interagieren mit der Außenwelt über wohldefinierte Schnittstellen.
- Ownership: Ein einzelnes Team (bestenfalls bestehend aus 5-9 Personen) ist verantwortlich für einen Microservice über seine gesamte Lebenszeit.
- Autonomy: Das für den Microservice zuständige Team darf ohne Absprache zu jeder Zeit den Microservice bauen und deployen. Das Team ist frei in Implementationsentscheidungen.
- Multiple Versions: Es ist möglich, dass zur gleichen Zeit verschiedene Versionen eines Microservices existieren.
- Choreography: Es gibt kein zentralisiertes System, das einen Workflow orchestriert. Stattdessen ist jeder Microservice in der Lage sich selbstständig mit den Informationen zu versorgen, die er für seine Funktionalität braucht.
- Eventual consistency: Eine kurzzeitige Inkonsistenz von Daten zwischen Microservices ist akzeptiert, solange die Daten schließlich wieder konsistent werden.
Herausforderungen von Microservices
Microservices sind durch ihre innere Einfachheit generell besser skalierbar und leichter und schneller zu ändern als Monolithen, in denen die gesamte Logik in einem einzelnen Programm enthalten ist. Durch die kleinen Teams fühlen sich (und sind) Microservice-Teams deutlich stärker für den Erfolg ihrer Microservices verantwortlich, was häufig zu besseren Ergebnissen und Entscheidungen führt.
Microservices erleichtern Omnichannel-Lösungen durch geteilte Backend-Funktionalität, die von verschiedenen Benutzerschnittstellen konsumiert werden können.
Erhöhte Komplexität
Auf der Ebene einzelner Microservices schaffen wir uns durch den begrenzten Aufgabenbereich und die Kapselung eine einfache und schöne Welt, doch TANSTAAFL!³ Die innere Einfachheit von Microservices wird erkauft durch die erhöhte Komplexität in Bezug auf die Kommunikation zwischen Microservices sowie eine gewisse Redundanz: Da die Microservice-Teams vollständig für ihre Services verantwortlich sind (Ownership) und sie auch selbstständig deployen können (Autonomy), müssen sie technisch dazu in der Lage sein, dieses Deployment tatsächlich durchzuführen. Das schließt sowohl Kompetenzen in Bezug auf Cloud-Infrastruktur ein als auch die Ressourcen, die für den Betrieb der Infrastruktur notwendig sind.
Konkreter können wir uns einen Mailing-Service vorstellen, der dafür zuständig ist, Informationsmails über ein Produkt an Kunden zu versenden. Der Service muss im Laufe der Entwicklung gebaut und dann auch ausgeführt werden. Die dafür verwendeten Computer müssen die notwendige Konnektivität haben, um diese Aufgaben durchzuführen. Sobald der Service läuft, müssen andere Services dazu in der Lage sein, den E-Mail-Prozess in Gang zu setzen. Mögliche Wege hierfür sind beispielsweise ein Event-System, aus dem der Mailing-Service selbstständig (im Sinne der Eigenschaft Choreography) die für ihn relevanten Events herausfiltert und zu E-Mails weiterverarbeitet.
So ein Event-System oder Messaging-System muss aber zum einen bereitgestellt werden und zum anderen von verschiedenen Teams mit ihren jeweiligen Microservices genutzt werden können. Ein anderes denkbares Szenario wäre die Ansprache des Mailing-Services via REST-Schnittstelle. In diesem Fall muss der Client dazu in der Lage sein, über ein Netzwerk mit unserem Mailing-Service zu kommunizieren, und diese Verbindung muss so abgesichert sein, dass nur autorisierte Services Zugriff auf die Schnittstelle bekommen.
Wir planen Ihre Microservice-Architektur. Und bieten noch so viel mehr im Bereich agile Softwareentwicklung. Überzeugen Sie sich selbst.
Authentifizierung & Autorisierung
Authentifizierung und Autorisierung ist typischerweise ein relativ komplexes Problem und sollte innerhalb des Unternehmens auch konsistent gehandhabt werden, um die Nachvollziehbarkeit zu erhöhen. Daher ist es empfehlenswert, wenn Microservice-Teams sich nicht eigenständig für dieses Thema verantwortlich sind.
Da zum einen mehrere Instanzen des Mailing-Service in gegebenenfalls verschiedenen Versionen koexistieren können (Multiple Versions) und zum anderen Microservice-Instanzen jederzeit neu deployed und insbesondere auch gestoppt werden können (Autonomy), ist es essenziell, dass relevante Daten (wie beispielsweise fertig zusammengestellte Mails, die noch nicht versendet werden konnten) instanzübergreifend und permanent gespeichert werden. Dafür sind Datenbanken und persistente Volumes nötig, die bereitgestellt und gewartet werden müssen. Auch Backups und Snapshots der Daten sollten existieren und regelmäßig getestet werden.
Für besondere Herausforderungen sorgt der Fehlerfall: Wenn irgendein Prozess im Gesamtsystem plötzlich nicht mehr funktioniert, ist es wichtig, über mehrere Microservices hinweg Fehleranalyse betreiben zu können. Hierfür ist eine konsistente Logging-Infrastruktur sowie Request Tracing und Alerting hilfreich. Natürlich muss auch für diese Lösungen Infrastruktur bereitgestellt werden.
Zusammenfassung
Die beschriebenen Herausforderungen zeigen, dass es einige Punkte gibt, an denen wir serviceübergreifend für Einheitlichkeit sorgen sollten. Manche dieser Punkte werden wir in diesem Artikel genauer unter die Lupe nehmen. Elemente der Softwarearchitektur, die (potenziell) für mehrere Bausteine der Architektur (in unserem konkreten Fall also Microservices) relevant sind, nennt man Querschnittskonzepte.
Um Redundanz zu vermeiden, sollten solche Querschnittskonzepte in der übergreifenden Architekturdokumentation behandelt werden, unabhängig von den einzelnen Komponenten. Es ist wichtig, Querschnittskonzepte frühzeitig festzulegen, da eine Migration zu einem späteren Zeit viel Kapazität über alle Teams hinweg in Anspruch nimmt.
Coming up
Im nächsten Beitrag gehen wir auf die Basisbausteine von Microservices ein, die sich nur wenig unterscheiden und daher zentral von einem Infrastrukturteam verwalten werden können.
Kontakt
Region
Sie möchten mehr erfahren oder haben eine Frage? Dann treten Sie mit uns in Kontakt!
Das maschinelle Lernen (ML) hat in den letzten Jahren ein explosionsartiges Wachstum erlebt. Da Unternehmen zunehmend ML-Modelle einsetzen, um den unternehmerischen Mehrwert zu steigern, ist der Bedarf an robusten Verfahren für den Betrieb von maschinellem Lernen (Machine Learning Operations, MLOps) von größter Bedeutung. MLOps umfassen die Tools und Prozesse, die für eine effiziente Handhabung des gesamten Lebenszyklus des Maschinellen Lernens erforderlich sind: von der Datenerfassung, der Datenverarbeitung und dem Modelltraining bis hin zur Bereitstellung, Überwachung und Steuerung von Modellen.

Im Folgenden werfen wir einen Blick in die spannende Zukunft von MLOps. Wir betrachten aufkommende Trends, die die technische Landschaft umgestalten werden, und beleuchten die Herausforderungen, denen sich Unternehmen stellen müssen, um erfolgreiche Implementierungen von Maschinellem Lernen sicherzustellen.
Was ist maschinelles Lernen?
Maschinelles Lernen ist eine Form der künstlichen Intelligenz (KI), die es Computern ermöglicht, ohne ausdrückliche Programmierung zu lernen. Durch die Analyse von Daten und den Einsatz statistischer Verfahren können Maschinen Muster erkennen und ihre Leistung bei bestimmten Aufgaben verbessern. Diese Technologie findet in verschiedenen Bereichen Anwendung, von der Spam-Filterung bis zur Gesichtserkennungssoftware. Sie umfasst auch den Teilbereich des Deep Learning, der als Grundlage für die kürzlich entwickelten Large Language Models (LLMs) wie ChatGPT dient.
Trends aufgreifen: Ein Blick in die Zukunft von MLOps
Die Systemlandschaft für MLOps entwickelt sich ständig weiter und es entstehen neue Technologien und Methoden, um die Komplexität der Verwaltung von ML-Modellen in der Produktion zu bewältigen. Nachstehend finden Sie einige wichtige Trends, die die Zukunft von MLOps prägen:
- Cloud-Native MLOps: Cloud Computing bietet eine skalierbare, kostengünstige Plattform für die Verwaltung von ML-Workloads. Cloud-basierte MLOps-End-to-End-Plattformen verschlanken den gesamten ML-Lifecycle, von der Datenspeicherung und den Rechenressourcen bis zum Modelltraining und der Bereitstellung. So können Unternehmen die Elastizität der Cloud nutzen, um schwankende Arbeitslasten zu bewältigen und effizient mit verschiedenen Modellen zu experimentieren.
Beispiel für eine kommerzielle End-to-end-Plattform im Bereich MLOps ist Amazon SageMaker, eine cloudbasierte ML-Plattform zum Entwickeln, Trainieren, und zur Bereitstellung von ML-Modellen. Kubeflow fällt ebenfalls in die Kategorie dieser Plattformen, ist jedoch im Gegensatz zu Amazon SageMaker open-source und kann somit kostenlos benutzt werden.
- Automatisierte ML-Pipelines: Die Automatisierung sich wiederholender Aufgaben innerhalb des ML-Lebenszyklus, wie z. B. Dateneingabe, Datenvorverarbeitung, Feature Engineering und Modellauswahl, kann die Effizienz erheblich steigern und menschliche Fehler reduzieren. Automatisierte ML-Pipelines nutzen Tools wie AutoML (Automated Machine Learning), um verschiedene Phasen der Modellentwicklung zu automatisieren, sodass sich Data Scientists auf strategische Aufgaben wie die Entwicklung innovativer Modellarchitekturen und die Identifizierung neuartiger geschäftlicher Anwendungsfälle konzentrieren können.
Beispielsweise bieten Azure mit Azure Automated Machine Learning, Amazon Web Services (AWS) mit AWS AutoML Solutions, oder Google Cloud Platform (GCP) mit AutoML Dienstleistungen in diesem Bereich an, was den Aufwand einer eigenen Implementierung dieser komplexen Methode minimiert.
- Kontinuierliche Integration und kontinuierliche Bereitstellung (CI/CD) für Maschinelles Lernen: Die Implementierung von CI/CD-Verfahren in MLOps stellt sicher, dass Änderungen an Modellen und Code nahtlos integriert und bereitgestellt werden. Dies fördert eine schnelle Experimentier- und Iterationskultur, die es Unternehmen ermöglicht, Modelle schnell an veränderte Geschäftsanforderungen und eine veränderte Verteilung von Daten anzupassen.
- Erklärbarkeit und Interpretierbarkeit von Modellen (XAI): Da ML-Modelle immer komplexer werden, wird das Begreifen ihrer Entscheidungsprozesse immer wichtiger. XAI-Techniken helfen zu erklären, wie die Modelle zu ihren Vorhersagen kommen, fördern das Vertrauen in die Modellergebnisse und ermöglichen es den Stakeholdern, mögliche Verzerrungen oder Fairnessprobleme zu erkennen.
Tools, die Sie dabei unterstützen können ML-Modelle erklärbarer und ihre Entscheidungen transparenter zu machen, sind z.B. Alibi Explain eine open-source Python Bibliothek, die auf die Interpretation und Einsicht von ML-Modellen abzielt, oder SHapley Additive exPlanations (SHAP) ein Ansatz aus der Spieltheorie, um die Ausgabe beliebiger ML-Modelle zu erklären.
- MLOps für Responsible AI: Die verantwortungsvolle Entwicklung und der Einsatz von KI-Modellen sind ein zentrales Anliegen. MLOps-Praktiken, die die Prinzipien Fairness, Rechenschaftspflicht, Transparenz und Ethik (Microsofts Forschungsgruppe FATE beschäftigt sich beispielsweise mit diesem Themengebiet) in den gesamten Lebenszyklus von KI-Modellen einbeziehen, sind unerlässlich, um sicherzustellen, dass die Modelle unvoreingenommen sind, unbeabsichtigte Folgen vermieden werden und die geltenden gesetzlichen Bestimmungen eingehalten werden.
Ein Beispiel für eine solche Rechtsvorschrift ist der kürzlich vom Europäischen Parlament verabschiedete AI Act , ein „Rechtsrahmen für KI, der die Risiken der KI angeht und Europa in die Lage versetzt, weltweit eine führende Rolle zu spielen“. Bei dem Unterfangen verantwortungsvoll und sicher KI zu gestalten, können beispielsweise Arthur und Fiddler herangezogen werden.
- Integration mit DevOps: Die Anpassung von MLOps-Praktiken an bestehende DevOps-Workflows kann eine einheitlichere Entwicklungsumgebung schaffen. Dies fördert die Zusammenarbeit zwischen Data Scientists, ML und Software Engineers und führt schließlich zu einem schlankeren und effizienteren Softwareentwicklungs-Lebenszyklus (SDLC), der maschinelles Lernen mit einschließt.
- Bedeutung von datengesteuerter KI und DataOps: Daten sind das Lebenselixier von ML-Modellen. DataOps-Praktiken, die die Datenqualität, -verfügbarkeit und -sicherheit während des gesamten ML-Lebenszyklus sicherstellen, sind entscheidend für die Leistungsfähigkeit der Modelle und die Zuverlässigkeit des gesamten Systems. DataOps kombiniert Automatisierung, Zusammenarbeit und agile Praktiken, um die Geschwindigkeit, Zuverlässigkeit und Qualität der Daten zu verbessern, die durch Ihr gesamtes Unternehmen fließen. Mit diesem Ansatz können Sie schneller Erkenntnisse aus Ihren Daten gewinnen, datengesteuerte Entscheidungen effektiver treffen und die Qualität und Leistung Ihrer Machine Learning-Modelle auf der Grundlage dieser Daten verbessern.
- Fokus auf Sicherheit: Mit der zunehmenden Verbreitung von ML-Modellen wird es immer wichtiger, sie vor potenziellen Angriffen zu schützen. MLOps-Praktiken, die Sicherheitsüberlegungen in den gesamten Lebenszyklus des Modells integrieren, sind unerlässlich, um Risiken wie Data Poisoning, gegnerische Angriffe und Modelldiebstahl zu verhindern.
Herausforderungen meistern: Aufbau eines soliden MLOps-Grundgerüsts
Auch wenn die Zukunft von MLOps sehr verheißungsvoll erscheint, müssen zahlreiche Herausforderungen bewältigt werden, um einen erfolgreichen Einsatz von ML zu gewährleisten.
Hierbei sind einige wesentliche Schlüsselbereiche zu berücksichtigen:
- Standardisierung und Interoperabilität: Die fehlende Standardisierung von MLOps-Tools und -Frameworks kann zu Insellösungen führen und die Zusammenarbeit erschweren. Die Förderung der Interoperabilität zwischen Tools und die Einführung von Best Practices für MLOps-Workflows sind entscheidend für die Schaffung eines einheitlicheren und effizienteren Ökosystems. Ein erster Ansatz, um diesem Missstand zu begegnen, ist das Open Inference Protocol, eine industrieweite Anstrengung, die darauf abzielt ein standardisiertes Kommunikationsprotokoll zwischen sogenannten Inferenzservern (z.B. Seldon MLServer, NVIDIA Triton Inference Server) und orchestrating frameworks wie Seldon Core oder KServe zu etablieren.
- Nachwuchsmangel: Die Nachfrage nach qualifizierten MLOps-Fachkräften übersteigt das verfügbare Angebot. So stieg die Anzahl der offenen Stellen für IT-Fachkräfte in Unternehmen in Deutschland laut Statista im Jahr 2023 auf das Rekordhoch von 149.000, und Index Research berichtet, dass von Januar bis April 2023 Arbeitgeber fast 44.000 Stellen für KI-Experten ausschrieben. Um diese Lücke zu verkleinern und ein starkes MLOps-Team aufzubauen, müssen Unternehmen erheblich in Schulungsprogramme, Strategien zur Talentgewinnung und eine wettbewerbsfähige Mitarbeitervergütung investieren. Dieser Prozess umfasst das Erkennen der wesentlichen Fähigkeiten und Fachkenntnisse, die für eine erfolgreiche MLOps-Implementierung erforderlich sind, wie zum Beispiel Data Science, Software Engineering, Cloud Computing und DevOps. Ferner beinhaltet er die Zusammenstellung interdisziplinärer Teams, die diese verschiedenen Disziplinen abdecken.
- Monitoring und Beobachtbarkeit: Die effektive Überwachung der Leistung und des Zustands von ML-Modellen in der Produktion ist entscheidend, um Probleme frühzeitig zu erkennen und die Zuverlässigkeit des Modells zu gewährleisten. Die Entwicklung robuster Monitoring-Systeme und deren Integration in MLOps-Pipelines ist von entscheidender Bedeutung. Aporia, eine ML-Plattform, die sich die Beobachtbarkeit von ML-Modellen zum Ziel gesetzt hat, kann zu diesem Zweck eingesetzt werden.
- Modellverwaltung: Die Schaffung klarer Governance-Rahmen für die Verwaltung des Lebenszyklus von ML-Modellen ist unerlässlich. Dazu gehören die Festlegung von Rollen und Zuständigkeiten, die Sicherstellung der Modellversionierung und -kontrolle sowie die Festlegung von Richtlinien für die Bereitstellung und Stilllegung von Modellen. Beispiele für Lösungen bzw. Plattformen, die diese Eigenschaften zusammen mit vielen anderen des ML lifecycles ganzheitlich abbilden, sind die Enterprise Plattformen Domino Data Lab sowie Dataiku.
- Erklärbarkeit und Erkennung von Bias: Wie bereits erwähnt, sind die Gewährleistung der Erklärbarkeit von Modellen und die Erkennung potenzieller Vorurteile entscheidende Aspekte einer verantwortungsbewussten KI. Unternehmen müssen in Tools und Techniken investieren, um zu verstehen, wie Modelle zu ihren Entscheidungen kommen, und um etwaige Fairnessprobleme zu identifizieren und zu entschärfen.
Schlussfolgerung: MLOps-Praktiken aufgreifen und gestalten, um Mehrwert zu schaffen
Die Zukunft von MLOps ist äußerst vielversprechend. Unternehmen können belastbare und effiziente betriebliche Prozesse aufbauen, indem sie aufkommende Trends aufgreifen, bewerten, ihre Schlussfolgerungen daraus ziehen und die damit verbundenen Herausforderungen proaktiv angehen.
Auf diese Weise stellen sie nicht einfach nur KI-Modelle für ihre Kunden bereit, sondern schaffen ein Fundament, das für Skalierbarkeit, Verfügbarkeit und Zuverlässigkeit der Modelle Sorge trägt sowie gesetzlichen Anforderungen genügt. Der wichtigste Mehrwert, der diesem Prozess entspringt, ist jedoch das Schaffen von Vertrauen in die Verlässlichkeit, Fairness und Sicherheit der KI-Modelle, was wiederum das Vertrauen in das Unternehmen stärkt.
Kontakt
Region
Florian Erhard
Florian ist Machine Learning Engineer bei HiQ. Wenn er nicht gerade über KI und maschinelles Lernen liest, reist er gerne und taucht in fremde Kulturen ein.