Für die 90 Days of DevOps Community habe ich das Konzept der digitalen Fabrik vorgestellt. Nach Jahren von DevOps-Transformationen in verschiedenen Branchen bei Zühlke habe ich einen ganzheitlichen Ansatz zur Skalierung von DevOps entwickelt, der über Tools und Pipelines hinausgeht. In diesem Vortrag erkläre ich, warum wir immer noch mit Mauern der Verwirrung kämpfen, wie Platform Engineering Teams befähigt, DevOps im grossen Massstab zu betreiben, und wie digitale Fabriken alles zusammenbringen.
Der gebrochene Wertstrom#
Das Muster, das ich in Unternehmen für Unternehmen sehe, ist immer dasselbe. Das Business hat grossartige Ideen. Sie packen sie in Word-Dokumente und Jira-Tickets und werfen sie über die Mauer der Verwirrung zur Entwicklung. Die Entwicklung baut etwas und wirft es zum Testing. Das Testing prüft etwas (das selten mit der ursprünglichen Spezifikation übereinstimmt) und wirft es zum Betrieb. Der Betrieb sagt: “Das wird in der Produktion nie funktionieren.” Aber irgendwie schaffen sie es. Der Kunde bekommt das Ergebnis und sagt: “Das ist nicht das, was wir wollten.”
Der Wertstrom wird durch diese Mauern der Verwirrung gebrochen. Sie entstehen aus Silo-Organisationen mit unterschiedlichen Zielen, fehlender Abstimmung, langsamen und ineffektiven Prozessen und kulturellem Widerstand. Sicherheit und Qualität werden zum Nachgedanken statt eingebauter Praxis.
Von Projekten zu Produkten#
Diese Probleme haben ihren Ursprung in der Art, wie wir Arbeit organisieren. Früher machten wir Wasserfall-Projekte mit fixem Scope, Budget und Zeit. Dann brachte Agile kleinere Inkremente, aber wir machen immer noch Projekte. Unsere Kunden wollen Produkte.
Ein Projekt fokussiert auf Output: Features, User Stories, Tasks und Code maximieren. Ein Produkt fokussiert auf Outcome: das Bedürfnis des Kunden verstehen, sein Problem lösen, sein Verhalten verändern. DevOps unterstützt diesen Wandel, denn es ist ein Mindset, eine Kultur und ein Set von technischen Praktiken, das Menschen über den Wertstrom organisiert, um kontinuierlich Wert zu liefern.
«DevOps bedeutet, alle Menschen, Prozesse und Technologien zusammenzubringen, um kontinuierlich Wert zu liefern.»
Die 24 Schlüsselfähigkeiten aus Accelerate#
Das Buch Accelerate hat wissenschaftlich 24 Schlüsselfähigkeiten identifiziert, die die Software-Delivery-Performance treiben. Sie fallen in fünf Kategorien:
- Continuous Delivery: Versionskontrolle, Deployment-Automatisierung, Continuous Integration, Trunk-Based Development, Testautomatisierung, Testdatenmanagement, Shift-Left Security
- Architektur: Lose gekoppelte Architektur und befähigte Teams (Teams mit maximal fünf Personen mit klaren Inputs und Outputs)
- Produkt und Prozess: Kundenfeedback, Value Stream Mapping, Arbeiten in kleinen Batches, Team-Experimentierung
- Lean Management und Monitoring: Change-Approval-Prozesse (die laut Wissenschaft keinen Nutzen bringen und oft verlangsamen), Monitoring, WIP-Limits, Visualisierung der Arbeit
- Kultur: Westrum-Organisationskultur (pathologisch, bürokratisch oder generativ), unterstützendes Lernen, Arbeitszufriedenheit, transformationale Führung
Die Forschung bildet auch die Beziehungen zwischen diesen Fähigkeiten ab. Wenn man die Ergebnisse auf der rechten Seite erreichen will, investiert man in die Fähigkeiten auf der linken Seite.
Das Tesla-Beispiel#
Um zu veranschaulichen, wie moderne Continuous Delivery aussieht, betrachten wir Tesla. Am 7. Oktober 2021 twitterte Elon Musk, dass das Selbstfahr-Modul FSD 10.2 an 1'000 Besitzer mit perfektem Safety Score ausgerollt wird. Das sagt uns: Die Software ist modularisiert, Over-the-Air-Updates funktionieren, das Fahrverhalten wird kontinuierlich überwacht, und bestimmte Benutzergruppen können gezielt angesprochen werden. Das ist ein Canary Release.
Am 15. Oktober wurde Version 10.3 an eine grössere Gruppe ausgerollt. Am 24. Oktober wurde auf 10.2 zurückgerollt wegen eines Problems. In einer regulierten Branche, mit Autos auf der Strasse, führten sie einen Rollback durch. Nicht einmal 24 Stunden später deployten sie 10.3.1 als Fix Forward. Viele Unternehmen schaffen keine Rollbacks mit ihrer Software. Tesla macht es mit Hardware auf der Strasse.
Das Problem der kognitiven Belastung#
Moderne Softwareentwicklung erfordert ein enormes Set an technischen Praktiken: Infrastruktur, Laufzeitumgebung, CI/CD, Monitoring, Security, Tooling, Kostenmanagement, Wartung und Zugriffsmanagement. Und irgendwo dazwischen will man auch noch eine Applikation bauen.
Wenn man das über mehrere Teams skaliert, baut jedes Team seinen eigenen Stack. Das führt zu Inkonsistenzen, Redundanzen, fehlendem Betriebswissen, keinen Synergien und Schwierigkeiten, Mitarbeitende zwischen Teams zu verschieben. Die kognitive Belastung wird erdrückend.
Platform Engineering: Das Fundament#
Platform Engineering löst dieses Problem. Ein Plattform-Team baut ein Produkt, die Plattform, das standardisierte Fähigkeiten für Produkt-Teams bereitstellt:
- Applikations-Laufzeitumgebung (Environments, Kubernetes-Cluster)
- DevSecOps (Vulnerability Scans, Lizenz-Scanning, Container Scanning)
- Zugang und Identität (zentralisierte Authentifizierung über alle Tools)
- Monitoring und Observability (vorkonfigurierte Dashboards und Alerting)
- CI/CD-Pipelines (standardisiert, sofort einsatzbereit)
Die Produkt-Teams bauen, betreiben und warten ihre Produkte auf dieser Plattform. Sie besitzen weiterhin ihre CI/CD-Pipelines, überwachen ihre Applikationen und reagieren auf Incidents. Das Plattform-Team befähigt sie nur, DevOps zu machen, ohne das Rad neu zu erfinden.
Das ist kein neues Silo. Die Plattform ist ein Produkt, das Teams nutzen wollen. Das Plattform-Team schafft Wert für die Teams. Die Produkt-Teams schaffen Wert für die Kunden.
Die digitale Fabrik: Ein ganzheitlicher Ansatz#
Eine digitale Fabrik bringt alles zusammen. Stellt euch ein Unternehmen vor, das Drohnen baut (oder ersetzt “Drohne” durch euer Softwareprodukt):
Vorstandsebene: Das Management hat eine Vision (Marktanteil erhöhen) und ein Portfolio von Initiativen. Sie priorisieren: eine Drohne bauen, die schwere Lasten tragen kann.
Produktebene: Produktmanager nehmen dieses Epic und entwerfen Features: grösserer Akku, aktualisierte Software, neuer Motor.
Teamebene: Bestehende Teams arbeiten an Software- und Akku-Änderungen. Für den neuen Motor braucht es ein neues Team. Das Plattform-Team stellt eine standardisierte CI/CD-Pipeline bereit, damit das neue Team ohne Verzögerung starten kann.
Lieferung: Alle Teile werden zusammengebaut und an den Kunden geliefert. Der Kunde ist zufrieden.
Feedback-Schleife: Telemetriedaten von den Drohnen fliessen zurück an die Teams zur kontinuierlichen Verbesserung und an den Vorstand für strategische Entscheidungen.
Das ist eine digitale Fabrik. Lean Portfolio Management an der Spitze verbindet Strategie mit Ausführung. Das Plattform-Team am Fundament ermöglicht DevOps. Produkt-Teams in der Mitte liefern Wert.
Grossartige Produkte erfordern eine ganzheitliche Sicht#
Eine digitale Fabrik zu bauen, dreht sich nicht nur um DevOps und Platform Engineering. Man braucht auch:
- Skalierbare Architektur mit einem modularen, API-getriebenen Ansatz
- Datenmanagement um aus Telemetrie- und Geschäftsdaten Sinn zu machen
- Kundenerlebnis mit einem End-to-End-Fokus auf die Customer Journey
- Agile Programmlieferung zur Verwaltung von Backlogs, Abhängigkeiten und Team-Abstimmung
- Produktmanagement um Strategie mit Ausführung zu verbinden
Kernaussagen#
- Von Projekten zu Produkten wechseln. Auf Outcomes statt Outputs fokussieren. Den Kunden ins Zentrum stellen.
- DevOps ist ein ganzheitlicher Ansatz, der Menschen, Prozesse und Technologie über den Wertstrom zusammenbringt.
- Platform Engineering reduziert die kognitive Belastung und ermöglicht Produkt-Teams, DevOps im grossen Massstab durch Standardisierung und Self-Service zu betreiben.
- Digitale Fabriken sind das ganzheitliche Modell für industrialisierte Softwareentwicklung: Lean Portfolio Management an der Spitze, eine Plattform als Fundament und befähigte Produkt-Teams in der Mitte.
- Die Feedback-Schleife hört nie auf. Von Telemetrie zurück zu den Teams, von Geschäftsmetriken zurück zum Vorstand: datengetriebene Entscheidungsfindung hält die Fabrik am Laufen.
- Wir treten in das Zeitalter der industrialisierten Softwareentwicklung ein. Platform Engineering ist das Fundament der digitalen Fabrik, und die digitale Fabrik ist der Weg, wie wir kontinuierlich Wert liefern.
