DATA MINING
Das neue Öl der Weltwirtschaft

Auf den Straßen von Bengaluru herrscht das analoge Leben, ein wilder Strom von Bussen, Taxis, Motorrädern und Kühen. Dazu ein quirliger Mix von Menschen: mal im modernen Business-Outfit, dann wieder im traditionellen Sari oder in strenger Schuluniform. Die Bürgersteige sind ein einziger Dienstleistungssektor: Schuhputzer, Fahrradreparateure, Blumenhändler, Garköche. Aber auch sie benutzen Smartphones, um zu bestellen oder Lieferungen zu verfolgen, selbst von einer Straßenseite zur anderen. Denn die südindische Stadt, früher als Bangalore bekannt, ist ein Knotenpunkt des weltumspannenden Daten-Highways.

BIG DATA

Der Begriff bezeichnet primär die Verarbeitung von großen, komplexen und sich schnell verändernden Datenmengen, die sich nur durch miteinander verbundene Hochleistungsrechner bewältigen lässt. Die gesammelten Daten können aus nahezu allen Quellen stammen. Das weltweite Datenvolumen verdoppelt sich etwa alle zwei Jahre. Sri Krishnan, Vizepräsident von Bosch Engineering and Business Solutions in Indien, setzt Big Data mit einer „Lawine“ gleich, im positiven Sinn: „Die Datenanalyse soll sich tief in der DNA unseres Unternehmens verwurzeln. Immer mehr Daten bilden die Grundlage für eine immer bessere Analyse.“ Diese nutzt Bosch: Im ersten Schritt werden aus Dingen und Prozessen Daten abgeleitet. Im zweiten Schritt aus Daten Dienste.

DATEN-METROPOLE BENGALURU

Die Hauptstadt des Bundesstaates Karnataka ist mit annährend zehn Millionen Einwohnern die drittgrößte Stadt Indiens. Die „Garten- und Tempelstadt“ hat sich in den vergangenen Jahren zu einem der wichtigsten IT-Zentren des Landes entwickelt und gilt weltweit als eine der Metropolen von Big Data. Neben der Offenheit Bengalurus liegt der Grund dafür in der hohen Anzahl an gut ausgebildeten einheimischen IT-Fachleuten. Der Frauenanteil liegt bei 30 Prozent. Der Ehrgeiz Indiens ist es, sich von einem günstigen Produktionsstandort zu einem führenden Anbieter von komplexen, qualitativ hochwertigen Fertigungs- und Dienstleistungen zu wandeln. Big Data wird inzwischen an allen wichtigen Hochschulen gelehrt, auch dem örtlichen Indian Institute of Science. Dort befindet sich das Robert Bosch Centre for Cyber-Physical Systems.

DATA MINING

Dabei handelt es sich um die systematische Anwendung statistischer Methoden auf Bestände von Big Data. Die leistungsstarken Algorithmen an sich sind bekannt. Die neue Herausforderung liegt darin, sie effizient über ganze Rechnerverbünde und Tausende von Prozessoren hinweg anzuwenden, um der Datenflut aus dem Internet der Dinge Herr zu werden. „Heute ist alles miteinander vernetzt“, sagt die indische Analytikerin Lavanya Uppala. Bei der praktischen Anwendung von Data Mining kommt es für sie und ihr Team auf die „V-Formel“ an: Variety, Velocity, Volume, Vicinity, Visualization (Vielfalt, Geschwindigkeit, Volumen, Umgebung, Darstellung).

Linie

Im Jahr 2011 analysierte Bosch Engineering and Business Solutions in Indien die digitalen Trends auf Möglichkeiten für die Diversifizierung der Geschäftsaktivitäten. Dabei identifizierten Sri Krishnan und sein Team das Thema Data Mining als besonders aussichtsreich. Für ein Land, das die Null in die Welt der Mathematik eingeführt hat, ist das frühzeitige Aufspringen auf diesen technologischen Trend nur konsequent und folgerichtig . Aus großen Datenmengen die richtigen Schlüsse zu ziehen, klang beinahe simpel, entpuppte sich aber als eine hochkomplexe Angelegenheit. „Wir haben es nicht bei der Theorie belassen, sondern die Sache gleich in die Hand genommen und zum Geschäftsmodell ausgebaut“, sagt Sri Krishnan. Volle Rückendeckung gab es von Volkmar Denner, dem Vorsitzenden der Bosch-Geschäftsführung – auch mit Big Data bahnt sich Bosch den Weg in die vernetzte Welt.

Denn Daten sind das neue Öl der Weltwirtschaft. Als die Inder die ersten Schritte auf diesem Gebiet machten, bohrte das Bosch Research and Technology Center in Kalifornien bereits auf dem neuen Feld. Anfang 2014 hat Bosch deshalb aus den Aktivitäten in Palo Alto und Bengaluru ein zentrales Team gebildet, das zusammen mit Fachexperten in den jeweiligen Geschäftsbereichen Data-Mining-Lösungen in die Praxis umsetzt. Hauke Schmidt als Leiter des globalen Teams in Palo Alto und Lavanya Uppala in Bengaluru konferieren fast täglich, sie führen das Team wie ein Start-up. 

Hauke Schmidt (links), Leiter des globalen Data-Mining-Teams mit Mitarbeitern in Palo Alto

Inzwischen arbeiten hier 40 Data Scientists für Bosch-Bereiche in der ganzen Welt und beschleunigen damit den Wissensaufbau. Bosch wendet Data Mining heute nicht nur als Leitanwender in internen Projekten an, sondern bietet als Leitanbieter auch Lösungen für externe Kunden. Bei Bosch wird Big Data gelebt, Analyse und Algorithmen dienen dem Kerngeschäft. Die Masse von Informationen ist die Basis für die Qualität der Informationen. Die Fähigkeit, aus großen Datenmengen neues Wissen und neues Geschäft zu generieren, ist eine Schlüsselkompetenz für die Zukunft. Weshalb sich neben der Anwendung in der Praxis auf dem Forschungscampus in Renningen und im kalifornischen Silicon Valley Expertenteams zusätzlich auch wissenschaftlich mit der gezielten Entwicklung von neuen Methoden der Auswertung des zunehmenden Datenvolumens beschäftigen.

Lavanya Uppala und ihr Data-Mining-Team treffen sich regelmäßig, um sich auszutauschen.

Algorithmen führen zu besseren Produkten: Mitarbeiter des Data-Mining-Teams in Indien auf der Suche nach der richtigen Formel für mehr Kundennutzen. Die abgebildete „Group-Lasso-Formel“ der Bosch Data Mining Group für Big-Data-Anwendungen in der Fertigung hat zu optimierten Testläufen im Bosch-Rexroth-Werk in Homburg geführt – und damit zu verbesserten Ventilen für Landmaschinen.

Sri Krishnan V (Zweiter von links) forcierte schon früh das Thema Big Data für den Standort Bengaluru; heute beschäftigen sich 50 Daten-Expertinnen und -Experten mit dem Zukunftsthema.

Der erste Testlauf von Data Mining in der Bosch-Produktion in Indien brachte sofort eine deutliche Verbesserung der Abläufe, ebenso wie das Pilotprojekt auf dem freien Markt bei einer großen Eisenbahngesellschaft, um den elektronischen Ticketbetrug in den Griff zu bekommen. „Aus jedem internen Projekt generieren wir neues Wissen für Kundenaufträge – und umgekehrt. Das befruchtet sich gegenseitig“, weiß Lavanya Uppala. Ein Lieblingsbeispiel der IT-Expertin stammt aus dem Bereich der BSH Hausgeräte GmbH: Wenn die Fehlermeldung eines Kunden eingeht, lässt sich dank der Big-Data-Erkenntnisse bereits nach sehr kurzer Zeit mit hoher Wahrscheinlichkeit sagen, was die Ursache ist – und welches Ersatzteil benötigt wird. Dieser Ansatz zum Entwickeln schnellerer Lösungen soll bald auch Autofahrern zugutekommen, die den Bosch Car Service nutzen.

Zunehmend werden Daten aus dem ganzen Lebenszyklus eines Produkts gewonnen – von der Entwicklung über die Herstellung und Auslieferung bis zum Gebrauch und Kundendienst: „Mit der Analyse unseres Datenmaterials können wir Vorhersagen über den optimalen Einsatz aller nötigen Ressourcen treffen und schaffen so einen großen Mehrwert. Das entspricht unserem Leitmotiv ,Invented for life‘“, sagt Hauke Schmidt. Ein überzeugender Beweis für diese These gelang auch im Geschäftsbereich Automotive Aftermarket bei einem internationalen Automobilhersteller. Nicht nur, dass potenzielle Garantiefälle früher erkannt werden konnten, auch die Diagnosekompetenz der Werkstätten des Automobilherstellers wurde verbessert. Für Lavanya Uppala ein perfektes Zusammenspiel: „Die Diagnose kam vom Team im Bereich Automotive Aftermarket, die Analyse von uns. Zusammen konnten wir schnell eine Problemlösung bieten.“ 

Der Weg zu Data Scientist Rama Mohan D in Bengaluru führt an einem Notfall-Kasten vorbei; hinter Glas befinden sich Äxte und Helme. Besser lässt sich das Thema Data Mining kaum visualisieren – es ist tatsächlich ein Freilegen, Fördern und Nutzen in dem stetig wachsenden Datenberg. Ein einzelner Satz Daten, der von den Analysten benutzt wird, besteht beispielsweise aus 1 000 Spalten und 20 Millionen Reihen. Die Datenmengen wachsen dabei ständig, in manchen Projekten um drei bis vier Terabytes pro Jahr.

Die Formel, die der Bosch-Mitarbeiter so lässig an eine Magnetwand schreibt, bildet am Ende aus scheinbar unübersichtlichen Datenmengen verschiedener Quellen die Grundlage für eine Problemlösung und ein neues Geschäftsmodell. Die Daten, ob sie aus der industriellen Vernetzung, aus sozialen Medien oder von handschriftlichen Protokollen stammen, müssen gesäubert, geordnet, validiert und präpariert werden. Der Mensch wird bei Big Data immer wichtig bleiben, nicht nur als Programmierer. Er muss erst die richtigen Fragen stellen, um die nötigen Daten zu erhalten, und die Analyse dann mit den Erfahrungen und Erwartungen der Praxis abgleichen. „Vor allem muss man nicht nur die Daten verstehen, sondern auch den Kunden“, sagt Mohan D, „nur so wird dieser später die Daten richtig nutzen können.“ Und erst dann geht die Formel von Big Data auf.