Im Jahr 2024 stehen alle, die mit Data/Analytics zu tun haben, vor neuen Herausforderungen: Sie müssen dazu beitragen, das Beste aus den KI-Technologien herauszuholen. Die Ergebnisse von KI-Abfragen werden nur so gut sein wie die Daten, auf die sie sich stützen.
Forrester Research wagt fünf Vorhersagen für Daten und Analytics im neuen Jahr. Sie umfassen Themen wie Datenplattformen, Qualität und Trainings. "Wenn GenAI der Hauptdarsteller in dem Musical 'Business Technology 2024' ist, dann sind die Daten- und Analytics-Teams die Bühnenmanager", schreiben die Analysten.
Im KI-Theater sind jetzt die Bühnenmanager gefragt
Laut der Forrester-Umfrage Artificial Intelligence Pulse Survey (Zugang nur für Kunden) vom Juli 2023 geben 89 Prozent der KI-Entscheider an, dass ihre Unternehmen den Einsatz von GenAI ausweiten oder zumindest damit experimentieren wollen. Doch bevor die neue Technologie Werte für Mitarbeiter, Kunden oder andere Stakeholder bringen kann, müssen Prozesse, Plattformen und auch die Menschen entsprechend vorbereitet werden - die Aufgabe der Bühnenmanager.
Sie werden Datenplattformen und Verfahren zur Verbesserung der Datenqualität einführen. Es gilt, mit Large Language Models (LLMs) umzugehen, unstrukturierte Daten für Analysen bereitzustellen sowie die Datenkompetenz im Unternehmen zu verbessern, damit die Beschäftigten mit KI-Technologien Mehrwerte generieren können.
Forrester wagt die folgenden fünf Prognosen:
In jeder achten Geschäftsführung wird 2024 die Position des Chief Artificial Intelligence Officers (CAIOs) zu finden sein. Da Unternehmen dem Produktivitätsversprechen der KI hinterherjagen werden, dürfte dieser oder ein ähnlicher Titel allgegenwärtig sein. Von den Unternehmen, die schon jetzt über eine klar definierte KI-Strategie verfügen, sagen zwölf Prozent, dass sie einen CAIO mit der Verantwortung für die KI-Strategie betraut haben. Nur in absoluten Ausnahmefällen, nämlich in zwei Prozent der befragten Betriebe, wird dem Chief Data Officer (CDO) diese Aufgabe zugeteilt.Die Forrester-Analysten glauben aber nicht, dass die Datenchefs nun aus den Organigrammen verschwinden werden. Auch in Zukunft seien Daten die entscheidende Ressource, die in zu vielen Firmen wegen Qualitäts-, Governance- und Zugangsproblemen noch immer zu wenig genutzt werde. Künftig müsse es beide Funktionen geben, den KI- und den Datenmanager. Um Daten in wertvolles Wissen zu verwandeln, müssten eben beide an einem Strang ziehen.
Die Nachfrage nach Vektordatenbanken zur Unterstützung von GenAI-Initiativen wird um 200 Prozent zunehmen. Mit steigenden KI-Investitionen werden immer mehr Unternehmen Vektordatenbanken einsetzen, um Texte, Bilder und Dokumente schnell auffinden und verarbeiten zu können. Konventionelle Datenbanken benötigen die exakte Übereinstimmung von Datenmerkmalen, um Abfragen zu ermöglichen. Vektordatenbanken dagegen können innerhalb eines bestimmten Kontextes auch aufspüren die Ähnlichkeiten aufweisen oder relevant sein könnten - eine zentrale Anforderung für GenAI.
Durch die Vektordarstellung können LLMs große Datensätze schnell verarbeiten und die für komplexe Analysen erforderliche Leistung und Skalierbarkeit aufbringen. In den nächsten zwölf Monaten soll die Nutzung von Vektordatenbanken in Produktivumgebungen laut Forrester eine Durchdringung von 18 Prozent erreichen, weitere 45 Prozent der Betriebe würden zumindest damit experimentieren. Die Analysten empfehlen den Unternehmen, Anwendungsfälle zu identifizieren, in denen Ähnlichkeitsvergleiche einen Mehrwert schaffen können und dann mit der Vektorisierung dieser Datenquellen zu beginnen.
Richtige Antworten oder zusammenhängender Unsinn?
60 Prozent der Mitarbeiterinnen und Mitarbeiter werden ein Prompt-Engineering-Training absolvieren. Die Eingabe des richtigen Prompts in ein GenAI-Tool entscheidet darüber, ob das Werkzeug schnelle und richtige Antworten ausgibt oder "kohärenten Unsinn", schreibt Forrester. Momentan geben nur 33 Prozent der Daten- und Analytics-Experten an, dass ihre Unternehmen Schulungen dazu anbieten, wie sich am besten über Prompts mit Chatbots, physischen Robotern oder intelligenten Agenten kommunizieren lässt. Da KI für die Produktivität aller Mitarbeiter von zentraler Bedeutung sein werde, müssten die Teams ihre Qualifikationslücken schnell schließen. Forrester empfiehlt, diese wichtigen Trainings nicht den HR-Abteilungen zu überlassen. Hier sei die IT-Organisation selbst in der Pflicht. Sie müsse "Bring-your-own-AI-Richtlinien" sowie unternehmensweite Schulungsprogramme für Mitarbeitende entwickeln (lesen Sie auch:
Prompt Engineering - Dumme Fragen gibt es doch!)
Unternehmen werden Fortschritte bei der Datenqualität erreichen und die Performance ihrer KI- und ML-Modelle um 20 Prozent verbessern. Würden Daten zweifelhafter Qualität für KI-Aufgaben verwendet, wäre das laut Forrester ein ultimatives Beispiel für das altbekannte Garbage-in/Garbage-out. Die Leistung von Modellen könne nur an der Qualität und Genauigkeit der Ergebnisse gemessen werden, und die hänge maßgeblich von der Qualität der Trainingsdaten ab, so die Analysten.
Bei einer guten Datenqualität könnten Modelle für maschinelles Lernen die zugrundeliegende Muster genau erkennen, was der Genauigkeit von Simulationen und Vorhersagen entgegenkomme. Betriebe, die Wert auf eine hohe Datenqualität legten, könnten damit die Zuverlässigkeit ihrer Modelle verbessern und das Risiko verzerrter oder fehlerhafter Schlussfolgerungen senken. "Legen Sie die Verantwortlichkeiten für Datenqualität in Ihren Datenentwicklungs- und Analytics-Teams genau fest und definieren Sie klare Maßnahmen zur Verbesserung", raten die Marktforscher.
Auf den Umgang mit unstrukturierten Daten wird es ankommen
Die Menge der von Unternehmen verwalteten unstrukturierten Daten wird sich 2024 verdoppeln. Rund 80 Prozent der weltweiten Daten liegen derzeit unstrukturiert vor und werden nicht kontrolliert. Daten- und Analytics-Entscheider geben aber an, dass gegenwärtig nur ein gutes Viertel der in ihren Unternehmen verwalteten Daten unstrukturiert seien. Mit GenAI wird sich dieser Anteil verdoppeln, da viele Unternehmen Konversations-Bots für Kunden und Mitarbeiter einführen wollen.
Unternehmen werden sich also bemühen, die Flut an unstrukturierten Daten zu kontrollieren, zu analysieren und sinnvoll zu nutzen. Dieser Trend wird sich auf die Daten-Pipelines auswirken: Vier von fünf der im nächsten Jahr erstellten Data Pipes werden laut Forrester dazu dienen, unstrukturierte Daten aufzunehmen, zu verarbeiten und zu speichern.Unternehmen werden ihre Dateninfrastruktur ausbauen und auf Skalierung ausrichten müssen. Angesichts der explosionsartigen Zunahme unstrukturierter und halbstrukturierter Daten müssen sie einheitliche Plattformen wie Lakehouses oder Data Fabrics nutzen, um multistrukturierte Datenanalysen zu ermöglichen und breitere Anwendungsfälle und Workloads zu unterstützen. (hv)