Sie sind hier: Startseite » Markt » Hintergrund

Generative KI-Inferenz im Fokus


Diese vier Trends werden die IT-Branche 2025 prägen
Unternehmen setzen auf geschützte Umgebungen wie private Clouds, On-Premises-Rechenzentren oder privat gehostete Instanzen


Die fortschreitende Entwicklung der IT-Landschaft bringt neue Trends mit sich, die 2025 die Technologienutzung in Unternehmen grundlegend verändern werden. Themen wie generative KI und Datensouveränität werden Branchen dazu zwingen, ihre Strategien anzupassen und sich auf neue Realitäten einzustellen. Jeff Wittich, Chief Product Officer bei Ampere Computing, hat vier Prognosen für diese Zukunft formuliert.

1. Vom Experiment zur Praxis: Generative KI-Inferenz im Fokus
Generative KI wandelt sich von einem experimentellen Werkzeug zu einer vollständig integrierten Technologie mit erheblichem geschäftlichem Mehrwert. Während im letzten Jahr Chatbots, die auf öffentlichen Daten basieren, im Fokus standen, liegt die Zukunft in der Anwendung generativer KI auf privaten, sicheren Datensätzen. Dadurch entstehen noch wertvollere Einsatzmöglichkeiten. Besonders Branchen wie das Finanzwesen, Versicherungen und E-Commerce sind bereit, diese Technologien zu nutzen, um aus proprietären Daten wertvolle Erkenntnisse zu gewinnen.

Flexibilität in der Bereitstellung wird künftig entscheidend sein. KI-Workloads erstrecken sich zunehmend auf verschiedene Umgebungen – von On-Premises über Edge bis hin zu isolierten Hosting-Einrichtungen. Latenzkritische Anwendungen erfordern dabei eine Infrastruktur in der Nähe der Nutzer, die in bestehenden Rechenzentren und PoPs bereitgestellt wird. Gleichzeitig ist Inferenz kein isolierter Workload mehr: Unterstützende Prozesse wie Retrieval-Augmented Generation (RAG) und App-Integration benötigen robuste, vielseitige Rechenressourcen neben KI-spezifischen Ressourcen – mit einem klaren Fokus auf Effizienz und Skalierbarkeit.

2. Energie der Zukunft: Wachstum erneuerbarer Energien und Effizienzsteigerung
Mit zunehmender Rechenlast steigt auch der Energiebedarf. Überlastete Netze und regionale Engpässe zwingen Unternehmen, nach neuen Lösungen zu suchen. Erneuerbare Energiequellen wie Solar-, Wind- und Geothermie gewinnen dabei an Bedeutung, insbesondere durch den Aufbau kleinerer, regional verteilter Rechenzentren. Solche Projekte erfordern jedoch Zeit – Zeit, die oft nicht ausreicht, um den dringenden Bedarf an IT-Infrastruktur zu decken.

Um den Einsatz fossiler Energiequellen zu vermeiden oder deren Lebensdauer zu verlängern, wird die Optimierung von Hardware entscheidend sein. Der Ersatz älterer, energieintensiver Systeme durch moderne, effiziente Prozessoren kann den Energieverbrauch deutlich reduzieren und bestehende Infrastrukturen nachhaltiger gestalten. Dieser Effizienzschub ist unverzichtbar, um den wachsenden Energiebedarf mit einem verantwortungsvollen Umgang mit der Umwelt in Einklang zu bringen.

3. Verdichtung im Rechenzentrum: Maximale Nutzung von Racks
Mit der rasch steigenden Nachfrage nach KI-Rechenleistung rückt die Effizienz zunehmend auch auf der Skalierungsebene von Racks und Rechenzentren in den Fokus. Unternehmen möchten die Leistung pro Rack maximieren, indem sie vorhandene Ressourcen optimal nutzen. Während ältere Systeme häufig ineffizient arbeiteten, sind moderne Architekturen darauf ausgelegt, Ressourcenauslastung zu verbessern, Verschwendung zu minimieren und eine gleichmäßige Leistung ohne die Nachteile von Unvorhersehbarkeit sicherzustellen.

Verdichtung betrifft jedoch nicht nur KI-Workloads. Besonders die Inferenz erfordert eine Infrastruktur, die gemischte Umgebungen unterstützt und auch allgemeine Rechenleistung berücksichtigt. Effizientere Virtualisierungs- und Container-Technologien sowie stromsparende Programmieransätze ermöglichen Softwareentwicklern eine präzisere Ressourcenzuweisung. Damit können Unternehmen die Auslastungsraten steigern, ohne die Leistung zu beeinträchtigen.

4. Souveränität und Sicherheit: Der Aufstieg der KI für Unternehmen
Datensouveränität und Sicherheit werden 2025 entscheidend die KI-Strategien prägen. Unternehmen erkennen den Wert ihrer proprietären Datensätze zunehmend als Wettbewerbsvorteil und setzen auf geschützte Umgebungen wie private Clouds, On-Premises-Rechenzentren oder privat gehostete Instanzen, anstatt ausschließlich auf öffentliche Hyperscale Clouds.

Die wachsenden Risiken von Datenlecks und Manipulation von KI-Algorithmen verdeutlichen die Notwendigkeit sicherer, isolierter Infrastrukturen. Im Wettbewerb um KI-gestützte Innovation wird der Schutz geistigen Eigentums und sensibler Informationen zu einem zentralen Erfolgsfaktor. Dieser Trend treibt die Nutzung unternehmenseigener Rechenressourcen voran und fördert ein dezentrales, sichereres KI-Ökosystem. Gleichzeitig führt die Kombination aus Sicherheitsanforderungen und der Notwendigkeit, Rechenressourcen näher an die Nutzer zu bringen, zu einer verstärkten Ausrichtung der Infrastruktur auf Edge Computing. (Ampere: ra)

eingetragen: 11.12.24
Newsletterlauf: 24.02.25

Ampere: Kontakt und Steckbrief

Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.


Kostenloser PMK-Verlags-Newsletter
Ihr PMK-Verlags-Newsletter hier >>>>>>


Meldungen: Hintergrund

  • Datenschutzstrategien für hybride IT

    Eine von Arcserve beauftragte unabhängige Befragung unter IT-Führungskräften ergab, dass 80 Prozent schon einmal von Ransomware betroffen waren. Während 82 Prozent der Betroffenen angaben, dass sie den Schaden innerhalb von 48 Stunden beheben konnten, war dazu knapp ein Fünftel nicht in der Lage. Problematisch ist auch, dass bis zu 30 Prozent der Daten bei einem erfolgreichen Ransomware-Angriff nicht wiederhergestellt werden konnten.

  • Cloud-basierte Monetarisierung löst Probleme

    Mit ihrer jahrzehntelangen Erfahrung im Management wiederkehrender Kundenbeziehungen sind Telekommunikationsunternehmen (Telcos) attraktive Partner in der Abonnement-Wirtschaft. Ihr großer Kundenstamm, der sich durch historisch niedrige Abwanderungsraten auszeichnet, bietet eine solide Grundlage, um vom wachsenden Abonnementmarkt zu profitieren.

  • Fokus auf Datenschutz & Compliance

    IT-Ausgaben in der Finanzbranche werden 2025 auf über 58 Milliarden USD steigen, während Technologien wie generative Künstliche Intelligenz (GenAI) Arbeitsabläufe, Datenmanagement und Kundeninteraktionen revolutionieren. Gleichzeitig wird der sich vollziehende Generationswechsel bei den Anlegern endgültig ein neues Level an Digitalisierung fordern. Fünf zentrale Trends werden diesen Wandel prägen: die Optimierung von Kundenerlebnissen, die Einführung modularer Architekturen, datengetriebene Innovationen, die Konvergenz von Branchen und ein verstärkter Fokus auf Datenschutz und Compliance.

  • Optimierung der Cloud-Kosten oberste Priorität

    Das Jahr 2024 war das "Jahr der generativen KI", was zu einer raschen Ausweitung der Datenerzeugung, -verwaltung und -konsolidierung führte. Dieser Anstieg zeigt keine Anzeichen einer Verlangsamung. Darüber hinaus kam es 2024 zu den ersten großen Angriffen auf die Lieferkette auf globaler Ebene, angeführt von CrowdStrike, die Unternehmen dazu zwangen, die Cybersicherheit auf allen Ebenen zu überdenken.

  • Hybrid-Cloud als ausgewogenere Lösung

    Durch den rasanten technologischen Wandel sind datengesteuerte Initiativen in modernen Geschäftsstrategien wichtiger denn je. Im Jahr 2025 stehen die Unternehmen jedoch vor neuen Herausforderungen, die ihre Datenstrategien, ihre Bereitschaft für Künstliche Intelligenz (KI) und ihr allgemeines Vertrauen in Daten auf die Probe stellen werden. Insgesamt ist die Bereitschaft für KI in internationalen Unternehmen sehr gering (17 Prozent).

  • Hybride Ansätze statt Cloud Only

    Wie sieht die Perspektive für das Dokumentenmanagement im Jahr 2025 aus? Die Zukunft ist digital, so viel ist sicher. Mit der E-Rechnungspflicht, künstlicher Intelligenz und Cloud-Technologien stehen grundlegende Veränderungen bevor. Der DMS-Experte easy software AG hat die relevantesten Branchentrends zusammengefasst.

  • Migration in die Cloud

    Die Versicherungsbranche befindet sich in einem rasanten Wandel. Fadata, Anbieterin von Softwarelösungen für die Versicherungsbranche, wirft einen Blick auf das Jahr 2025 und beleuchtet die wichtigsten Entwicklungen und Trends in den Bereichen Versicherung und digitale Transformation. Die wichtigsten Trends, die laut Fadata die Zukunft der Versicherung prägen werden, sind Internalisierung, Prävention, Cloud-Migration, Embedded Insurance, Ökosystem-Entwicklung und Talent-Transformation. Diese sechs Trends treiben transformative Veränderungen in der gesamten Branche voran, wobei die Versicherer innovative Ansätze verfolgen, um Kundenbedürfnisse, betriebliche Effizienz, Sicherheit, Risiken und Marktanforderungen zu adressieren. Versicherer werden im Jahr 2025 ihre wichtigsten Abläufe zunehmend internalisieren. Sie wollen ihre Abläufe straffen, Kosten senken und die Datensicherheit erhöhen. All dies kann durch die verbesserte Steuerung der Prozesse erreicht werden, die eine Internalisierung ermöglicht.

  • NIS2 wird Bewusstsein für CPS-Sicherheit stärken

    Und wieder liegt ein herausforderndes Jahr hinter uns. Die geopolitische Lage insbesondere in der Ukraine und im Nahen Osten ist weiterhin angespannt, während die innenpolitische Situation in den zwei stärksten Volkswirtschaften Europas derzeit ungewiss erscheint. All dies hat auch Auswirkungen auf die Cybersecurity. Schon längst sollten wir dabei nicht nur an IT-Sicherheit denken, sondern auch an IoT und Betriebstechnik (OT), also an cyber-physische Systeme (CPS).

  • Generative KI mit bemerkenswerten Fortschritte

    Generative Künstliche Intelligenz (generative KI) hat in den letzten Jahren bemerkenswerte Fortschritte erzielt. Dies ist auch auf die steigende Zahl von Entwicklern zurückzuführen, die über ein immer umfangreicheres Know-how verfügen. Doch eine Frage brennt Unternehmen wie Investoren unter den Nägeln: Wann lässt sich mithilfe von KI die betriebliche Effizienz auf das nächste Level heben?

  • Datendschungel: Herausforderung & Chance

    Das Jahr 2024 markierte einen Wendepunkt für die generative KI. Chat GPT und andere Akteure haben sich zu einigen der am schnellsten wachsenden Plattformen der letzten Zeit entwickelt. Doch inmitten dieser aufregenden KI-Revolution wird ein entscheidender Aspekt oft übersehen: das Datenmanagement. Ein starkes und durchdachtes Datenmanagement könnte der Schlüssel sein, um das volle Potenzial von KI-Lösungen zu entfalten.

Wir verwenden Cookies um unsere Website zu optimieren und Ihnen das bestmögliche Online-Erlebnis zu bieten. Mit dem Klick auf "Alle akzeptieren" erklären Sie sich damit einverstanden. Erweiterte Einstellungen