Sie sind hier: Startseite » Markt » Hintergrund

Generative KI-Inferenz im Fokus


Diese vier Trends werden die IT-Branche 2025 prägen
Unternehmen setzen auf geschützte Umgebungen wie private Clouds, On-Premises-Rechenzentren oder privat gehostete Instanzen


Die fortschreitende Entwicklung der IT-Landschaft bringt neue Trends mit sich, die 2025 die Technologienutzung in Unternehmen grundlegend verändern werden. Themen wie generative KI und Datensouveränität werden Branchen dazu zwingen, ihre Strategien anzupassen und sich auf neue Realitäten einzustellen. Jeff Wittich, Chief Product Officer bei Ampere Computing, hat vier Prognosen für diese Zukunft formuliert.

1. Vom Experiment zur Praxis: Generative KI-Inferenz im Fokus
Generative KI wandelt sich von einem experimentellen Werkzeug zu einer vollständig integrierten Technologie mit erheblichem geschäftlichem Mehrwert. Während im letzten Jahr Chatbots, die auf öffentlichen Daten basieren, im Fokus standen, liegt die Zukunft in der Anwendung generativer KI auf privaten, sicheren Datensätzen. Dadurch entstehen noch wertvollere Einsatzmöglichkeiten. Besonders Branchen wie das Finanzwesen, Versicherungen und E-Commerce sind bereit, diese Technologien zu nutzen, um aus proprietären Daten wertvolle Erkenntnisse zu gewinnen.

Flexibilität in der Bereitstellung wird künftig entscheidend sein. KI-Workloads erstrecken sich zunehmend auf verschiedene Umgebungen – von On-Premises über Edge bis hin zu isolierten Hosting-Einrichtungen. Latenzkritische Anwendungen erfordern dabei eine Infrastruktur in der Nähe der Nutzer, die in bestehenden Rechenzentren und PoPs bereitgestellt wird. Gleichzeitig ist Inferenz kein isolierter Workload mehr: Unterstützende Prozesse wie Retrieval-Augmented Generation (RAG) und App-Integration benötigen robuste, vielseitige Rechenressourcen neben KI-spezifischen Ressourcen – mit einem klaren Fokus auf Effizienz und Skalierbarkeit.

2. Energie der Zukunft: Wachstum erneuerbarer Energien und Effizienzsteigerung
Mit zunehmender Rechenlast steigt auch der Energiebedarf. Überlastete Netze und regionale Engpässe zwingen Unternehmen, nach neuen Lösungen zu suchen. Erneuerbare Energiequellen wie Solar-, Wind- und Geothermie gewinnen dabei an Bedeutung, insbesondere durch den Aufbau kleinerer, regional verteilter Rechenzentren. Solche Projekte erfordern jedoch Zeit – Zeit, die oft nicht ausreicht, um den dringenden Bedarf an IT-Infrastruktur zu decken.

Um den Einsatz fossiler Energiequellen zu vermeiden oder deren Lebensdauer zu verlängern, wird die Optimierung von Hardware entscheidend sein. Der Ersatz älterer, energieintensiver Systeme durch moderne, effiziente Prozessoren kann den Energieverbrauch deutlich reduzieren und bestehende Infrastrukturen nachhaltiger gestalten. Dieser Effizienzschub ist unverzichtbar, um den wachsenden Energiebedarf mit einem verantwortungsvollen Umgang mit der Umwelt in Einklang zu bringen.

3. Verdichtung im Rechenzentrum: Maximale Nutzung von Racks
Mit der rasch steigenden Nachfrage nach KI-Rechenleistung rückt die Effizienz zunehmend auch auf der Skalierungsebene von Racks und Rechenzentren in den Fokus. Unternehmen möchten die Leistung pro Rack maximieren, indem sie vorhandene Ressourcen optimal nutzen. Während ältere Systeme häufig ineffizient arbeiteten, sind moderne Architekturen darauf ausgelegt, Ressourcenauslastung zu verbessern, Verschwendung zu minimieren und eine gleichmäßige Leistung ohne die Nachteile von Unvorhersehbarkeit sicherzustellen.

Verdichtung betrifft jedoch nicht nur KI-Workloads. Besonders die Inferenz erfordert eine Infrastruktur, die gemischte Umgebungen unterstützt und auch allgemeine Rechenleistung berücksichtigt. Effizientere Virtualisierungs- und Container-Technologien sowie stromsparende Programmieransätze ermöglichen Softwareentwicklern eine präzisere Ressourcenzuweisung. Damit können Unternehmen die Auslastungsraten steigern, ohne die Leistung zu beeinträchtigen.

4. Souveränität und Sicherheit: Der Aufstieg der KI für Unternehmen
Datensouveränität und Sicherheit werden 2025 entscheidend die KI-Strategien prägen. Unternehmen erkennen den Wert ihrer proprietären Datensätze zunehmend als Wettbewerbsvorteil und setzen auf geschützte Umgebungen wie private Clouds, On-Premises-Rechenzentren oder privat gehostete Instanzen, anstatt ausschließlich auf öffentliche Hyperscale Clouds.

Die wachsenden Risiken von Datenlecks und Manipulation von KI-Algorithmen verdeutlichen die Notwendigkeit sicherer, isolierter Infrastrukturen. Im Wettbewerb um KI-gestützte Innovation wird der Schutz geistigen Eigentums und sensibler Informationen zu einem zentralen Erfolgsfaktor. Dieser Trend treibt die Nutzung unternehmenseigener Rechenressourcen voran und fördert ein dezentrales, sichereres KI-Ökosystem. Gleichzeitig führt die Kombination aus Sicherheitsanforderungen und der Notwendigkeit, Rechenressourcen näher an die Nutzer zu bringen, zu einer verstärkten Ausrichtung der Infrastruktur auf Edge Computing. (Ampere: ra)

eingetragen: 11.12.24
Newsletterlauf: 24.02.25

Ampere: Kontakt und Steckbrief

Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.


Kostenloser PMK-Verlags-Newsletter
Ihr PMK-Verlags-Newsletter hier >>>>>>


Meldungen: Hintergrund

  • Wohin zieht die Cloud?

    Jerome Evans, Gründer und Geschäftsführer der firstcolo GmbH, blickt voraus und betrachtet die anstehenden Entwicklungen rund um die Cloud in 2025: Die Einführung der Cloud hat nicht nur unsere Arbeitsweise, sondern auch unseren Alltag verändert.

  • Generative KI-Inferenz im Fokus

    Die fortschreitende Entwicklung der IT-Landschaft bringt neue Trends mit sich, die 2025 die Technologienutzung in Unternehmen grundlegend verändern werden. Themen wie generative KI und Datensouveränität werden Branchen dazu zwingen, ihre Strategien anzupassen und sich auf neue Realitäten einzustellen. Jeff Wittich, Chief Product Officer bei Ampere Computing, hat vier Prognosen für diese Zukunft formuliert.

  • Bewältigung der KI-Arbeitslasten

    Der Paradigmenwandel der stark digitalisierten Welt von heute stellt Unternehmen hinsichtlich ihrer IT-Infrastrukturen vor große Herausforderungen, bietet aber auch neue Chancen. Zunehmende Cyberbedrohungen, stärkere Virtualisierung oder Transformation durch künstliche Intelligenz (KI) - Unternehmen sind gezwungen, ihre Datenspeicherstrategien zu überdenken, um widerstandsfähig, flexibel und zukunftssicher zu bleiben.

  • KI verankert sich zunehmend in Prozessen

    Die im Wandel befindliche Weltwirtschaft hat den Unternehmen im zurückliegenden Jahr viele Veränderungen und Anpassungen abverlangt. Dieser Trend wird sich nach Einschätzung von Patric Dahse, CEO der Natuvion Group, im kommenden Jahr fortsetzen. Konkret sieht Dahse fünf Trends, mit denen sich die Unternehmen im neuen Jahr auseinandersetzen müssen.

  • Compliance bleibt ein Muss

    Der Wechsel auf SAP S/4HANA wird im kommenden Jahr nochmals an Dringlichkeit gewinnen und damit auf die Archivierungsprozesse ausstrahlen. Der Umstieg zwingt die Unternehmen dazu, ihre Daten- und Dokumentenverwaltung, inklusive deren Archivierung, neu zu denken und bestehende Lösungen so anzupassen, dass sie mit den Anforderungen an Flexibilität, Performance und Compliance Schritt halten können.

  • KI-Einsatz und stringentere Sicherheit

    Mit Blick auf 2025 sind Unternehmen gut beraten, der Datensicherheit in der Cloud angesichts des verstärkten KI-Einsatzes höchste Priorität einzuräumen. Im kommenden Jahr werden Unternehmen zunehmend unter Druck geraten, groß angelegte KI-Initiativen abzusichern und gleichzeitig eine wachsende Zahl von Datenbeständen vor Cyber-Bedrohungen zu schützen.

  • Vom KI-Hype zum Produktivbetrieb

    Ist der KI-Hype noch ungebrochen oder macht sich bereits Ernüchterung breit? Man mag den Eindruck gewinnen, Letzteres träfe zu. Schließlich ist es von der ersten Experimentierphase bis zum effizienten Echteinsatz oft ein weiter, beschwerlicher Weg. Markus Eisele, Developer Strategist bei Red Hat, zeigt, mit welchen Konzepten und Plattformen Unternehmen einen erfolgreichen KI-Einsatz erreichen können.

  • Anwendungsfälle für KI

    Unternehmen erleben heute mit der Künstlichen Intelligenz (KI) einen Déjà-vu-Moment. Ähnlich wie bei früheren Technologiesprüngen - dem Aufkommen des PCs, des Internets oder der Cloud-Technologie - stehen sie an einem Wendepunkt, an dem die breite Einführung von KI die Unternehmenslandschaft transformiert.

  • Vom Kreditinstitut zur Technologie-Oase

    Wir schreiben das Jahr 2035: Sie wachen auf und überprüfen Ihre Finanzen über einen sprachaktivierten digitalen Assistenten, der als Hologramm von Elvis erscheint. Nach der Authentifizierung durch Stimm- und Fingerabdruck-Biometrie liefert Ihnen der verstorbene King of Rock'n'Roll einen Überblick über Ihre Ausgaben, Ersparnisse und Investitionen in einem personalisierten Dashboard, das alle Ihre Konten und Finanzdaten an einem Ort zusammenfasst.

  • Cloud-Drucklösungen spielen eine große Rolle

    Heutzutage lässt sich technischer Fortschritt kaum mehr mit dem bloßen Auge erkennen. Selten vergeht ein Tag ohne eine weitere Innovation, die für mehr Effizienz sorgt. Diese Entwicklung macht auch vor Druckern nicht Halt. Cloud-Lösungen ermöglichen zentrale Administration und Kosteneinsparungen bei lokalen Servern. Doch in diesem Zusammenhang geht die Tendenz eher in Richtung langsamer Wechsel in die Wolke. Warum ist das so? "In vielen Unternehmen - insbesondere aus Branchen, in denen sensible Daten auf der Tagesordnung stehen - herrschen Sicherheits- und Datenschutzbedenken.

Wir verwenden Cookies um unsere Website zu optimieren und Ihnen das bestmögliche Online-Erlebnis zu bieten. Mit dem Klick auf "Alle akzeptieren" erklären Sie sich damit einverstanden. Erweiterte Einstellungen