Sie sind hier: Startseite » Markt » English News

Entwicklung von KI-Modellen für KMU


Alibaba Cloud macht den Quellcode von zwei vortrainierten Large-Language-Modellen (LLM) der Open-Source-Community zugänglich
Alibaba Cloud Open-Sources Its 7-Billion-Parameter LLM Models, Strengthening Its Commitment to the Open-Source Community


Im April 2023 hat Alibaba Cloud ihr neuestes generatives KI-Modell "Tongyi Qianwen" vorgestellt. Nun öffnet das Unternehmen den Quellcode von zwei LLM, Qwen-7B und die Chat-optimierte Version Qwen-7B-Chat, mit denen Tongyi Qianwen trainiert wurde, für die Open-Source-Gemeinschaft. Beide können in Cloud- und On-Premises-Infrastrukturen eingesetzt werden. Dies ermöglicht den Anwendern eine Feinabstimmung der Modelle und die effektive und kosteneffiziente Erstellung eigener generativer KI-Fähigkeiten.

Mit der Offenlegung des Quellcodes und der Dokumentation der beiden LLMs trägt Alibaba Cloud dazu bei, die Einstiegshürden bei der Entwicklung von KI-Modellen für KMU abzubauen. Seit Juli 2023 stellt Alibaba Cloud außerdem sein neuestes KI-gestütztes bildgenerierendes Modell "Tongyi Wanxiang" vor, das Entwickler und KMU bei der kreativen Bildgestaltung unterstützt.

Alibaba Cloud Open-Sources Its 7-Billion-Parameter LLM Models, Strengthening Its Commitment to the Open-Source Community
Alibaba Cloud, the digital technology and intelligence backbone of Alibaba Group, has announced its latest contribution to the open-source community by open-sourcing its 7-billion-parameter Large Language Models (LLM), Qwen-7B and Qwen-7B-Chat, through its AI model community ModelScope, and the collaborative AI platform Hugging Face. Alibaba Cloud introduced its proprietary LLM, Tongyi Qianwen, earlier this year in April. This cutting-edge model, capable of generating human-like content in both Chinese and English, has different model sizes, including seven billion and above parameters. This time, the open-source release includes the pre-trained 7-billion-parameter model, Qwen-7B, and its conversationally fine-tuned version, Qwen-7B-Chat.

In an effort to democratize AI technologies, the models’ code, model weights, and documentation will be freely accessible to academics, researchers and commercial institutions worldwide. For commercial uses, the models will be free to use for companies with fewer than 100 million monthly active users. Programs with more users can request a license from Alibaba Cloud.

"By open-sourcing our proprietary large language models, we aim to promote inclusive technologies and enable more developers and SMEs to reap the benefits of generative AI," said Jingren Zhou, CTO of Alibaba Cloud Intelligence. "As a determined long-term champion of open-source initiatives, we hope that this open approach can also bring collective wisdom to further help open-source communities thrive."

The Qwen-7B was pre-trained on over 2 trillion tokens, including Chinese, English and other multilingual materials, code, and mathematics, covering general and professional fields. Its context length reaches 8K. In training, the Qwen-7B-Chat model was aligned with human instructions. Both Qwen-7B and Qwen-7B-Chat models can be deployed on cloud and on-premises infrastructures. This enables users to fine-tune the models and build their own high-quality generative models effectively and cost-efficiently.

The pre-trained Qwen-7B model distinguished itself in the Massive Multi-task Language Understanding (MMLU) benchmark, scoring a notable 56.7, outperforming other major pre-trained open-source models with similar scales or even some larger-size models. This benchmark assesses a text model's multitask accuracy across 57 varied tasks, encompassing fields such as elementary mathematics, computer science and law. Moreover, Qwen-7B achieved the highest score among models with equivalent parameters in the leaderboard of C-Eval, a comprehensive Chinese evaluation suite for foundational models. It covers 52 subjects in four major specialities including humanities, social sciences, STEM and others. Additionally, Qwen-7B reached outstanding performance on benchmarks of mathematics and code generation, such as GSM8K and HumanEval.

In July, Alibaba Cloud also introduced its AI image generator, Tongyi Wanxiang, which was designed to support developers and SMEs in their creative image expression. The cloud pioneer also unveiled ModelScopeGPT, a versatile framework designed to assist users in performing complex and specialized AI tasks across language, vision and speech domains by leveraging various AI models on ModelScope. Launched by Alibaba Cloud last year, ModelScope is an open-source AI model community currently featuring over 1,000 AI models contributed by 20 leading AI institutes. (Alibaba Cloud: ra)

eingetragen: 10.09.23
Newsletterlauf: 13.10.23

Alibaba Cloud: Kontakt und Steckbrief

Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.


Meldungen: Unternehmen

  • Aufbau souveräner Cloud-Umgebungen

    enclaive präsentierte ihre Lösungen für sichere Cloud-Umgebungen und KI-Nutzung in Nürnberg auf der it-sa. Highlight des Auftritts: Post-Quanten-sichere Enklaven und Key-Management-Lösungen. Die Messe stand auch in diesem Jahr wieder im Zeichen der Cloud und Künstlicher Intelligenz.

  • Digitale Souveränität in der Cloud

    Bitdefender hat ihre strategische Partnerschaft mit secunet bekanntgegeben, einem Unternehmen, das auf digitale Souveränität und den Schutz hochkritischer Umgebungen, etwa von Behörden, spezialisiert ist. In Deutschland kann Bitdefender ab sofort Bitdefender GravityZone, ihre umfassende Plattform für Cybersicherheit, Risikomanagement und Compliance, in der souveränen OpenStack Cloud von SysEleven, einem Tochterunternehmen von secunet, hosten. Kunden- und Konfigurationsdaten, Sicherheitsereignisse und Telemetriedaten werden so ausschließlich innerhalb der Europäischen Union verarbeitet.

  • Automatisierung und KI

    Tata Consultancy Services (TCS) intensiviert ihre strategische Partnerschaft mit Tryg, einem skandinavischen Sachversicherer, der in Dänemark, Schweden und Norwegen tätig ist. Im Rahmen der siebenjährigen Vereinbarung im Wert von 550 Millionen Euro unterstützt TCS Tryg dabei, die Betriebsabläufe in ihren drei Kernmärkten zu vereinfachen, zu standardisieren und die technologische Transformation voranzutreiben, um das Unternehmenswachstum zu beschleunigen.

  • Mehr als nur ERP-Kernfunktionen

    Haufe X360 wächst mit den Anforderungen ihrer Nutzer und entwickelt sich stetig zur zentralen Business-Management-Plattform für den Mittelstand. Durch die nahtlose Anbindung spezialisierter Best-of-Breed-Partnerlösungen bietet Haufe X360 immer mehr Funktionen, die Unternehmen direkt aus Haufe X360 heraus nutzen können - ob für HR, Logistik, Buchhaltung oder Zollabwicklung. So lassen sich noch mehr Prozesse einfach steuern - in einer einzigen, integrierten Lösung.

  • Google Cloud Day 2025

    Unter dem Motto "The Future of Business with Agentic AI" laden Devoteam und Google Cloud Entscheider und IT-Experten am 22. Oktober zum Google Cloud Day 2025 (GCD 2025) in das Devoteam Büro in Frankfurt ein. Die Veranstaltung bietet Keynotes, praxisorientierte Breakout-Sessions und Networking-Möglichkeiten - und zeigt, wie intelligente Agenten Geschäftsprozesse revolutionieren und bis zu 90 Prozent effizienter machen können.

  • Neue Lösungen für Aufbau von KI-Agenten

    Neo4j gab die Investition von 100 Millionen US-Dollar bekannt. Damit will das Unternehmen seine Position als Standard-Knowledge-Layer für agentenbasierte Systeme (Agentic Systems) und als zentrale Infrastruktur für KI (GenAI, Generative AI) weiter ausbauen. Die Investition fließt in Produktinnovationen - darunter zwei neue Angebote für KI-Agenten - sowie in den Start eines der bislang größten Startup-Programme für KI-native Unternehmen. Innerhalb der nächsten zwölf Monate sollen damit weltweit 1.000 Startups unterstützt werden.

  • Cyberresilienz durch "Commvault Cloud"

    Commvault und BeyondTrust, Anbieterin von Identitätssicherheit, haben die Integration der Cyberresilienz-Plattform "Commvault Cloud" und der Password-Safe-Privileged-Access-Management (PAM)-Lösung auf der BeyondTrust Pathfinder-Plattform bekanntgegeben. Diese Zusammenarbeit will Kunden unterstützen, Risiken zu minimieren, den Status ihrer IT-Sicherheit zu verbessern und die Effizienz der Datenwiederherstellung zu steigern.

  • Cyberresilienz und Data Security

    Die DMP DataManagement Professionals GmbH hat bekannt gegeben, dass das Unternehmen unter dem neuen Namen Pink Elephant GmbH firmieren wird. Die Namensänderung ist ein weiterer Schritt in der strategischen Ausrichtung des Unternehmens und unterstreicht die Zugehörigkeit zur Muttergesellschaft Pink Elephant B.V. mit Hauptsitz in Naarden, Niederlande. Die Pink Elephant B.V. wiederum ist eine 100prozentige Tochtergesellschaft der The Digital Neighborhood B.V. (TDN).

  • Bereich Cloud Financial Management

    Flexera, Anbieterin für Software-Lizenzmanagement und Technology Intelligence, zählt zum zweiten Mal in Folge zu den "Leadern" im Gartner Magic Quadrant 2025 für Cloud Financial Management Tools. Der aktuelle Bericht hebt nach Flexera die kontinuierliche Stärke des Unternehmens in der Umsetzung sowie die Vollständigkeit der Vision im Bereich Cloud Financial Management (auch bekannt als FinOps) hervor.

  • Cloud-Edge-Konzepte und Datenräume

    Der eco - Verband der Internetwirtschaft e. V. und die IndustryFusion Foundation haben eine weitreichende Kooperation vereinbart, um den Ausbau digitaler Infrastrukturen und souveräner Datenräume für industrielle Anwendungen in Europa voranzutreiben. Im Mittelpunkt steht die gemeinsame Weiterentwicklung von Open-Source-Datenräumen, Edge-/Cloud-Infrastrukturen sowie interoperablen Standards für Industrie 4.0.

Wir verwenden Cookies um unsere Website zu optimieren und Ihnen das bestmögliche Online-Erlebnis zu bieten. Mit dem Klick auf "Alle akzeptieren" erklären Sie sich damit einverstanden. Erweiterte Einstellungen