Sie sind hier: Startseite » Markt » English News

Entwicklung von KI-Modellen für KMU


Alibaba Cloud macht den Quellcode von zwei vortrainierten Large-Language-Modellen (LLM) der Open-Source-Community zugänglich
Alibaba Cloud Open-Sources Its 7-Billion-Parameter LLM Models, Strengthening Its Commitment to the Open-Source Community


Im April 2023 hat Alibaba Cloud ihr neuestes generatives KI-Modell "Tongyi Qianwen" vorgestellt. Nun öffnet das Unternehmen den Quellcode von zwei LLM, Qwen-7B und die Chat-optimierte Version Qwen-7B-Chat, mit denen Tongyi Qianwen trainiert wurde, für die Open-Source-Gemeinschaft. Beide können in Cloud- und On-Premises-Infrastrukturen eingesetzt werden. Dies ermöglicht den Anwendern eine Feinabstimmung der Modelle und die effektive und kosteneffiziente Erstellung eigener generativer KI-Fähigkeiten.

Mit der Offenlegung des Quellcodes und der Dokumentation der beiden LLMs trägt Alibaba Cloud dazu bei, die Einstiegshürden bei der Entwicklung von KI-Modellen für KMU abzubauen. Seit Juli 2023 stellt Alibaba Cloud außerdem sein neuestes KI-gestütztes bildgenerierendes Modell "Tongyi Wanxiang" vor, das Entwickler und KMU bei der kreativen Bildgestaltung unterstützt.

Alibaba Cloud Open-Sources Its 7-Billion-Parameter LLM Models, Strengthening Its Commitment to the Open-Source Community
Alibaba Cloud, the digital technology and intelligence backbone of Alibaba Group, has announced its latest contribution to the open-source community by open-sourcing its 7-billion-parameter Large Language Models (LLM), Qwen-7B and Qwen-7B-Chat, through its AI model community ModelScope, and the collaborative AI platform Hugging Face. Alibaba Cloud introduced its proprietary LLM, Tongyi Qianwen, earlier this year in April. This cutting-edge model, capable of generating human-like content in both Chinese and English, has different model sizes, including seven billion and above parameters. This time, the open-source release includes the pre-trained 7-billion-parameter model, Qwen-7B, and its conversationally fine-tuned version, Qwen-7B-Chat.

In an effort to democratize AI technologies, the models’ code, model weights, and documentation will be freely accessible to academics, researchers and commercial institutions worldwide. For commercial uses, the models will be free to use for companies with fewer than 100 million monthly active users. Programs with more users can request a license from Alibaba Cloud.

"By open-sourcing our proprietary large language models, we aim to promote inclusive technologies and enable more developers and SMEs to reap the benefits of generative AI," said Jingren Zhou, CTO of Alibaba Cloud Intelligence. "As a determined long-term champion of open-source initiatives, we hope that this open approach can also bring collective wisdom to further help open-source communities thrive."

The Qwen-7B was pre-trained on over 2 trillion tokens, including Chinese, English and other multilingual materials, code, and mathematics, covering general and professional fields. Its context length reaches 8K. In training, the Qwen-7B-Chat model was aligned with human instructions. Both Qwen-7B and Qwen-7B-Chat models can be deployed on cloud and on-premises infrastructures. This enables users to fine-tune the models and build their own high-quality generative models effectively and cost-efficiently.

The pre-trained Qwen-7B model distinguished itself in the Massive Multi-task Language Understanding (MMLU) benchmark, scoring a notable 56.7, outperforming other major pre-trained open-source models with similar scales or even some larger-size models. This benchmark assesses a text model's multitask accuracy across 57 varied tasks, encompassing fields such as elementary mathematics, computer science and law. Moreover, Qwen-7B achieved the highest score among models with equivalent parameters in the leaderboard of C-Eval, a comprehensive Chinese evaluation suite for foundational models. It covers 52 subjects in four major specialities including humanities, social sciences, STEM and others. Additionally, Qwen-7B reached outstanding performance on benchmarks of mathematics and code generation, such as GSM8K and HumanEval.

In July, Alibaba Cloud also introduced its AI image generator, Tongyi Wanxiang, which was designed to support developers and SMEs in their creative image expression. The cloud pioneer also unveiled ModelScopeGPT, a versatile framework designed to assist users in performing complex and specialized AI tasks across language, vision and speech domains by leveraging various AI models on ModelScope. Launched by Alibaba Cloud last year, ModelScope is an open-source AI model community currently featuring over 1,000 AI models contributed by 20 leading AI institutes. (Alibaba Cloud: ra)

eingetragen: 10.09.23
Newsletterlauf: 13.10.23

Alibaba Cloud: Kontakt und Steckbrief

Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.


Kostenloser PMK-Verlags-Newsletter
Ihr PMK-Verlags-Newsletter hier >>>>>>


Meldungen: Unternehmen

  • Präsenz mit neuem Standort in Spanien

    CGI gab bekannt, dass ihre hundertprozentige Tochtergesellschaft CGI Deutschland B.V. & Co. KG eine Vereinbarung zur Übernahme von Novatec Consulting GmbH unterzeichnet hat. Novatec ist ein IT-Dienstleistungsunternehmen, das auf agile Softwareentwicklung, digitale Produkte und strategische Geschäfts- und IT-Beratung spezialisiert ist. Mehr als 300 hochqualifizierte IT- und Beratungsexperten mit Hauptsitz im Metromarkt Stuttgart sowie an sieben weiteren deutschen Standorten und in Granada (Spanien) werden die Präsenz von CGI in der Fertigungs- und Finanzdienstleistungsbranche mit besonderem Fokus auf die Automobilindustrie und E-Mobilität erweitern.

  • Migration von Workloads in die Azure-Cloud

    Arrow hat die Spezialisierung Infrastruktur- und Datenbankmigration auf Microsoft Azure erhalten. Sie demonstriert die umfassende Expertise, die langjährige Erfahrung und das tiefgehende Fachwissen von Arrow in der Migration von Kunden-Workloads in die Azure-Cloud.

  • Cloud-native, mandantenfähige Plattform

    LotusFlare, Anbieterin einer Cloud-nativen digitalen Handels- und Monetarisierungsplattform für Kommunikationsdienstleister (CSPs), gab ihre Mitarbeit bei der Konzeption, Entwicklung und Unterstützung des weltweit ersten grenzüberschreitenden Telko-Prämienprogramms bekannt.

  • Transparentes Preismodell ohne versteckte Kosten

    Leaseweb Global, Anbieterin von Cloud-Diensten und Infrastructure as a Service (IaaS), gab die Verfügbarkeit seiner Public Cloud- und Virtual Private Server (VPS)-Lösungen in Japan bekannt. Leaseweb Public Cloud wird über eine lokale, landeseigene Infrastruktur bereitgestellt und bietet eine äußerst wettbewerbsfähige Mischung aus kosteneffizienter Flexibilität und globaler Verfügbarkeit.

  • 27 Prozent Anstieg der Cloud-Nutzer

    Wildix, Anbieterin von KI-gestützten Unified-Communications-Lösungen, hat ihre Wachstumszahlen für 2024 bekanntgegeben. Diese bestätigen die führende Marktposition von Wildix. Das Unternehmen zeichnet sich durch KI-Innovationen in ihren UCC-Lösungen, spezifische Branchenlösungen und einen reinen Channel-Vertrieb aus und konnte seine globale Präsenz auf 145 Länder ausweiten.

  • Sicherheitsmaßnahmen & Compliance-Fachwissen

    Devoteam, ein KI-getriebenes Tech-Consulting-Unternehmen spezialisiert auf Cloud-Plattformen, Cybersicherheit, Datenverarbeitung und Nachhaltigkeit sowie Vorreiter im Bereich Managed Services, hat einen wichtigen Meilenstein erreicht: Die höchste Stufe der Managed-Service-Provider-Zertifizierung bei allen drei großen Hyperscale-Cloud-Anbietern.

  • Lernlabor "Sicheres Cloud-Computing"

    Mit der fortschreitenden Migration in die Cloud steigt auch der Bedarf an entsprechenden Sicherheitslösungen. Das Fraunhofer IESE steht seit über 20 Jahren für IT-Sicherheit und Datensouveränität für Digitale Ökosysteme. In einer Kooperation mit der Hochschule Worms wurde nun das Lernlabor "Sicheres Cloud-Computing" ins Leben gerufen, das nicht nur umfassendes Know-how für Cloud-DevOps, Cloud-Anwender und das mittlere Management von Cloud-Lösungsanbietern bietet.

  • Kontext zu Cloud-spezifischen Risiken

    Check Point Software Technologies, Anbieterin von Cybersicherheitslösungen, gibt eine strategische Partnerschaft mit Cloud-Security-Anbieterin Wiz bekannt. Sie hilft Unternehmen, die wachsenden Herausforderungen der Absicherung hybrider Cloud-Umgebungen zu bewältigen. Diese Zusammenarbeit überbrückt die seit langem bestehende Lücke zwischen Cloud-Netzwerksicherheit und Cloud Native Application Protection (CNAPP) durch eine tiefgreifende technologische Integration und eine strategische Geschäftsallianz und bietet eine branchenführende, einheitliche und ganzheitliche Sicherheitslösung.

  • ServiceNow-Implementierungen

    Sopra Steria, eine wichtige Akteurin im europäischen Technologiesektor, wurde vom international renommierten "PAC Innovation Radar" als einer der führenden Anbieter von Dienstleistungen im Zusammenhang mit ServiceNow in Europa anerkannt - als einer von nur fünf Anbietern, die 2024 eine "Best-in-Class"-Gesamtbewertung erhalten haben.

  • Maßgeschneiderte Cloud- & Hosting-Lösungen

    Die IT-Dienstleisterin und High-End Data Center Solutions Provider synaforce wächst weiter und übernimmt die Herbst Datentechnik GmbH. Das Unternehmen aus Berlin bringt über 25 Jahre Erfahrung als spezialisierter Cloud- und Hosting-Provider mit und ergänzt das synaforce-Portfolio um zusätzliche technologische Kompetenz. Kunden beider Unternehmen profitieren von einer erweiterten IT-Infrastruktur, leistungsfähigen Hosting-Lösungen und verstärkten Cybersecurity-Services.

Wir verwenden Cookies um unsere Website zu optimieren und Ihnen das bestmögliche Online-Erlebnis zu bieten. Mit dem Klick auf "Alle akzeptieren" erklären Sie sich damit einverstanden. Erweiterte Einstellungen