Deepseek-V3: Neues KI-Modell übertrifft Llama 3.1-405B und Qwen 2.5-72B
27. Dez. 2024, 15:57 | 0 KommentareDas chinesische Unternehmen Deepseek hat mit Deepseek-V3 ein neues Large Language Model (LLM) veröffentlicht, das bisherige Open-Source-Modelle übertrifft.
Langsam werden Open-Source-KI-Modelle besser: Das neue Large Language Model (LLM) Deepseek-V3 verfügt über 671 Milliarden Parameter, nutzt jedoch nur 37 Milliarden Parameter pro Token, was eine deutlich höhere Effizienz verspricht.
Das Modell basiert auf einer weiterentwickelten Architektur, die Multi-Head Latent Attention (MLA) und DeepseekMoE kombiniert. Zudem implementierte das Unternehmen eine verlustfreie Lastverteilungsstrategie, die die gleichzeitige Vorhersage mehrerer Tokens ermöglicht. Die Trainingskosten beliefen sich auf umgerechnet 5,57 Millionen US-Dollar.
Mehr dazu findest Du auf golem.de
Kurze URL:
Weitere News:
Cyberangriff: Ukraine zerstört Netzwerk eines russischen Providers
Jackery: Solardachziegel kaum von Dachpfannen unterscheidbar
Marvel Rivals verwendet Hintern mehrfach
aleX fotografiert: Am Friedhof Vögel und süsse Eichhörnchen
Pixel 4a: Google verringert Akkulaufzeit per Update
Entwickler bedient Windows 11 mit nur 184 MByte RAM
Facebook, Instagram, Threads: Zuckerberg will keine Fakten mehr checken
Ein Minecraft Film
aleX fotografiert: Ein Silberreiher und Graureiher im Sonnenblumenfeld
Gegen zu heißen Kaffee: Roboter-Katze übernimmt das Pusten
Jackery: Solardachziegel kaum von Dachpfannen unterscheidbar
Marvel Rivals verwendet Hintern mehrfach
aleX fotografiert: Am Friedhof Vögel und süsse Eichhörnchen
Pixel 4a: Google verringert Akkulaufzeit per Update
Entwickler bedient Windows 11 mit nur 184 MByte RAM
Facebook, Instagram, Threads: Zuckerberg will keine Fakten mehr checken
Ein Minecraft Film
aleX fotografiert: Ein Silberreiher und Graureiher im Sonnenblumenfeld
Gegen zu heißen Kaffee: Roboter-Katze übernimmt das Pusten
Einen Kommentar schreiben
Kommentare
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
(0)
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
Kommentare:
Du hast bereits für diesen
Kommentar abgestimmt...
;-)
© by Ress Design Group, 2001 - 2025