...::: C&M News by Ress - Druckansicht :::...

Drucken (Bereits 27 mal)


DarkBERT: Ein Sprachmodell trainiert mit Daten aus dem Darknet

(20. Mai 2023/21:39)

Bild: Pixabay

Ein KI-Modell, entwickelt und trainiert, mit Daten aus dem Darknet. Quelle sind Hacker, Cyberkriminelle, politisch Verfolgte.

Ein Forscherteam aus Südkorea hat das Tor-Netzwerk durchkämmt für einen Datensatz zum Training großer Sprachmodelle (Large Language Models, kurz LLM). Die Daten stammen ausschließlich aus dem Darknet.

DarkBERT war da und soll anderen großen Sprachmodellen des gleichen Architekturtyps (BERT und RoBERTa) hinsichtlich seiner Fähigkeiten ebenbürtig oder leicht überlegen sein. Dies ging aus ersten Testreihen hervor, wie das Team in einem vorläufigen Forschungsbericht bei arXiv.org mitteilt.

Studie als PDF
DarkBERT_Forschungsbericht.pdf (10.39 MB, 19 mal)

MD5: 10549071e509ab59e815e9751869d542
SHA1: 8991210558d0618116edc5e364c794227bda88e5


[pdf]darkbert_forschungsbericht_155.pdf[/pdf]


via heise.de


https://ress.at/darkbert-ein-sprachmodell-trainiert-mit-daten-aus-dem-darknet-news20052023213925.html
© by RessServerWorks, 2024