DarkBERT: Ein Sprachmodell trainiert mit Daten aus dem Darknet

20. Mai 2023, 21:39 |  1 Kommentar


Bild: Pixabay

Ein KI-Modell, entwickelt und trainiert, mit Daten aus dem Darknet. Quelle sind Hacker, Cyberkriminelle, politisch Verfolgte.

Ein Forscherteam aus Südkorea hat das Tor-Netzwerk durchkämmt für einen Datensatz zum Training großer Sprachmodelle (Large Language Models, kurz LLM). Die Daten stammen ausschließlich aus dem Darknet.

DarkBERT war da und soll anderen großen Sprachmodellen des gleichen Architekturtyps (BERT und RoBERTa) hinsichtlich seiner Fähigkeiten ebenbürtig oder leicht überlegen sein. Dies ging aus ersten Testreihen hervor, wie das Team in einem vorläufigen Forschungsbericht bei arXiv.org mitteilt.

Studie als PDF
DarkBERT_Forschungsbericht.pdf (10.39 MB, 19 mal)

MD5: 10549071e509ab59e815e9751869d542
SHA1: 8991210558d0618116edc5e364c794227bda88e5




via heise.de





Kurze URL:


Bewertung: 4.0/5 (6 Stimmen)


Weitere News:

Einen Kommentar schreiben

Du willst nicht als "Gast" schreiben? Logg Dich Hier ein.

Code:

Code neuladen

Kommentare
(1)

Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.




Kommentare:

Du hast bereits für diesen Kommentar abgestimmt...

;-)

Top