DarkBERT: Ein Sprachmodell trainiert mit Daten aus dem Darknet

20. Mai 2023, 21:39 |

Bild: Pixabay

Ein KI-Modell, entwickelt und trainiert, mit Daten aus dem Darknet. Quelle sind Hacker, Cyberkriminelle, politisch Verfolgte.

Ein Forscherteam aus Südkorea hat das Tor-Netzwerk durchkämmt für einen Datensatz zum Training großer Sprachmodelle (Large Language Models, kurz LLM). Die Daten stammen ausschließlich aus dem Darknet.

DarkBERT war da und soll anderen großen Sprachmodellen des gleichen Architekturtyps (BERT und RoBERTa) hinsichtlich seiner Fähigkeiten ebenbürtig oder leicht überlegen sein. Dies ging aus ersten Testreihen hervor, wie das Team in einem vorläufigen Forschungsbericht bei arXiv.org mitteilt.

Studie als PDF

DarkBERT_Forschungsbericht.pdf (10.39 MB, 19 mal)

MD5: 10549071e509ab59e815e9751869d542
SHA1: 8991210558d0618116edc5e364c794227bda88e5

via heise.de

Autor schreiben

Kurze URL:

Currently 4.00/5
1
2
3
4
5

Bewertung: 4.0/5 (6 Stimmen)

Weitere News:

Restrukturiertes Holz robust wie Stahl und Kohlenfaser
Nach Testprojekt : Ladebordstein von Rheinmetall ist serienreif
Trump nennt Breitbandförderung "illegal und rassistisch"
Apples neue iPhones sollen teurer werden
Intel senkt Preis für Core Ultra 7-265K deutlich
Microsofts Quantenforschung ist manipuliert
Forscher warnt vor Ransomware im CPU-Microcode
20 Jahre altes Router-Botnetz zerschlagen
Großprojekt Neom könnte weitläufig das Wetter ändern
Boeing 747-8: Katar schenkt Trump-Regierung Palast der Lüfte

Einen Kommentar schreiben

Kommentare

(1)

Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.

Kommentare:

Leider hast du das Java-Plugin deaktiviert...
Die Kommentarfunktion brauch das Java Plugin aber...

Du kannst aber gerne über das Forum Newskommentare schreiben...

Du hast bereits für diesen Kommentar abgestimmt...

;-)