Welches Problem löst eine auf Subword basierende Tokenisierung ggü einer auf ganzen wörtern?
Seltene und unbekannte Wörter erkennen
Weniger Speicher notwendig
Nennen Sie 2 Vorteile von Word Embedding (Word2Vec) ggü Naive One-Hot Encoding
Dichte Darstellung führt zu weniger Speicher und rechenaufwand
Semantische Ähnlichkeit: erfassen semantische beziehungen
Last changed2 months ago