Select Git revision
Forked from
Peter Gerwinski / bs
Source project has a limited visibility.
Notizen0228.txt 506 B
Nur Englisch (lookup in dictionary?)
Apostroph durch UpperCase Buchstabe ersetzen um Bedeutung zu behalten (it's vs its)
Filtern nach kleiner utf8 reichweite (für nur Englisch)
Satzzeichen raus -> durch Leerzeichen ersetzen
Stop words - Entfernen von häufigen wörtern, welche geringe Bedeutung haben um Datensatz relevanter zu halten
Doku:
- Vergleich w2v mit html farben (black = #000) als Einstieg
- Bedenken, weil "good" & "bad" sind oft 1:1 ersetzbar
Worträume eig sehr nah für diesen Kontext