Skip to content
Snippets Groups Projects
Select Git revision
  • c7d1f3d74b090e1bb91b7b647243fbf710f1dd26
  • master default protected
2 results

Notizen0228.txt

Blame
  • Notizen0228.txt 506 B
    Nur Englisch (lookup in dictionary?)
    Apostroph durch UpperCase Buchstabe ersetzen um Bedeutung zu behalten (it's vs its)
    Filtern nach kleiner utf8 reichweite (für nur Englisch)
    Satzzeichen raus -> durch Leerzeichen ersetzen 
    Stop words - Entfernen von häufigen wörtern, welche geringe Bedeutung haben um Datensatz relevanter zu halten
    
    Doku:
     - Vergleich w2v mit html farben (black = #000) als Einstieg
     - Bedenken, weil "good" & "bad" sind oft 1:1 ersetzbar
    	Worträume eig sehr nah für diesen Kontext