Skip to content
Snippets Groups Projects
Select Git revision
  • 0ba264323975d1dc4dd71499afc9d06ee4ce3d5e
  • master default
2 results

pgscript.sty

Blame
  • Forked from Peter Gerwinski / hp
    Source project has a limited visibility.
    Notizen0228.txt 506 B
    Nur Englisch (lookup in dictionary?)
    Apostroph durch UpperCase Buchstabe ersetzen um Bedeutung zu behalten (it's vs its)
    Filtern nach kleiner utf8 reichweite (für nur Englisch)
    Satzzeichen raus -> durch Leerzeichen ersetzen 
    Stop words - Entfernen von häufigen wörtern, welche geringe Bedeutung haben um Datensatz relevanter zu halten
    
    Doku:
     - Vergleich w2v mit html farben (black = #000) als Einstieg
     - Bedenken, weil "good" & "bad" sind oft 1:1 ersetzbar
    	Worträume eig sehr nah für diesen Kontext