Skip to content
Snippets Groups Projects
Select Git revision
  • aca440b467ddd0b38cf2cd8b50eb6eb30ed17e1c
  • 2023ss default protected
  • 2022ss
  • 2021ss
  • 2020ss
  • 2019ss
  • 2018ss
  • 2017ss
  • 2016ss
  • 2015ss
  • 2014ss
11 results

shm-2a.c

Blame
  • Forked from Peter Gerwinski / bs
    Source project has a limited visibility.
    Notizen0228.txt 506 B
    Nur Englisch (lookup in dictionary?)
    Apostroph durch UpperCase Buchstabe ersetzen um Bedeutung zu behalten (it's vs its)
    Filtern nach kleiner utf8 reichweite (für nur Englisch)
    Satzzeichen raus -> durch Leerzeichen ersetzen 
    Stop words - Entfernen von häufigen wörtern, welche geringe Bedeutung haben um Datensatz relevanter zu halten
    
    Doku:
     - Vergleich w2v mit html farben (black = #000) als Einstieg
     - Bedenken, weil "good" & "bad" sind oft 1:1 ersetzbar
    	Worträume eig sehr nah für diesen Kontext