From 3275cbef7ef579122c0c56b2cf9644d309f5b6fd Mon Sep 17 00:00:00 2001
From: jvongehr <joel-jerome.vongehr@stud.hs-bochum.de>
Date: Mon, 2 Aug 2021 12:10:52 +0200
Subject: [PATCH] very minor changes

---
 Dokumentation/Herausforderungen.tex | 2 +-
 Dokumentation/w2vFromScratch.tex    | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/Dokumentation/Herausforderungen.tex b/Dokumentation/Herausforderungen.tex
index e7af929..49a7cbf 100644
--- a/Dokumentation/Herausforderungen.tex
+++ b/Dokumentation/Herausforderungen.tex
@@ -25,7 +25,7 @@ Wenn der Datensatz jedoch die Realität relativ gut darstellt ist es gerade für
 Der entwickelte Algorithmus soll die Kategorisierung aber nicht an fundiertem Raten ausmachen, sondern anhand von selbst erarbeiteten Kriterien und damit unabhängig der ursprünglichen Distribution.
 
 Generell gibt es zwei Ansätze, um diesen Effekt zu bekämpfen. Zum Einem gibt es die Möglichkeit, den \noteable{Near-Miss-Algorithm} zu benutzen. Mit Hilfe diesem werden im Grunde Einträge von zu oft vertretenen Klassen aus dem Datensatz entfernt, bis dieser ausgeglichen ist. Dadurch wird zwar verhindert, dass eine Klasse bei der Kategorisierung bevorzugt wird, aber man verringert auch den zu Grunde liegenden Datensatz. Je nach ursprünglicher Verteilung und gesamter Menge kann dies zu einem zu kleinen Datensatz und somit weiteren Problemen führen.
-Zum Anderen gibt es die Möglichkeit, die Klassen beim Trainieren zu gewichten. Hier werden selten auftretende Klassen stärker gewertet, um so für das Programm den Anschein zu erwecken, als ob diese häufiger vorkommen. \wip{Dies kann dazu führen, dass ausgemachte Kriterien für bestimmte Klassen als aussagekräftiger gelten, als sie eigentlich sind, da sie vermeintlich bei vielen Trainingsdaten so vorkamen}
+Zum Anderen gibt es die Möglichkeit, die Klassen beim Trainieren zu gewichten. \wip{Hier werden selten auftretende Klassen stärker gewertet, um so für das Programm den Anschein zu erwecken, als ob diese häufiger vorkommen. Dies kann dazu führen, dass ausgemachte Kriterien für bestimmte Klassen als aussagekräftiger gelten, als sie eigentlich sind, da sie vermeintlich bei vielen Trainingsdaten so vorkamen.}
 Im Rahmen dieser Arbeit wurde der zweite Ansatz gewählt.
 
 \subsubsection{Zeichensatz}
diff --git a/Dokumentation/w2vFromScratch.tex b/Dokumentation/w2vFromScratch.tex
index f1ec509..813ffec 100644
--- a/Dokumentation/w2vFromScratch.tex
+++ b/Dokumentation/w2vFromScratch.tex
@@ -123,7 +123,7 @@ plt.rcParams["figure.figsize"] = (10,10)
 
 plt.show()
 \end{lstlisting}
-Die eigentliche Arbeit ist damit bereits getan. Da dieses Beispiel jedoch zur Veranschaulichung gedacht ist fehlt noch die Visualisierung. Dafür werden die Gewichte der jeweiligen Vektoren zunächst zusammen mit den entsprechenden Wörtern in ein Dataframe gespeichert. Anschließend wird der Plot vorbereitet und die Wörter werden anhand ihrer zweidimensionaler Vektoren auf einem Koordinatensystem verteilt. Das hier verwendete Beispiel ist insgesamt sehr akademisch gestaltet. Dadurch, dass zwei Dimensionen für Wortvektoren ziemlich gering ist, das Modell nicht ausführlich optimiert und auch die Ausgangsdaten relativ spärlich sind können die Ergebnisse stark voneinander variieren.Eine sinnvolle Verteilung ist jedoch in Abbildung \ref{fig:scratch} zu sehen.
+Die eigentliche Arbeit ist damit bereits getan. Da dieses Beispiel jedoch zur Veranschaulichung gedacht ist fehlt noch die Visualisierung. Dafür werden die Gewichte der jeweiligen Vektoren zunächst zusammen mit den entsprechenden Wörtern in ein Dataframe gespeichert. Anschließend wird der Plot vorbereitet und die Wörter werden anhand ihrer zweidimensionaler Vektoren auf einem Koordinatensystem verteilt. Das hier verwendete Beispiel ist insgesamt sehr akademisch gestaltet. Dadurch, dass zwei Dimensionen für Wortvektoren ziemlich gering ist, das Modell nicht ausführlich optimiert und auch die Ausgangsdaten relativ spärlich sind können die Ergebnisse stark voneinander variieren. Eine sinnvolle Verteilung ist jedoch in Abbildung \ref{fig:scratch} zu sehen.
 \begin{figure}
 	\includegraphics[width=\linewidth]{bilder/scratch.png}
 	\caption{Wort-Vektoren Verteilung}
-- 
GitLab