diff --git a/Dokumentation/silas/daten_analyse.tex b/Dokumentation/silas/daten_analyse.tex index 13c4c579d57ba1e5887b0abb9a1c854bb0dd7d88..5145f74f647fd3148dba2124e1055575b33e2d4f 100644 --- a/Dokumentation/silas/daten_analyse.tex +++ b/Dokumentation/silas/daten_analyse.tex @@ -62,7 +62,7 @@ Das Ausführen des Quellcodes in Listing \ref{list:four} führt zu folgender Aus Hier ist zu erkennen, dass jede Zeile der review.json eine Rezension mit den -Merkmalen \lstinline{review_id, user_id, business_id, stars, useful, funny, cool, text} und +Merkmalen \lstinline{review_id, user_id, business_id, stars, useful, funny, cool, text} und\linebreak \lstinline{date} enthält. Die meisten dieser Merkmale sind selbsterklärend. Erwähnenswert sind dabei jedoch die Merkmale \lstinline{useful, funny} und \lstinline{cool}, welche Reaktionen anderer Nutzer auf diese Review darstellen. Für dieses Projekt sind hingegen nur die beiden Punkte \lstinline{stars} und \lstinline{text} von Bedeutung. In diesem Datensatz sind Sonderzeichen mit einem Backslash escaped. diff --git a/Dokumentation/silas/w2vCNN.tex b/Dokumentation/silas/w2vCNN.tex index 64565db7dd7dd622cb7a335ae96bf1efec2de81c..bb3657de21db16122d573332e52995c99a651870 100644 --- a/Dokumentation/silas/w2vCNN.tex +++ b/Dokumentation/silas/w2vCNN.tex @@ -214,7 +214,7 @@ confusion_matrix(y_test,y_pred,normalize='true') \end{lstlisting} Dafür werden die vom Netz vorhergesagten Klassen der Testmenge in dem Vektor \lstinline{y_pred} gespeichert und die tatsächlichen Klassen der Testmenge in dem -Vektor \lstinline{y_test}. Beide Vektoren werden der Funktion +Vektor\linebreak \lstinline{y_test}. Beide Vektoren werden der Funktion \lstinline{confusion_matrix} übergeben, welche die in der Tabelle \ref{tab:conf_w_cnn} dargestellte Konfusionsmatrix zurückliefert. diff --git a/Dokumentation/silas/w2vMean.tex b/Dokumentation/silas/w2vMean.tex index b6bedf6dcfd5fdd0c2e4fe47c7a7ed0eabb9c838..8abad52adc596e4a62bafeea5f7fc7eae658b449 100644 --- a/Dokumentation/silas/w2vMean.tex +++ b/Dokumentation/silas/w2vMean.tex @@ -21,7 +21,7 @@ Arbeitsspeicher zu halten. Dies hilft, die benötigte Trainingszeit zu reduzieren. Sollte die Arbeitsspeicherkapazität nicht ausreichen, befindet sich eine Implementierung, welche Generatoren benutzt, im Git-Repository. -\wip{Link zu Gitlab?} +%\wip{Link zu Gitlab?} Um das Word2Vec-Modell zu erhalten, wird die im Listing \ref{list:gw2v} geschriebene Funktion \lstinline{getWordVecModel} importiert. @@ -159,7 +159,6 @@ geführt. Wie in Kapitel \ref{subsubsec:Dist} diskutiert gibt es verschiedene Umgänge mit unausgeglichenen Datensätzen. Die für diese Arbeit gewählte Methode der Gewichtung ist hier zu erkennen an den, an die Methode \lstinline{fit} übergebenen, Klassengewichte. -\wip{vll noch erklären wie die Gewichte entstehen} \begin{lstlisting}[caption={Neuronales Netz - Evaluieren},label={list:mean5},firstnumber=60] modelNN.evaluate(X_test,Y_test) \end{lstlisting} diff --git a/Dokumentation/w2v.pdf b/Dokumentation/w2v.pdf index a4b355786c16f7ae9663fa67c8e9ca5d3c1c9cac..e1bba7e4a3bafd154a75e136bc5bb75e3a32797d 100644 Binary files a/Dokumentation/w2v.pdf and b/Dokumentation/w2v.pdf differ