Skip to content
Snippets Groups Projects
Commit 3708ad37 authored by Joel Vongehr's avatar Joel Vongehr
Browse files

Merge branch 'master' of https://gitlab.cvh-server.de/w2v/w2vp

parents e70e5090 e9df16a5
Branches
No related tags found
No related merge requests found
......@@ -41,12 +41,11 @@ Zuerst wird in Zeile 5 die im Listing \ref{list:gw2v} geschriebene Funktion
Die Funktion \lstinline{getSentenceVectorCNN} in Zeile 7 nimmt eine Rezension entgegen und
transformiert diese in eine für das CNN verarbeitbare Form.
\wip{genauer erklären?}
%\wip{genauer erklären?}
\wip{komischer Satz...}
Dafür wird die Rezension in Zeile 8 tokenisiert, sodass in der Variable
\lstinline{split} eine Liste der, durch die Funktion \lstinline{utils.simple_preprocess}
vorverarbeiteten, Wörter gespeichert ist.
\lstinline{split} eine Liste der Rezensionswörter gespeichert ist.
Die Vorverarbeitung und Trennung der Wörter erfolgt hier durch die Funktion \lstinline{utils.simple_preprocess}.
Danach wird in Zeile 9 das Numpy-Array wordVecs mit Nullen initialisiert.
Dieses Numpy-Array speichert die ersten 72 Wortvektoren der Rezension,
......@@ -110,7 +109,7 @@ Information zu erzwingen.
Zuletzt muss das neuronale Netz noch kompiliert werden, dies geschieht in
Zeile 18. Hierbei wird wie gehabt der optimizer \lstinline{adam} gewählt und die
Fehlerfunktion \lstinline{sparse_categorical_crossentropy} sowie die Metrik
Fehlerfunktion \lstinline[literate={\_}{}{0\discretionary{\_}{}{\_}}]{sparse_categorical_crossentropy} sowie die Metrik
\lstinline{sparse_categorical_accuracy} verwendet.
Die Zusammenfassung des Modells, die durch Zeile
......@@ -176,7 +175,7 @@ Zeile 27 und 28 variablen gespeichert.
Die Klassengewichte in Zeile 31 wurden im Listing \ref{list:modelCNNWeights} berechnet.
Mit allen Anforderungen erfüllt kann jetzt in Zeile 32 das Modell trainiert werden.
\wip{schwer zu versteheneder Satz}Dabei ist zu beachten, dass die Anzahl der Schritte pro
Dabei ist zu beachten, dass die Anzahl der Schritte pro
Epoche für die Validierungsmenge gedrittelt wird, da
die Trainingsmenge $\frac{3}{5}$ des Datensatzes ausmacht die Validierungsmenge
hingegen nur $\frac{1}{5}$ wird
......@@ -230,7 +229,17 @@ zurückliefert.
Positiv &0.0316& 0.1316& 0.8367\\
\end{tabular}
\end{center}
\label{tab:conf_w_cnn}
\caption{Konfusionsmatrix mit Klassengewichtung}
\label{tab:conf_w_cnn}
\end{table}
\wip{Tabelle auswerten!}
Aus der Tabelle \ref{tab:conf_w_cnn} lässt sich ablesen, dass negative Bewertungen zu $83.14\%$ richtig als
negative Bewertung klassifiziert werden, zu $13.77\%$ als neutrale Bewertung und zu $3.08\%$
als positive Bewertung.
Neutrale Bewertungen werden zu $63.54\%$ richtig als neutrale Bewertung klassifiziert, zu $19.70\%$
als positive Bewertung und zu $16.76\%$ als negative Bewertung.
Positive Bewertungen werden zu $83.67\%$ richtig
als positive Bewertung klassifiziert, zu $13.16\%$ als neutrale Bewertung und zu $3.16\%$
als negative Bewertung.
\ No newline at end of file
No preview for this file type
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment