Skip to content

Commit 5268201

Browse files
committed
fixed typos and added glossaries
1 parent 1736200 commit 5268201

File tree

10 files changed

+77
-45
lines changed

10 files changed

+77
-45
lines changed

cc_by_sa.jpg

6.52 KB
Loading

discussion.tex

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -8,9 +8,9 @@ \section{Diskussion}
88
Der Vorteil exhaustiver Verfahren gegenüber den standardmässig eingesetzten schrittweisen Verfahren ist, dass das optimale Modell gefunden wird, insbesondere in Kombination mit der Kreuzvalidierung.
99
Der erhöhte Rechenaufwand sollte heutzutage nicht mehr ins Gewicht fallen, insbesondere da in der Psychologie meist nur eine Handvoll Prädikatoren ein Modell beschreiben.
1010

11-
Die explorative Anwendung ist verbreiteter und dient dem schätzen von Modellen ohne klare theoretische Begründung.
12-
Eine Auslese potentieller Prädikatoren sollte möglichst unkorreliert sein um der Multikolinearität vorzubeugen. Bei genügend grossem Stichprobenumfang und einer mässigen Anzahl an potentiellen Prädiktoren führt auch hier das exhaustive Verfahren gefolgt von einer Kreuzvalidierung zur optimalen und stabilsten Vorhersage. In der psychologischen Forschung ist der Stichprobenumfang oft knapp bemessen. Kann aufgrund des Stichprobenumfangs eine Kreuzvalidierung nicht verlässlich geschätzt werden, kommen schrittweise Verfahren zum Einsatz. Dabei werden Prädikatoren schrittweise hinzugefügt oder eliminiert, bis ein zuvor bestimmtes Kriterium nicht mehr erfüllt werden kann. Das Kriterium besagt weshalb und wann ein Modell als akzeptabel zu betrachten ist.
13-
Es soll ein Kriterium herbei gezogen werden, welches die Anzahl der Prädiktoren im Modell berücksichtigt um einer Überanpassung entgegen zu wirken.
11+
Die explorative Anwendung ist verbreiteter und dient dem Schätzen von Modellen ohne klare theoretische Begründung.
12+
Eine Auslese potentieller Prädikatoren sollte möglichst unkorreliert sein um der Multikolinearität vorzubeugen. Bei genügend grossem Stichprobenumfang und einer mässigen Anzahl an potentiellen Prädiktoren führt auch hier das exhaustive Verfahren gefolgt von einer Kreuzvalidierung zur optimalen und stabilsten Vorhersage. In der psychologischen Forschung ist der Stichprobenumfang oft knapp bemessen. Kann aufgrund des Stichprobenumfangs eine Kreuzvalidierung nicht verlässlich geschätzt werden, kommen schrittweise Verfahren zum Einsatz. Dabei werden Prädikatoren schrittweise hinzugefügt oder eliminiert, bis ein zuvor bestimmtes Kriterium nicht mehr erfüllt werden kann. Das Kriterium besagt weshalb, und wann ein Modell als akzeptabel zu betrachten ist.
13+
Es soll ein Kriterium herbei gezogen werden, welches die Anzahl der Prädiktoren im Modell berücksichtigt um Overfitting entgegen zu wirken.
1414
Akaikes Informationskriterium als zuverlässliches Kriterium schrittweiser Regression erwiesen.
1515

1616
\citeA[p. 57]{harrell2001regression} erwähnte eine ganz generelle Schwierigkeit: ``It allows us to not think about the problem.''.

glossar.tex

Lines changed: 21 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,25 @@
11
\newglossaryentry{glos:rechenaufwand}{name=Rechenaufwand, description={ beschreibt die Komplexität eines Verfahrens. Die Anzahl der Schritte, die für die Berechnung benötigt werden, dient als Kennzahl}}
2+
23
\newglossaryentry{glos:trainingsdatensatz}{name=Trainingsdatensatz, description={liefert die Datenbasis für die Schätzung der Modellparameter}}
4+
35
\newglossaryentry{glos:datamining}{name=Datamining,description={Systematische Anwendung statistischer Methoden auf einen grossen Datenbestand mit dem Ziel, neue Muster zu erkennen}}
6+
47
\newglossaryentry{glos:praediktorvariable}{ plural={Prädiktorvariablen},name=Prädiktorvariable,description={Erklärende Variable welche eine Wirkung verursacht}}
5-
\newglossaryentry{glos:kriteriumsvariable}{name=Kriteriumsvariable,description={Erklärte Variable welche eine Wirkung misst}}
8+
9+
\newglossaryentry{glos:kriteriumsvariable}{name=Kriteriumsvariable,description={Erklärte Variable welche eine Wirkung misst}}
10+
11+
\newglossaryentry{glos:kreuzvalidierung}{name=Kreuzvalidierung,description={ bezeichnet Verfahren bei denen die Vorhersagezuverlässigkeit eines Modells anhand von unabhängigen Teilstichproben bestimmt wird}}
12+
13+
\newglossaryentry{glos:exhaustive Verfahren}{name=exhaustive Verfahren,description={ rechnen alle möglichen Modelle anhand der potentiellen Prädiktoren durch}}
14+
15+
\newglossaryentry{glos:schrittweise Verfahren}{name=schrittweise Verfahren,description={rechnen Modelle durch schrittweise Hinzunahme beziehungsweise Weglassen potentieller Prädiktoren}}
16+
17+
\newglossaryentry{glos:Modellguete}{name=Modellgüte,description={beschreibt, wie gut ein Modell gegebene Daten Vorhersagen kann}}
18+
19+
\newglossaryentry{glos:Overfitting}{name=Overfitting,description={beschreibt eine mangelnde Generalisierbarkeit aufgrund eines Modells, das zu sehr an die Trainingsstichprobe angepasst ist}}
20+
21+
\newglossaryentry{glos:Multikollinearitaet}{name=Multikollinearität,description={ ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr Prädiktoren stark miteinander korrelieren}}
22+
23+
\newglossaryentry{glos:Stabilitaet}{name=Stabilität,description={ beschreibt wie stark die Vorhersagen eines Modells im Generellen variieren}}
24+
25+
\newglossaryentry{glos:Maximum-Likelihood-Methode}{name=Maximum-Likelihood-Methode,description={ wird benützt, um die unbekannten Parameter einer Funktion aus gemessenen Daten zu bestimmen}}

introduction.tex

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -10,11 +10,11 @@ \section{Einführung}
1010
\end{equation}
1111
Beim klassisch hypothesengeleiteten Vorgehen wird eine Hypothese definiert, welche empirisch getestet wird.
1212
Der empirische Test wiederum ist ein Modell, in unserem Fall eine Regressionsgleichung, welche aufgrund theoretischer Überlegungen erstellt wurde.
13-
Wenn es jedoch keine klaren theoretischen Gründe gibt potentielle Prädiktorvariablen in das Modell auf zu nehmen, werden mehrere Modelle geschätzt und jenes mit der besten und stabilsten Vorhersagekraft verwendet.
13+
Wenn es jedoch keine klaren theoretischen Gründe gibt potentielle Prädiktorvariablen in das Modell aufzunehmen, werden mehrere Modelle geschätzt und jenes mit der besten und stabilsten Vorhersagekraft verwendet.
1414
Bei komplexen Modellen mit vielen Prädiktoren werden Modelle mittels automatischer Verfahren geschätzt und selektiert.
1515
Ein zentrales Problem solcher Verfahren ist, dass sie dazu neigen zu komplexe Modelle zu schätzen.
16-
Komplexe Modelle können sehr gute Vorhersagen innerhalb des Trainingsdatensatzes liefern, doch scheitern diese generelle Vorhersagen zu treffen.
16+
Komplexe Modelle können sehr gute Vorhersagen innerhalb des \Gls{glos:trainingsdatensatz}es liefern, doch scheitern gern beim Versuch generelle Vorhersagen zu treffen.
1717

1818
Im folgenden wird diskutiert wann und weshalb automatische Verfahren zur Modellwahl eingesetzt werden.
1919
Anschliessend wird das exhaustive und schrittweise Verfahren vorgestellt und kritisch diskutiert.
20-
Die Frage nach der Generalisierbarkeit automatisch geschätzter Modelle wird im Anschluss besprochen und die Kreuzvalidierung als Lösungsansatz genannt.
20+
Die Frage nach der Generalisierbarkeit automatisch geschätzter Modelle wird im Anschluss besprochen und die \Gls{glos:kreuzvalidierung} als Lösungsansatz genannt.

main.pdf

9.91 KB
Binary file not shown.

main.tex

Lines changed: 12 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,5 @@
11
\documentclass[german,12pt,doc]{apa}
22
\usepackage[a4paper, left=25mm, right=40mm]{geometry}
3-
43
\usepackage{apacite}
54
\usepackage{amsmath}
65
\usepackage[german]{babel}
@@ -13,10 +12,11 @@
1312
\SetWatermarkLightness{0.8}
1413
\usepackage{setspace}
1514
\usepackage{graphicx}
15+
1616
\usepackage{caption}
1717
\usepackage{prettyref}
1818

19-
\usepackage[nonumberlist]{glossaries}
19+
\usepackage[nonumberlist,sanitize={name=false}]{glossaries}
2020
\makeglossaries
2121

2222
\onehalfspacing
@@ -25,6 +25,7 @@
2525

2626
\usepackage[utf8]{inputenc}
2727

28+
2829
\usepackage[]{blindtext}
2930
\rightheader{Automatisierte Verfahren zur Prädiktorauswahl}
3031
% Hurenkinder und Schusterjungen verhindern
@@ -38,10 +39,14 @@
3839
\shorttitle{Prädiktorauswahl in Regressionsmodellen}
3940
\author{Literaturarbeit vorgelegt von \\ Markus Graf (markus.graf@uzh.ch)}
4041
\date{\today}
41-
\affiliation{am Psychologisches Institut der Universität Zürich\\ Betreut durch Dr. Christina Werner}
42-
\abstract{Ziel der multiplen Regression ist es Kriteriumsvariablen durch mehrere Prädiktorvariablen möglichst gut vorherzusagen. In diesem Kontext kommen Automatische Verfahren zur Prädiktorauswahl zur Anwendung, wenn für die Schätzung des Modells viele potentielle Prädikatoren zur Auswahl stehen, insbesondere wenn theoretische Grundlagen fehlen. Das exhaustive Verfahren in Kombination mit der Kreuzvalidierung ist die einzige Technik, die das beste und stabilste Modell findet. Schrittweise Verfahren kommen zur Anwendung bei kleinem Stichprobenumfang. Während früher aus Mangel an Rechenleistung standardmässig schrittweise Verfahren angewandt wurden soll heutzutage dem rechenintensiven exhaustiven Verfahren bevorzugt werden.
42+
\affiliation{am Psychologisches Institut der Universität Zürich\\ Betreut durch Dr. Christina Werner\\ \today}
43+
\abstract{Ziel der multiplen Regression ist es Kriteriumsvariablen durch mehrere Prädiktorvariablen möglichst gut vorherzusagen. In diesem Kontext kommen Automatische Modellwahlverfahren zur Anwendung, wenn für die Schätzung des Modells viele potentielle Prädikatoren zur Auswahl stehen, insbesondere wenn theoretische Grundlagen fehlen. Das exhaustive Verfahren in Kombination mit der Kreuzvalidierung ist momentan die einzige Technik, die das beste und stabilste Modell findet. Schrittweise Verfahren kommen zur Anwendung bei kleinem Stichprobenumfang. Während früher aus Mangel an Rechenleistung standardmässig schrittweise Verfahren angewandt wurden soll heutzutage dem rechenintensiven exhaustiven Verfahren bevorzugt werden.
4344
}
4445
\maketitle
46+
\begin{center}
47+
\includegraphics[width=0.1\textwidth]{cc_by_sa.jpg}\\
48+
Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Unported Lizenz.
49+
\end{center}
4550
\setlength{\parindent}{0pt}
4651
\newpage
4752
\tableofcontents
@@ -59,12 +64,15 @@
5964

6065

6166
\input{discussion}
67+
6268
\newpage
6369
\printglossaries
6470
%\addcontentsline{toc}{chapter}{Glossar}
6571
\newpage
6672
\bibliographystyle{apacite}
6773
\bibliography{literature}
74+
75+
6876
\newpage
6977
\section{Anhang}
7078
\subsection*{Selbstständigkeitserklärung zur Literaturarbeit am Psychologischen Institut}

0 commit comments

Comments
 (0)