General Linear Models
Die Numerical Algorithms Group
ist seit 1971 Spezialist für Statistik und Datamining. Für
spezielle lineare Modelle für wurde die Software GLIM
entwickelt. Die Lösung für das Problem der Verzerrungen
bei Kontingenztafeln mit leeren Zellen, wurde in Issue
25 unter dem Titel "Calculation of Degrees of Freedom
in Sparse Complete Contingency Tables" publiziert. Der
Aufsatz kann hier im Orginal
(PDF, 257 KB) nachgelesen werden.
Eine spezielle Anwendung linearer Modelle sind Kontingenztafeln.
Sie stellen die empirische Häufigkeiten von zwei oder mehreren
Merkmalen dar. Beispielweise kann mittels einer Umfrage das Verhältnis
zwischen Rauchern und Lungenkarzinomen numerisch dargestellt und
eine statistische Relation hergestellt werden. Im untenstehenden
Beispiel wurden 42 Personen erfasst, die teilweise rauchen und teilweise
an Lungenkrebs erkrankt sind.
| |
Krebs |
|
Summe |
| Raucher |
24 |
|
30 |
| Nichtraucher |
0 |
|
12 |
| Summe |
24 |
18 |
42 |
Da diese Modelle den natürlichen Logarithmus implementieren,
treten bei Samples mit Zellen ohne Vertreter (in unserem Beispiel
Nichtraucher ohne Krebs) rechnerische Probleme auf. Dieses Problem
konnte mit folgenden Macros für GLIM 4.0 gelöst werden.
UEP berechnet die Anzahl der unschätzbaren Parameter in einer
unvollständig besetzten Kontingenztafel.
Argumente:
%1 Name des Parameter
%2 Liste der Faktoren
Output:
Die Anzahl der nichtschätzbaren Parameter in jeder Konfiguration,
die Anzahl der Zellen, Nullen, Faktoren, unschätzbaren und
linear unabhängigen Paramter des gesättigten Modells.
Beispiel:
$ass y=1 2 3 0 0 0 7 8 $
$gfac 8 a 2 b 2 c 2
$list list=a+b+c $
$use uep y list $
Diese Lösung wurde 1997 im GLIM-Newsletter, Issue
25 unter dem Titel "Calculation of Degrees of Freedom
in Sparse Complete Contingency Tables" publiziert. Der
Aufsatz kann hier im Orginal
(PDF, 257 KB) nachgelesen werden.
Die mathematische Herleitung des Algorithmus wurde 1996 an der
WU Wien als Diplomarbeit
eingereicht und von Univ.-Prof.
Dr. Walter Katzenbeiser betreut.
|