Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
teknopedia

teknopedia

teknopedia

teknopedia

teknopedia
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Datenmatrix – Wikipedia
Datenmatrix – Wikipedia
aus Wikipedia, der freien Enzyklopädie

In der Statistik ist die Datenmatrix, auch Versuchsplanmatrix,[1] Designmatrix[1] (von englisch research design: deutsch Versuchsplan), Modellmatrix, Beobachtungsmatrix oder Regressormatrix genannt, eine Matrix, die Daten über mehrere Merkmale mehrerer Personen oder Objekte (statistische Einheiten) enthält. Sie ist Grundlage des klassischen Modells der linearen Mehrfachregression.

Der Begriff Versuchsplan- bzw. Designmatrix (bezeichnet mit X {\displaystyle \mathbf {X} } {\displaystyle \mathbf {X} }) kommt aus dem Teilgebiet der statistischen Versuchsplanung, die sich mit dem statistisch optimalen Entwurf von Experimenten beschäftigt (siehe Optimale Versuchsplanung). Wenn die Werte der x i j {\displaystyle x_{ij}} {\displaystyle x_{ij}} geplant sind (vom Forscher festgelegt), enthält die X {\displaystyle \mathbf {X} } {\displaystyle \mathbf {X} }-Matrix im Wesentlichen den Versuchsplan und wird daher manchmal als Versuchsplanmatrix bezeichnet.[2]

Definition

[Bearbeiten | Quelltext bearbeiten]

Geht man davon aus, dass n {\displaystyle n} {\displaystyle n} Untersuchungseinheiten vorliegen, an denen k = p − 1 {\displaystyle k=p-1} {\displaystyle k=p-1} Variablen beobachtet wurden, dann ist der an der i {\displaystyle i} {\displaystyle i}-ten Untersuchungseinheit beobachtete Wert der j {\displaystyle j} {\displaystyle j}-ten Variable x i j {\displaystyle x_{ij}} {\displaystyle x_{ij}}. Die Datenmatrix ist definiert als die n × p {\displaystyle n\times p} {\displaystyle n\times p}-Matrix

X = ( x i j ) n × p = ( 1 x 11 x 12 ⋯ x 1 k 1 x 21 x 22 ⋯ x 2 k ⋮ ⋮ ⋮ ⋱ ⋮ 1 x n 1 x n 2 ⋯ x n k ) {\displaystyle \mathbf {X} =(x_{ij})_{n\times p}={\begin{pmatrix}1&x_{11}&x_{12}&\cdots &x_{1k}\\1&x_{21}&x_{22}&\cdots &x_{2k}\\\vdots &\vdots &\vdots &\ddots &\vdots \\1&x_{n1}&x_{n2}&\cdots &x_{nk}\end{pmatrix}}} {\displaystyle \mathbf {X} =(x_{ij})_{n\times p}={\begin{pmatrix}1&x_{11}&x_{12}&\cdots &x_{1k}\\1&x_{21}&x_{22}&\cdots &x_{2k}\\\vdots &\vdots &\vdots &\ddots &\vdots \\1&x_{n1}&x_{n2}&\cdots &x_{nk}\end{pmatrix}}}.

Die i {\displaystyle i} {\displaystyle i}-te Zeile der Datenmatrix X {\displaystyle \mathbf {X} } {\displaystyle \mathbf {X} } ist der – mit den am i {\displaystyle i} {\displaystyle i}-ten Objekt beobachteten Variablenwerten – gebildete Zeilenvektor x i . ⊤ = ( x i 0 , x i 1 , … , x i k ) {\displaystyle \mathbf {x} _{i\mathbf {.} }^{\top }=(x_{i0},x_{i1},\dotsc ,x_{ik})} {\displaystyle \mathbf {x} _{i\mathbf {.} }^{\top }=(x_{i0},x_{i1},\dotsc ,x_{ik})}, i = 1 , … , n {\displaystyle i=1,\dotsc ,n} {\displaystyle i=1,\dotsc ,n}. Man kann das i {\displaystyle i} {\displaystyle i}-te Objekt geometrisch als Punkt darstellen, indem man die Elemente als Koordinaten eines Punktes in einem p {\displaystyle p} {\displaystyle p}-dimensionalen Merkmalsraum deutet, der von p {\displaystyle p} {\displaystyle p} rechtwinkelig angeordneten Merkmalsachsen aufgespannt wird. Wenn man auf diese Art alle Zeilenvektoren von X {\displaystyle \mathbf {X} } {\displaystyle \mathbf {X} } als Punkte darstellt, ergibt sich eine die Objekte (Untersuchungseinheiten) repräsentierende Verteilung von Punkten im Merkmalsraum.[3]

Ebenso kann man die Datenmatrix als Zusammenfassung der Spaltenvektoren x . j = ( x 1 j , x 2 j , … , x n j ) ⊤ {\displaystyle \mathbf {x} _{\mathbf {.} j}=(x_{1j},x_{2j},\dotsc ,x_{nj})^{\top }} {\displaystyle \mathbf {x} _{\mathbf {.} j}=(x_{1j},x_{2j},\dotsc ,x_{nj})^{\top }}, j = 0 , … , k {\displaystyle j=0,\dotsc ,k} {\displaystyle j=0,\dotsc ,k} deuten. Jeder Spaltenvektor ist einer Variablen X j {\displaystyle X_{j}} {\displaystyle X_{j}} zugeordnet und beinhaltet die an den Untersuchungseinheiten beobachteten Werte dieser Variablen. Mit diesen Werten können die Variablen in einem rechtwinkeligen Koordinatensystem, in dem die Achsen die n {\displaystyle n} {\displaystyle n} Untersuchungseinheiten repräsentieren, als Punkte dargestellt werden. Im von den n {\displaystyle n} {\displaystyle n} Achsen aufgespannten Objektraum lassen sich die Beziehungen zwischen den Variablen veranschaulichen.[4]

Alternative Darstellungen

[Bearbeiten | Quelltext bearbeiten]

Die Datenmatrix X {\displaystyle \mathbf {X} } {\displaystyle \mathbf {X} } kann als eine partitionierte Matrix bezüglich ihrer p = k + 1 {\displaystyle p=k+1} {\displaystyle p=k+1} Spalten ausgedrückt werden als

X = ( 1 , x ( 1 ) , x ( 2 ) , … , x ( k ) ) {\displaystyle \mathbf {X} =(\mathbf {1} ,\mathbf {x} _{(1)},\mathbf {x} _{(2)},\dotsc ,\mathbf {x} _{(k)})} {\displaystyle \mathbf {X} =(\mathbf {1} ,\mathbf {x} _{(1)},\mathbf {x} _{(2)},\dotsc ,\mathbf {x} _{(k)})}.

Die Spalten der Datenmatrix X {\displaystyle \mathbf {X} } {\displaystyle \mathbf {X} } inklusive des Einsvektors 1 {\displaystyle \mathbf {1} } {\displaystyle \mathbf {1} } sind alle n {\displaystyle n} {\displaystyle n}-dimensionale Vektoren und daher Punkte im Datenraum. Da für gewöhnlich angenommen wird, dass X {\displaystyle \mathbf {X} } {\displaystyle \mathbf {X} } von Rang k + 1 {\displaystyle k+1} {\displaystyle k+1} ist, sind die Vektoren linear unabhängig. Die Menge aller möglichen Linearkombinationen der Spalten von X {\displaystyle \mathbf {X} } {\displaystyle \mathbf {X} } bilden eine Teilmenge des Datenraums.[5]

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. ↑ a b design matrix. Glossary of statistical terms. In: International Statistical Institute. 1. Juni 2011, archiviert vom Original (nicht mehr online verfügbar) am 19. September 2013; abgerufen am 19. Mai 2020 (englisch).  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/isi.cbs.nl 
  2. ↑ Rencher, Alvin C., und G. Bruce Schaalje: Linear models in statistics., John Wiley & Sons, 2008., S. 139
  3. ↑ Werner Timischl: Angewandte Statistik. Eine Einführung für Biologen und Mediziner. 3. Auflage. 2013, S. 420.
  4. ↑ Werner Timischl: Angewandte Statistik. Eine Einführung für Biologen und Mediziner. 3. Auflage. 2013, S. 420.
  5. ↑ Rencher, Alvin C., und G. Bruce Schaalje: Linear models in statistics., John Wiley & Sons, 2008., S. 153.
Spezielle Matrizen in der Statistik

Datenmatrix | Produktsummenmatrix | Prädiktionsmatrix | residuenerzeugende Matrix | zentrierende Matrix | Kovarianzmatrix | Korrelationsmatrix | Präzisionsmatrix | Gewichtsmatrix | Restriktionsmatrix | Fisher-Informationsmatrix | Bernoulli-Matrix | Leslie-Matrix | Zufallsmatrix | Übergangsmatrix

Abgerufen von „https://de.teknopedia.teknokrat.ac.id/w/index.php?title=Datenmatrix&oldid=251176824“
Kategorien:
  • Regressionsanalyse
  • Statistischer Grundbegriff
Versteckte Kategorie:
  • Wikipedia:Defekte Weblinks/Ungeprüfte Archivlinks 2024-11

  • indonesia
  • Polski
  • العربية
  • Deutsch
  • English
  • Español
  • Français
  • Italiano
  • مصرى
  • Nederlands
  • 日本語
  • Português
  • Sinugboanong Binisaya
  • Svenska
  • Українська
  • Tiếng Việt
  • Winaray
  • 中文
  • Русский
Sunting pranala
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022
Email: pmb@teknokrat.ac.id