Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Schematheorem – Wikipedia
Schematheorem – Wikipedia 👆 Click Here!
aus Wikipedia, der freien Enzyklopädie

Das Schematheorem nach John H. Holland behandelt das Konvergenzverhalten genetischer Algorithmen. Das Theorem beweist, dass sich Individuen mit überdurchschnittlicher Fitness mit höherer Wahrscheinlichkeit durchsetzen.[1]

Herleitung

[Bearbeiten | Quelltext bearbeiten]

Das Schematheorem betrachtet das Genom eines Individuums, in der Regel also eine Bitkette, die Werte kodiert. Zunächst muss der Begriff Schema erläutert werden: Ein Schema ist ein Bitmuster, das eine Menge von Bitketten repräsentiert. Ein Schema besteht aus den Zeichen 0 1 oder #. Das Zeichen # fungiert als Platzhalter für eine 0 oder 1.

Beispielsweise repräsentiert das Schema # 101 # {\displaystyle \#101\#} {\displaystyle \#101\#} die folgende Menge von Bitketten: { 01010 , 01011 , 11011 , 11010 } {\displaystyle \{01010,01011,11011,11010\}} {\displaystyle \{01010,01011,11011,11010\}}.

Das Schematheorem berechnet nun den Erwartungswert dafür, dass ein gewisses Schema H {\displaystyle H} {\displaystyle H} von einer Generation zur nächsten „überlebt“. Hierzu werden die drei zentralen Schritte eines Genetischen Algorithmus untersucht:

  • Selektion
  • Crossover (Rekombination)
  • Mutation

Es wird eine Population bestehend aus N {\displaystyle N} {\displaystyle N} binären Genomen der Länge l {\displaystyle l} {\displaystyle l} zu einem Zeitpunkt t {\displaystyle t} {\displaystyle t} betrachtet. Die verwendete Fitnessfunktion f {\displaystyle f} {\displaystyle f} sei normiert und für alle Bitketten der Länge l {\displaystyle l} {\displaystyle l} definiert.

Im Zuge der Herleitung werden folgende Definitionen verwendet:

o ( H , t ) {\displaystyle o(H,t)} {\displaystyle o(H,t)}
Anzahl der Genome zum Zeitpunkt t {\displaystyle t} {\displaystyle t}, die das Schema H {\displaystyle H} {\displaystyle H} enthalten.
d ( H ) {\displaystyle d(H)} {\displaystyle d(H)}
Durchmesser des Schemas H {\displaystyle H} {\displaystyle H}, definiert als Länge der kürzesten Teilkette, die noch alle festen Bits des Schemas enthält, z. B d ( # 0101 # # 1 # # ) = 7 {\displaystyle d(\#0101\#\#1\#\#)=7} {\displaystyle d(\#0101\#\#1\#\#)=7}.
b ( H ) {\displaystyle b(H)} {\displaystyle b(H)}
Anzahl der festen Bits in H {\displaystyle H} {\displaystyle H}, z. B. b ( # # 0 # # 11 # ) = 3 {\displaystyle b(\#\#0\#\#11\#)=3} {\displaystyle b(\#\#0\#\#11\#)=3}

Selektion

[Bearbeiten | Quelltext bearbeiten]

Da die Fitness normiert ist, gilt für die Wahrscheinlichkeit p {\displaystyle p} {\displaystyle p}, dass eine bestimmte Elternkette H i {\displaystyle H_{i}} {\displaystyle H_{i}} aus einer Population ausgewählt wird: p ( H i ) = f ( H i ) {\displaystyle p(H_{i})=f(H_{i})} {\displaystyle p(H_{i})=f(H_{i})}

Seien nun ohne Einschränkung H 1 , … , H o ( H , t ) {\displaystyle H_{1},\dotsc ,H_{o(H,t)}} {\displaystyle H_{1},\dotsc ,H_{o(H,t)}} alle diejenigen Bitketten der Population zur Zeit t {\displaystyle t} {\displaystyle t}, die das Schema H {\displaystyle H} {\displaystyle H} enthalten.

Die Fitness des Schemas H {\displaystyle H} {\displaystyle H} wird dann definiert als Durchschnitt der Fitness aller Individuen: f ( H ) = f ( H 1 ) + … + f ( H o ( H , t ) ) o ( H , t ) {\displaystyle f(H)={\frac {f(H_{1})+\dotsc +f(H_{o(H,t)})}{o(H,t)}}} {\displaystyle f(H)={\frac {f(H_{1})+\dotsc +f(H_{o(H,t)})}{o(H,t)}}}.

Die Wahrscheinlichkeit, dass eine Kette ausgewählt wird, die H {\displaystyle H} {\displaystyle H} enthält, ist somit: P S e l = p ( H 1 ) + … + p ( H o ( H , t ) ) = o ( H , t ) f ( H ) . {\displaystyle P_{Sel}=p(H_{1})+\dotsc +p(H_{o(H,t)})=o(H,t)f(H).} {\displaystyle P_{Sel}=p(H_{1})+\dotsc +p(H_{o(H,t)})=o(H,t)f(H).}

Für die Wahrscheinlichkeit, dass zwei Elternketten, die beide H {\displaystyle H} {\displaystyle H} enthalten, ausgewählt werden, gilt: P 2 = P S e l 2 {\displaystyle P_{2}={P_{Sel}}^{2}} {\displaystyle P_{2}={P_{Sel}}^{2}}.

Rekombination (Crossover)

[Bearbeiten | Quelltext bearbeiten]

Beim 1-Point-Rekombination wird zunächst ein Trennpunkt zwischen den Bitstellen 1 und l-1 gewählt. Falls beide Elternteile H {\displaystyle H} {\displaystyle H} enthalten, so enthält auch die Tochterkette dieses Schema. Enthält nur eine Elternkette das Schema, so wird H {\displaystyle H} {\displaystyle H} im Mittel in der Hälfte der Fälle weitergegeben, falls es nicht beim Crossover selbst durchtrennt wird.

Die Wahrscheinlichkeit, dass es nicht durchtrennt wird, ist: P C u t ¯ = 1 − d ( H ) − 1 l − 1 . {\displaystyle {\overline {P_{Cut}}}=1-{\frac {d(H)-1}{l-1}}.} {\displaystyle {\overline {P_{Cut}}}=1-{\frac {d(H)-1}{l-1}}.}

Damit gilt für die Wahrscheinlichkeit W {\displaystyle W} {\displaystyle W}, dass beim Crossover das Schema H {\displaystyle H} {\displaystyle H} weitergegeben wird: W ≥ P 2 + 1 2 P 1 P C u t ¯ . {\displaystyle W\geq P_{2}+{\frac {1}{2}}P_{1}{\overline {P_{Cut}}}.} {\displaystyle W\geq P_{2}+{\frac {1}{2}}P_{1}{\overline {P_{Cut}}}.}

Falls beim Crossover das Schema H {\displaystyle H} {\displaystyle H} durchtrennt wird, besteht die Möglichkeit, dass das fehlende Teilstück an passender Stelle in der anderen Elternkette enthalten ist. Daher rührt die Ungleichung. Falls 2-Point-Crossover durchgeführt wird, hat das lediglich Auswirkungen auf P C u t {\displaystyle P_{Cut}} {\displaystyle P_{Cut}}, die Wahrscheinlichkeit, dass das Schema durchtrennt wird, steigt.

Mutation

[Bearbeiten | Quelltext bearbeiten]

Sei p {\displaystyle p} {\displaystyle p} die Mutationswahrscheinlichkeit, das heißt, jedes Bit der neuen Kette wird mit der Wahrscheinlichkeit p {\displaystyle p} {\displaystyle p} negiert. Dies bedeutet, dass das Schema H {\displaystyle H} {\displaystyle H} mit b ( H ) {\displaystyle b(H)} {\displaystyle b(H)} festen Bits mit der Wahrscheinlichkeit P M u t ¯ = ( 1 − p ) b ( H ) {\displaystyle {\overline {P_{Mut}}}=(1-p)^{b(H)}} {\displaystyle {\overline {P_{Mut}}}=(1-p)^{b(H)}} erhalten bleibt.

Wird dieser Effekt berücksichtigt, so ergibt sich für die Wahrscheinlichkeit W ′ {\displaystyle W'} {\displaystyle W'}, dass eine durch die Operatoren Crossover und Mutation erzeugte Kette das Schema H {\displaystyle H} {\displaystyle H} enthält:

W ′ = W P M u t ¯ {\displaystyle W'=W{\overline {P_{Mut}}}} {\displaystyle W'=W{\overline {P_{Mut}}}}

W ′ ≥ ( P 2 + 1 2 P 1 P C u t ¯ ) P M u t ¯ {\displaystyle W'\geq \left(P_{2}+{\frac {1}{2}}P_{1}{\overline {P_{Cut}}}\right){\overline {P_{Mut}}}} {\displaystyle W'\geq \left(P_{2}+{\frac {1}{2}}P_{1}{\overline {P_{Cut}}}\right){\overline {P_{Mut}}}}

W ′ ≥ ( P S e l 2 + P S e l ( 1 − P S e l ) ( 1 − d ( H ) − 1 l − 1 ) ) ( 1 − p ) b ( H ) . {\displaystyle W'\geq \left(P_{Sel}^{2}+P_{Sel}\left(1-P_{Sel}\right)\left(1-{\frac {d(H)-1}{l-1}}\right)\right)(1-p)^{b(H)}\,.} {\displaystyle W'\geq \left(P_{Sel}^{2}+P_{Sel}\left(1-P_{Sel}\right)\left(1-{\frac {d(H)-1}{l-1}}\right)\right)(1-p)^{b(H)}\,.}

Mit P S e l = o ( H , t ) f ( H ) {\displaystyle P_{Sel}=o(H,t)f(H)} {\displaystyle P_{Sel}=o(H,t)f(H)}.

Fazit

[Bearbeiten | Quelltext bearbeiten]

Werden also insgesamt N {\displaystyle N} {\displaystyle N} neue Ketten erzeugt, so gilt für den Erwartungswert der Anzahl der Ketten, die das Schema H {\displaystyle H} {\displaystyle H} zum Zeitpunkt t + 1 {\displaystyle t+1} {\displaystyle t+1} enthalten: ⟨ o ( H , t + 1 ) ⟩ = N W ′ {\displaystyle \langle o(H,t+1)\rangle =NW'} {\displaystyle \langle o(H,t+1)\rangle =NW'}

Die letzten beiden Formeln zeigen, dass Schemata mit überdurchschnittlicher Fitness und kleinem Durchmesser sich mit großer Wahrscheinlichkeit durchsetzen. Die Reproduktionswahrscheinlichkeit steigt aber auch mit der Häufigkeit eines Schemas o ( H , t ) {\displaystyle o(H,t)} {\displaystyle o(H,t)}. Das heißt, ein durchschnittliches Schema kann sich innerhalb einer Population durchsetzen, wenn es oft genug vorkommt. Dieser Effekt wird genetisches Driften genannt.

Weiterhin verdient der Faktor P M u t ¯ = ( 1 − p ) b ( H ) {\displaystyle {\overline {P_{Mut}}}=(1-p)^{b(H)}} {\displaystyle {\overline {P_{Mut}}}=(1-p)^{b(H)}} Beachtung. Eine hohe Mutationsrate p {\displaystyle p} {\displaystyle p} bewirkt eine verstärkte Destruktion erfolgreicher Muster. Andererseits ist eine gewisse Mutationshäufigkeit nötig, um den Suchraum möglichst umfassend zu durchsuchen. Durch Justierung von p {\displaystyle p} {\displaystyle p} kann also die Suchaktivität des Algorithmus gesteuert werden.

Literatur

[Bearbeiten | Quelltext bearbeiten]
  • David White: An Overview of Schema Theory. In: Graduate Journal of Mathematics. Band 3, Nr. 2, 2018, S. 37–59, doi:10.48550/arXiv.1401.2651. 

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. ↑ John H. Holland: Adaptation in natural and artificial systems : an introductory analysis with applications to biology, control, and artificial intelligence. 1st MIT Press ed Auflage. MIT Press, Cambridge, Mass. 1992, ISBN 0-585-03844-9. 
Abgerufen von „https://de.teknopedia.teknokrat.ac.id/w/index.php?title=Schematheorem&oldid=231589854“
Kategorien:
  • Evolutionärer Algorithmus
  • Satz (Mathematik)

  • indonesia
  • Polski
  • العربية
  • Deutsch
  • English
  • Español
  • Français
  • Italiano
  • مصرى
  • Nederlands
  • 日本語
  • Português
  • Sinugboanong Binisaya
  • Svenska
  • Українська
  • Tiếng Việt
  • Winaray
  • 中文
  • Русский
Sunting pranala
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022
Email: pmb@teknokrat.ac.id