mirror of https://github.com/2martens/uni.git
[FGI3] Finished paper
Signed-off-by: Jim Martens <github@2martens.de>
This commit is contained in:
parent
a1969b145e
commit
69580a86d3
|
@ -55,4 +55,108 @@
|
|||
timestamp = {2016.11.12},
|
||||
}
|
||||
|
||||
@InProceedings{Doerr2010,
|
||||
author = {Benjamin Doerr and Leslie Ann Goldberg and Lorenz Minder and Thomas Sauerwald and Christian Scheideler},
|
||||
title = {Stabilizing {C}onsensus with the {P}ower of {T}wo {C}hoices},
|
||||
booktitle = {Algorithmic Methods for Distributed Cooperative Systems},
|
||||
year = {2010},
|
||||
editor = {S{\'a}ndor Fekete and Stefan Fischer and Martin Riedmiller and Suri Subhash},
|
||||
number = {09371},
|
||||
series = {Dagstuhl Seminar Proceedings},
|
||||
publisher = {Schloss Dagstuhl - Leibnitz-Zentrum für Informatik, Deutschland},
|
||||
file = {:/home/jim/Documents/Studium/WS2016_17/FGI3/Seminar/Literatur/Stabilizing-Consensus-with-power-of-two-choices.pdf:PDF},
|
||||
owner = {jim},
|
||||
timestamp = {2017.02.04},
|
||||
}
|
||||
|
||||
@InProceedings{Ben-Or1983,
|
||||
author = {Michael Ben-Or},
|
||||
title = {Another advantage of free choice: Completely asynchronous agreement protocols},
|
||||
booktitle = {Proceedings of the 2nd ACM symposium on PODC},
|
||||
year = {1983},
|
||||
pages = {27--30},
|
||||
owner = {jim},
|
||||
timestamp = {2017.02.04},
|
||||
}
|
||||
|
||||
@InProceedings{Rabin1983,
|
||||
author = {Michael O. Rabin},
|
||||
title = {Randomized byzantine generals},
|
||||
booktitle = {Proc. of the 24th IEEE Symp. on Foundations of Computer Science (FOCS)},
|
||||
year = {1983},
|
||||
pages = {403--409},
|
||||
publisher = {IEEE},
|
||||
owner = {jim},
|
||||
timestamp = {2017.02.04},
|
||||
}
|
||||
|
||||
@Article{Feldman1997,
|
||||
author = {Pesech Feldman and Silvio Micali},
|
||||
title = {An optimal probabilistic protocol for synchronous Byzantine agreement},
|
||||
journal = {SIAM Journal on Computing},
|
||||
year = {1997},
|
||||
volume = {26},
|
||||
number = {4},
|
||||
pages = {873--933},
|
||||
owner = {jim},
|
||||
timestamp = {2017.02.04},
|
||||
}
|
||||
|
||||
@InProceedings{Canetti1993,
|
||||
author = {Ran Canetti and Tal Rabin},
|
||||
title = {Fast asynchronous {B}yzantine agreement with optimal resilience},
|
||||
booktitle = {Proc. of the 25th ACM symp. on Theory of computing},
|
||||
year = {1993},
|
||||
pages = {42--51},
|
||||
owner = {jim},
|
||||
timestamp = {2017.02.04},
|
||||
}
|
||||
|
||||
@Article{Katz2009,
|
||||
author = {Jonathan Katz and Chiu-Yuen Koo},
|
||||
title = {On expected constant-round protocols for {B}yzantine agreement},
|
||||
journal = {Journal of Computer and System Sciences International},
|
||||
year = {2009},
|
||||
volume = {75},
|
||||
number = {2},
|
||||
pages = {91--112},
|
||||
month = feb,
|
||||
owner = {jim},
|
||||
timestamp = {2017.02.04},
|
||||
}
|
||||
|
||||
@InProceedings{Feige1999,
|
||||
author = {U. Feige},
|
||||
title = {Noncryptographic selection protocols},
|
||||
booktitle = {Proc. of the 40th IEEE Symp. on Foundations of Computer Science (FOCS)},
|
||||
year = {1999},
|
||||
pages = {142--153},
|
||||
publisher = {IEEE},
|
||||
owner = {jim},
|
||||
timestamp = {2017.02.04},
|
||||
}
|
||||
|
||||
@InProceedings{Ben-Or2006,
|
||||
author = {Michael Ben-Or and Elan Pavlov and Vinod Vaikuntanathan},
|
||||
title = {Byzantine agreement in the full-information model in O(log n) rounds},
|
||||
booktitle = {Proc. of the 38th ACM symp. on Theory of computing},
|
||||
year = {2006},
|
||||
pages = {179--186},
|
||||
month = may,
|
||||
owner = {jim},
|
||||
timestamp = {2017.02.04},
|
||||
}
|
||||
|
||||
@Article{Chor1994,
|
||||
author = {Benny Chor and Amos Israeli and Ming Li},
|
||||
title = {Wait-{F}ree {C}onsensus {U}sing {A}synchronous {H}ardware},
|
||||
journal = {SIAM Journal on Computing},
|
||||
year = {1994},
|
||||
volume = {23},
|
||||
number = {4},
|
||||
pages = {701--712},
|
||||
owner = {jim},
|
||||
timestamp = {2017.02.04},
|
||||
}
|
||||
|
||||
@Comment{jabref-meta: databaseType:bibtex;}
|
||||
|
|
|
@ -4,6 +4,7 @@
|
|||
\usepackage{amsthm}
|
||||
\usepackage[ngerman]{babel}
|
||||
\usepackage[utf8]{inputenc}
|
||||
\usepackage{textcomp}
|
||||
\usepackage[T1]{fontenc}
|
||||
\usepackage[
|
||||
backend=biber,
|
||||
|
@ -47,7 +48,10 @@ citestyle=ieee
|
|||
\maketitle
|
||||
|
||||
\begin{abstract}
|
||||
TODO
|
||||
In dieser Arbeit wird die Lösung des Konsensproblems mittels des Medianverfahrens,
|
||||
wie von Doerr et al\cite{Doerr2011} beschrieben, aufgezeigt. Ebenfalls wird
|
||||
ein Teil des Beweises von Doerr et al erläutert und an vielen Stellen um die
|
||||
im Original fehlenden Rechenwege ergänzt.
|
||||
\end{abstract}
|
||||
|
||||
\tableofcontents
|
||||
|
@ -217,6 +221,11 @@ Doerr et al\cite{Doerr2011} haben folgende Ergebnisse für den worst-case gezeig
|
|||
Diese Ergebnisse basieren auf den zugrundeliegenden Theoremen, welche hier ohne
|
||||
Beweis vorgestellt werden sollen. Dabei bedeutet "mit hoher Wahrscheinlichkeit"
|
||||
stets eine Wahrscheinlichkeit von $1 - n^{-c}$ für eine Konstante $c > 1$.
|
||||
Die drei folgenden Theoreme wurden der Version des Papers, wie sie
|
||||
von Dagstuhl abrufbar ist\cite{Doerr2010}, entnommen. Dies geschah vor dem
|
||||
Hintergrund, dass sie im Grunde das Gleiche aussagen, wie jene in der ansonsten
|
||||
verwendeten Paperversion\cite{Doerr2011}, allerdings besser verständlich
|
||||
formuliert sind.
|
||||
|
||||
\begin{theorem}
|
||||
Für jeden Startzustand gilt, dass die Medianregel ohne Gegner mit hoher
|
||||
|
@ -284,7 +293,7 @@ Die Grobstruktur des Beweises für die drei Theoreme ist relativ einfach.
|
|||
Zunächst wird der Fall mit nur 2 Werten gezeigt. Anschließend wird der Fall für
|
||||
beliebig viele Werte darauf zurückgeführt.
|
||||
|
||||
Für den Fall von nur 2 Fällen bzw. Eimern, gilt eine weitere Sache. In diesem
|
||||
Für den Fall von nur 2 Werten bzw. Eimern, gilt eine weitere Sache. In diesem
|
||||
Fall ist die Anwendung des Median gleichbedeutend mit der Mehrheitsregel. Die
|
||||
Mehrheitsregel besagt, dass der neue Eimer des aktuell betrachteten Balls derjenige
|
||||
wird, in dem die Mehrheit der drei dafür relevanten Bälle liegt. Diese drei Bälle
|
||||
|
@ -302,20 +311,333 @@ Konsens zu erreichen.
|
|||
|
||||
Bei genauerer Betrachtung entspricht dieses Theorem nahezu Theorem 2, nur dass
|
||||
hier explizit von zwei möglichen Werten statt von einer konstanten Menge an
|
||||
möglichen Werten die Rede ist.
|
||||
möglichen Werten die Rede ist. Der folgende Beweis hat zum Ziel dieses Theorem
|
||||
zu beweisen.
|
||||
|
||||
Zu Beginn des Beweises werden ein paar Notationen bzw. Variablen eingeführt,
|
||||
die dann im weiteren Verlauf verwendet werden. Mit $L_t$ wird die Anzahl an Bällen
|
||||
im linken Eimer am Ende von Zeitschritt $t$ bezeichnet. $R_t$ ist entsprechend
|
||||
das Gleiche für den rechten Eimer. Mit $X_t = min(L_t, R_t)$ wird die geringere
|
||||
Anzahl an Bällen bezeichnet. $Y_t = max(L_t, R_t)$ bezeichnet entsprechend die
|
||||
höhere Anzahl an Bällen. Wenn der linke Eimer also 10 und der rechte Eimer 20
|
||||
Bälle hat, wäre $L_t = 10$, $R_t = 20$, $X_t = 10$ und $Y_t = 20$. Hätte der
|
||||
linke Eimer 20 Bälle und rechte nur 10, dann wären die Werte von $L_t$ und $R_t$
|
||||
vertauscht, die Werte von $X_t$ und $Y_t$ blieben jedoch identisch. Der Einfachheit
|
||||
halber wird nur der Beweis für eine gerade Gesamtanzahl an Bällen ($n$) gezeigt.
|
||||
Laut Doerr et al verläuft der Beweis für ungerade $n$ gleichermaßen.
|
||||
Außerdem wird noch ein Ungleichgewicht $\Delta_t = \frac{(Y_t - X_t)}{2}$ definiert.
|
||||
Mit $\overset{\sim}{\Delta_t}$ und $\overset{\sim}{X_t}$ werden die entsprechenden Werte
|
||||
beschrieben, bevor der Gegner am Ende eines Zeitschritts die Bälle in andere Eimer
|
||||
werfen kann.
|
||||
|
||||
Basierend auf dem Ungleichgewicht, welches immer ein positiver Integer ist,
|
||||
werden die bereits angesprochenen drei Fälle unterschieden.
|
||||
|
||||
\textbf{Fall 1: \(\Delta_t \geq \frac{n}{4}\)}
|
||||
|
||||
Diese Bedingung bedeutet, dass ein Eimer signifikant mehr Bälle enthält als der
|
||||
andere. Die Belegung der Eimer mit dem geringst möglichen Ungleichgewicht
|
||||
(möglichst nah an $\frac{n}{4}$ dran) wäre die Folgende:
|
||||
Der eine Eimer enthält $\frac{3}{4}$ Bälle und der andere $\frac{1}{4}$.
|
||||
Das entspräche der Untergrenze dieses Falls.
|
||||
|
||||
Der Beweis dieses Falls wird mit einem Lemma begonnen.
|
||||
|
||||
\begin{lemma}
|
||||
Wenn es einen Zeitschritt $t_0$ mit $\Delta_{t_0} \geq \frac{n}{4}$ gibt,
|
||||
dann gibt es einen Zeitschritt $t_1 = t_0 + O(\log \log n)$ in welchem mit
|
||||
hoher Wahrscheinlichkeit ohne ein Gegner ein stabiler Konsens und mit einem
|
||||
beliebigen $\sqrt{n}$-starken Gegner ein fast stabiler Konsens erreicht wird.
|
||||
\end{lemma}
|
||||
|
||||
Dieses Lemma besagt, dass wenn die Bedingung für den Eintritt in diesen Fall
|
||||
in einem Zeitschritt gegeben ist, nach $O(\log \log n)$ Schritten ein Zeitschritt
|
||||
erreicht wird, in dem ein stabiler bzw. fast stabiler Konsens vorhanden ist.
|
||||
|
||||
Es wird ohne Einschränkung der Allgemeinheit für den Beweis angenommen, dass im
|
||||
linken Eimer weniger Bälle sind, das also $L_t = X_t$ und $R_t = Y_t$ gelten.
|
||||
Außerdem gilt aufgrund der Fallbedingung $X_t \leq \frac{n}{4}$. Als Zeitschritt
|
||||
$t_0$ aus dem Lemma wird der Einfachheit halber der initiale Zeitschritt $0$
|
||||
angenommen. Für jeden Zeitschritt $t$ sei $p_t = \frac{L_t}{n}$ definiert.
|
||||
|
||||
Der Beweis wird zunächst für den Fall ohne Gegner geführt. Zuerst wird der
|
||||
Erwartungswert für die Anzahl an Bällen im linken Eimer in Abhängigkeit zur Zeit
|
||||
berechnet. Dieser Erwartungswert alleine sagt jedoch noch recht wenig darüber aus,
|
||||
wie sich die einzelnen Ballmengen zu diesem Wert verhalten. Wenn es nur Ausreißer
|
||||
nach unten und oben gibt (minimal bzw. maximal mögliche Anzahl pro Schritt),
|
||||
dann käme beim Erwartungswert immer noch der Mittelwert heraus, nur wäre der
|
||||
nicht repräsentativ für die tatsächlichen Mengen an Bällen im linken Eimer.
|
||||
|
||||
Daher wird mittels einer Chernoff-Schranke gezeigt, wie wahrscheinlich es ist,
|
||||
in einem Zeitschritt von dem Erwartungswert um mehr als dessen Hälfte abzuweichen.
|
||||
Das Ergebnis dieser Berechnung ist, dass die Wahrscheinlichkeit davon sehr gering
|
||||
ist, wenn im vorigen Schritt mindestens $O(\sqrt{n \log n})$ Bälle im linken
|
||||
Eimer waren. Somit kann gesagt werden, dass mit einer hohen Wahrscheinlichkeit
|
||||
der Erwartungswert auch tatsächlich die einzelnen Werte repräsentiert.
|
||||
|
||||
Um zu zeigen, dass tatsächlich $\log \log n$ Schritte nötig sind, bis nur noch
|
||||
$O(\sqrt{n \log n})$ Bälle im linken Eimer vorhanden sind, werden die folgenden
|
||||
mathematischen Berechnungen herangezogen, die im Paper leider nicht ausgeführt
|
||||
werden.
|
||||
|
||||
\begin{alignat*}{2}
|
||||
E[L_t] &\leq& \; 3 \cdot \frac{L_{t-1}^2}{n} \\
|
||||
\intertext{Teilen durch $n$, Benutzen der Linearität des Erwartungswerts}
|
||||
\frac{E[L_t]}{n} = E[p_t] &\leq& \; 3 \cdot p_{t-1}^2 =
|
||||
3 \cdot \frac{L_{t-1}^2}{n^2} \\
|
||||
\intertext{Entsprechend der obigen Ausführungen gilt $p_0 = \frac{1}{4}$. Als
|
||||
nächstes gilt es zu berechnen, welchen Wert $p_t$ hat, wenn
|
||||
$L_t \leq O(\sqrt{n \log n})$ gilt. Unter Anwendung der gleichen Umformung
|
||||
ergibt sich Folgendes.}
|
||||
L_t &\leq& O\left(\sqrt{n \log n}\right) \\
|
||||
\frac{L_t}{n} = p_t &\leq& \; O\left(\frac{\sqrt{n}}{n} \cdot \sqrt{\log n} \right)
|
||||
= O\left(\frac{\sqrt{n \log n}}{n} \right) \\
|
||||
&\leq& \; O\left( \frac{\sqrt{n}}{\sqrt{n} \cdot \sqrt{n}} \cdot \sqrt{\log n} \right) \\
|
||||
&\leq& \; O\left( \frac{\sqrt{\log n}}{\sqrt{n}} \right) \\
|
||||
\intertext{Aufgrund der obigen Beobachtungen zum Erwartungswert von $p_t$
|
||||
ist der nachfolgende Wert immer das Quadrat des vorherigen multipliziert mit
|
||||
einer Konstanten. Daraus folgt Nachstehendes.}
|
||||
p_t &=& O\left(\left(\frac{1}{4}\right)^{2^t}\right) \\
|
||||
\intertext{Die Einbeziehung des vorherigen Ergebnisses für $p_t$ führt zu
|
||||
Folgendem.}
|
||||
p_t = O\left(\left(\frac{1}{4}\right)^{2^t}\right) &\leq& O\left( \frac{\sqrt{\log n}}{\sqrt{n}} \right) \\
|
||||
\intertext{Umstellen nach $t$}
|
||||
2^t &\leq& O\left(\log \left(\frac{\sqrt{\log n}}{\sqrt{n}} \right)\right) \\
|
||||
t &\leq& O\left(\log \log \left(\frac{\sqrt{\log n}}{\sqrt{n}}\right) \right) \\
|
||||
&\leq& O\left(\log \log \left(\sqrt{n^{-1}\log n}\right) \right) \\
|
||||
\intertext{Es bleibt nur noch Folgendes zu zeigen.}
|
||||
\sqrt{n^{-1} \log n} &\leq& n \\
|
||||
n^{-1} \log n &\leq& n^2 \\
|
||||
\log n &\leq& n^3
|
||||
\end{alignat*}
|
||||
|
||||
An diesem Punkt kann aufgehört werden, da offenkundig ist, dass auch diese letzte
|
||||
Ungleichung gilt. Damit ist gezeigt, dass $\log \log n$ Schritte benötigt werden,
|
||||
bis nur noch $O(\sqrt{n \log n})$ Bälle im linken Eimer vorhanden sind.
|
||||
|
||||
Im Anschluss an diese Feststellung wird im Paper gezeigt, dass ab dem Zeitschritt
|
||||
$t$ mit maximal $O(\sqrt{n \log n})$ Bällen im linken Eimer, die Wahrscheinlichkeit
|
||||
nach dem nächsten Schritt mindestens $O(\log n)$ Bälle zu haben, sehr gering ist.
|
||||
Schließlich wird mit der Markovungleichung gezeigt, dass sobald die Anzahl maximal
|
||||
$O(\log n)$ Bälle beträgt, es sehr unwahrscheinlich ist, nach einem Schritt noch
|
||||
Bälle im linken Eimer zu haben.
|
||||
|
||||
Zusammengefasst ergeben sich also $\log \log n + 1 + 1$ Schritte, um nach Erreichen
|
||||
der Fallbedingung alle Bälle im rechten Eimer zu haben, was dann den Konsens
|
||||
beschreibt.
|
||||
|
||||
\textbf{Fall 2: $c \sqrt{n \ln n} \leq \Delta_t < \frac{n}{4}$ für genügend großes
|
||||
$c$}
|
||||
|
||||
Auch in diesem Fall wird mit einem Lemma begonnen.
|
||||
|
||||
\begin{lemma}
|
||||
Wenn es einen Zeitschritt $t_0$ mit $c\sqrt{n \ln n} \leq \Delta_{t_0} < \frac{n}{4}$
|
||||
für eine genügend große Konstante $c$ gibt, dann gibt es mit hoher Wahrscheinlichkeit
|
||||
für einen beliebigen $\sqrt{n}$-starken Gegner einen Zeitschritt
|
||||
$t_1 = t_0 + O(\log n)$ mit $\Delta_{t_1} \geq \frac{n}{4}$.
|
||||
\end{lemma}
|
||||
|
||||
Dieses Lemma sagt im Kern aus, dass sobald die Fallbedingung zutrifft, es
|
||||
$O(\log n)$ Schritte bedarf, um die Bedingung von Fall 1 zu erfüllen. Der
|
||||
anschließende Beweis zeigt dann auch dieses Lemma. Es fällt auf, dass als
|
||||
Untergrenze für das Ungleichgewicht (modifiziert durch eine Konstante) der gleiche
|
||||
Wert genommen wird, der in Fall 1 für die Ballmenge im linken Eimer nach
|
||||
$O(\log \log n)$ Schritten festgestellt wurde. Inwieweit dort ein Zusammenhang
|
||||
besteht, ist jedoch aus dem Paper heraus nicht ersichtlich.
|
||||
|
||||
Eingangs wird eine einfache mathematische Umformung und Ersetzung gemacht,
|
||||
welche $X_t = \frac{n}{2} - \Delta_t$ ergibt. Desweiteren wird
|
||||
$\delta_t = \frac{\Delta_t}{n}$ eingeführt und mit
|
||||
$\delta_t \in \left[\frac{c\sqrt{\ln n}}{\sqrt{n}}, \frac{1}{4} \right]$
|
||||
definiert. $\delta_t$ entspricht dem relativen Ungleichgewicht, wohingegen
|
||||
$\Delta_t$ das absolute Ungleichgewicht darstellt. Die Unter- und Obergrenzen
|
||||
des Werteintervalls entsprechen den Unter- und Obergrenzen von Fall 2.
|
||||
Die Obergrenze des Intervalls kann eigentlich gar nicht
|
||||
erreicht werden, da laut Fallbedingung $\frac{n}{4}$ echt größer ist als jeder
|
||||
mögliche Wert von $\Delta_t$. Somit müsste es ein nach oben offenes Intervall
|
||||
sein.
|
||||
|
||||
Im Anschluss wird die Wahrscheinlichkeit dafür angegeben, dass ein Ball, der
|
||||
zum Zeitpunkt $t$ im kleineren Eimer ist, dort auch einen Schritt später noch ist.
|
||||
Dabei wird nur das Ergebnis ($\frac{3}{4} - \delta_t - \delta_t^2$), nicht aber
|
||||
die Herleitung gezeigt. Diese mathematische Herleitung soll hier zum Verständnis
|
||||
einmal gezeigt werden. Dafür ist es wichtig, die Funktionsweise des Algorithmus
|
||||
vor Augen zu haben. Ein Ball im kleineren (angenommen der linke) Eimer bleibt dort,
|
||||
wenn einer der beiden zufällig gezogenen Bälle ebenfalls im linken Eimer ist.
|
||||
\begin{alignat*}{2}
|
||||
\intertext{Addition der Wahrscheinlichkeit 2 Bälle aus dem linken
|
||||
Eimer zu ziehen mit Wahrscheinlichkeit einen Ball aus dem linken und einen
|
||||
aus dem rechten Eimer zu ziehen.}
|
||||
P[\text{Ball im kleineren Eimer bleibt dort}] &= \left(\frac{X_t}{n}\right)^2
|
||||
+ 2 \cdot \left( \frac{X_t}{n} \cdot \frac{n - X_t}{n} \right) \\
|
||||
&= \frac{X_t^2}{n^2} + 2 \cdot \left( \frac{nX_t - X_t^2}{n^2} \right) \\
|
||||
&= \frac{2nX_t - X_t^2}{n^2} \\
|
||||
\intertext{$X_t$ durch $\frac{n}{2} - \Delta_t$ ersetzen}
|
||||
&= \frac{2n(\frac{n}{2} - \Delta_t) - (\frac{n}{2} - \Delta_t)^2}{n^2} \\
|
||||
&= \frac{n^2 - 2n\Delta_t - (\frac{n^2}{4} - n\Delta_t + \Delta_t^2)}{n^2} \\
|
||||
&= \frac{n^2 - 2n\Delta_t - \frac{n^2}{4} + n\Delta_t - \Delta_t^2}{n^2} \\
|
||||
&= \frac{n^2 - \frac{n^2}{4} - n\Delta_t - \Delta_t^2}{n^2} \\
|
||||
&= \frac{n^2}{n^2} - \frac{\frac{n^2}{4}}{n^2} - \frac{n\Delta_t}{n^2}
|
||||
- \frac{\Delta_t^2}{n^2} \\
|
||||
&= 1 - \frac{1}{4} - \frac{\Delta_t}{n} - \left(\frac{\Delta_t}{n}\right)^2 \\
|
||||
\intertext{Anwenden der Definition von $\delta_t$}
|
||||
&= \frac{3}{4} - \delta_t - \delta_t^2
|
||||
\end{alignat*}
|
||||
|
||||
Wie zu sehen ist, kommt am Ende das im Paper als Wahrscheinlichkeit angegebene
|
||||
Ergebnis heraus. Die Berechnung der Wahrscheinlichkeit dafür, dass ein Ball von
|
||||
dem größeren Eimer in den kleineren wechselt kann ähnlich berechnet werden und
|
||||
beträgt $\frac{1}{4} - \delta_t + \delta_t^2$.
|
||||
|
||||
Es sei erinnert daran, dass $\overset{\sim}{X}_{t+1}$ die Anzahl an Bällen im
|
||||
kleineren Eimer am Ende von Schritt $t+1$ bezeichnet, bevor der Gegner aktiv wird.
|
||||
Mithilfe der Linearität der Erwartung (engl.: Linearity of expectation) wird
|
||||
der Erwartungswert für eben dieses $\overset{\sim}{X}_{t+1}$ berechnet. Dieser
|
||||
beträgt $(1 - \frac{\delta_t}{2})X_t$. Anschließend wird unter Berücksichtigung
|
||||
der Tatsache, dass die Auswahl der Bälle unabhängig voneinander geschieht, mittels
|
||||
Chernoff-Schranken gezeigt, dass die Wahrscheinlichkeit, dass $\overset{\sim}{X}_{t+1}$
|
||||
mindestens $(1 - \frac{\delta_t}{4})X_t$ groß ist, sehr gering ist.
|
||||
|
||||
Der Gegner kann bis zu $\sqrt{n}$ Bälle manipulieren. Demnach gilt mit hoher
|
||||
Wahrscheinlichkeit $X_{t+1} \leq (1 - \frac{\delta_t}{4})X_t + \sqrt{n}$. Einfache
|
||||
Ersetzung ergibt $\frac{n}{2} - \Delta_{t+1} \leq (1 - \frac{\delta_t}{4})
|
||||
\cdot (\frac{n}{2} - \Delta_t) + \sqrt{n}$. Dies gilt weiterhin mit hoher
|
||||
Wahrscheinlichkeit.
|
||||
|
||||
Für eine Ersetzung im weiteren Verlauf wird $\sqrt{n}$ abgeschätzt werden müssen.
|
||||
Dies lässt sich durch folgende Umformung erreichen.
|
||||
\begin{alignat*}{2}
|
||||
c \sqrt{n \log n} = \sqrt{n} \cdot c \sqrt{\log n} &\leq& \Delta_t \\
|
||||
\sqrt{n} &\leq& \frac{\Delta_t}{c \sqrt{\log n}} \leq \frac{\Delta_t}{c \cdot 1}
|
||||
\end{alignat*}
|
||||
|
||||
Mittels mathematischer Umformungen werden $\Delta_{t+1}$ auf die rechte Seite
|
||||
und alles andere auf die linke Seite gebracht.
|
||||
|
||||
\begin{alignat*}{2}
|
||||
\frac{n}{2} - \Delta_{t+1} &\leq& \left(1 - \frac{\delta_t}{4} \right)
|
||||
\cdot \left(\frac{n}{2} - \Delta_t \right) + \sqrt{n} \\
|
||||
\frac{n}{2} &\leq& \left(1 - \frac{\delta_t}{4} \right)
|
||||
\cdot \left(\frac{n}{2} - \Delta_t \right) + \sqrt{n} + \Delta_{t+1} \\
|
||||
\intertext{Ausmultiplizieren}
|
||||
\frac{n}{2} &\leq& \frac{n}{2} - \frac{\delta_t n}{8} - \Delta_t +
|
||||
\frac{\delta_t \Delta_t}{4} + \sqrt{n} + \Delta_{t+1} \\
|
||||
\intertext{Definition von $\delta_t$, zusammenfassen}
|
||||
\frac{n}{2} &\leq& \frac{n}{2} - \frac{\Delta_t}{8} - \Delta_t +
|
||||
\frac{\delta_t \Delta_t}{4} + \sqrt{n} + \Delta_{t+1} \\
|
||||
\intertext{auf die andere Seite bringen}
|
||||
\Delta_t + \frac{\Delta_t}{8} - \frac{\delta_t \Delta_t}{4}
|
||||
-\sqrt{n} &\leq& \Delta_{t+1} \\
|
||||
\intertext{Laut Definition gilt $\delta_t \leq \frac{1}{4}$. Daher kann
|
||||
$\delta_t$ mit $\frac{1}{4}$ abgeschätzt werden. $\sqrt{n}$ kann entsprechend
|
||||
oben genannter Umformung durch $\frac{\Delta_t}{c}$ abgeschätzt werden.
|
||||
$c$ kann auf $32$ gesetzt werden.
|
||||
Damit ergibt sich folgender Zustand.}
|
||||
\Delta_t + \frac{\Delta_t}{8} - \frac{\Delta_t}{16}
|
||||
-\frac{\Delta_t}{32} &\leq& \Delta_{t+1} \\
|
||||
\intertext{Auf gleichen Nenner bringen}
|
||||
\Delta_t + \frac{4 \Delta_t}{32} - \frac{2 \Delta_t}{32}
|
||||
-\frac{\Delta_t}{32} &\leq& \Delta_{t+1} \\
|
||||
\Delta_t + \frac{\Delta_t}{32} &\leq& \Delta_{t+1} \\
|
||||
\intertext{Ausklammern}
|
||||
\left(1 + \frac{1}{32} \right)\Delta_t &\leq& \Delta_{t+1} \\
|
||||
\end{alignat*}
|
||||
|
||||
Das Ergebnis dieser Umformungen gilt weiterhin mit hoher Wahrscheinlichkeit
|
||||
und zeigt, dass das Ungleichgewicht von Schritt zu Schritt größer wird. Somit
|
||||
ist offenbar, dass irgendwann die obere Grenze dieses Falls erreicht sein wird.
|
||||
|
||||
Basierend darauf kann jetzt mittels mathematischer Berechnungen gezeigt werden,
|
||||
dass es in der Tat $O(\log n)$ Runden bedarf, bis in den ersten Fall gewechselt
|
||||
werden kann. Unter Anwendung der Fallbedingung ergibt sich Folgendes.
|
||||
|
||||
\begin{alignat*}{2}
|
||||
\Delta_0 &\geq& c\sqrt{n \ln n} \\
|
||||
\intertext{Daraus folgt unter Verwendung des vorherigen Ergebnisses:}
|
||||
\left(1 + \frac{1}{32} \right)^{t} \cdot c\sqrt{n \ln n} &\leq& \frac{n}{4} \\
|
||||
\left(1 + \frac{1}{32} \right)^{t} &\leq& \frac{1}{4c} \cdot \frac{\sqrt{n}}{\sqrt{\ln n}} \\
|
||||
\intertext{Logarithmus anwenden}
|
||||
t &\leq& \; O\left(\log \left( \frac{\sqrt{n}}{\sqrt{\ln n}} \right) \right) \\
|
||||
\intertext{Es bleibt noch Folgendes zu zeigen.}
|
||||
\frac{\sqrt{n}}{\sqrt{\ln n}} &\leq& n \\
|
||||
\frac{n}{\ln n} &\leq& n^2 \\
|
||||
\frac{1}{\ln n} &\leq& n
|
||||
\end{alignat*}
|
||||
|
||||
Die letzte Ungleichung gilt offenbar. Damit ist gezeigt, dass tatsächlich nach
|
||||
$O(\log n)$ Runden in den ersten Fall gewechselt werden kann. Es ist nicht
|
||||
ersichtlich, weswegen im Paper der sog. "union bound" angewendet wird statt dieser
|
||||
einleuchtenden mathematischen Herleitung.
|
||||
|
||||
Auf den dritten Fall wird hier nicht mehr eingegangen, da dieser deutlich komplexer
|
||||
ist und den Umfang dieser Seminarausarbeitung sprengen würde.
|
||||
|
||||
\section{Verwandte Arbeiten und Ansätze}
|
||||
|
||||
\section{Ausblick und Zusammenfassung}
|
||||
Ben-Or\cite{Ben-Or1983} hat das erste Protokoll
|
||||
entworfen, welches mittels eines randomisierten Algorithmus das Konsensproblem
|
||||
löst. Spätere Literatur baut auf dieser Arbeit auf und erweitert sie maßgeblich
|
||||
in zwei Richtungen. Eine Richtung beschäftigt sich mit Protokollen, die
|
||||
Nachrichtenweitergabe nutzen (engl.: message passing), und konzentriert sich auf
|
||||
das Lösen des Problems mittels kryptographischer Technologien oder privaten Kanälen
|
||||
mit einer linearen Grenze an fehlerhaften Prozessen (inklusive byzantinische Fehler).
|
||||
Die andere Richtung beschäftigt sich mit "shared memory"
|
||||
und benutzt die zugrundeliegende Zuverlässigkeit eines solchen "shared memory"
|
||||
Systems, um das Konsensproblem in dem "wait-free" Fall zu lösen.
|
||||
Dabei gibt es keine Grenze für die Anzahl an Prozessen, die versagen (engl.: fail)
|
||||
dürfen, aber ein Versagen kann nur aufgrund eines Crashs eintreten.
|
||||
|
||||
Für die Richtung der Nachrichtenweitergabe sei exemplarisch Rabin\cite{Rabin1983}
|
||||
erwähnt, der zeigte,
|
||||
dass -- vereinfacht gesagt -- sich das Problem der byzantinischen Armeen durch
|
||||
eine für beide Armeen sichtbare Münze erwartbar in konstanter Zeit lösen lässt.
|
||||
|
||||
Für die "shared memory" Richtung sei exemplarisch die Arbeit von Chor, Israeli
|
||||
und Li\cite{Chor1994} erwähnt, in der das erste Protokoll unter Verwendung von
|
||||
randomisierten Algorithmen vorgestellt wurde, welches "shared memory" benutzt
|
||||
und das Konsensproblem löst.
|
||||
|
||||
\section{Zusammenfassung}
|
||||
|
||||
Zum Abschluss der Arbeit wird diese zusammengefasst und der Bezug zum
|
||||
Masterstudium aufgezeigt.
|
||||
|
||||
\subsection{Zusammenfassung}
|
||||
|
||||
\subsection{Ausblick}
|
||||
Das untersuchte Paper von Doerr et al\cite{Doerr2011} liefert ein zentrales
|
||||
Resultat für den Bereich der Konsensprobleme. Das Medianverfahren ist für die
|
||||
Lösung des eingangs beschriebenen Problems gut geeignet und zudem leicht
|
||||
verständlich. Der Beweis der aufgestellten Theoreme erfolgt in einer
|
||||
nachvollziehbaren und aufeinander aufbauenden Weise. In dieser Arbeit wurde
|
||||
der Versuch unternommen die ersten beiden Fälle des Beweises für den Fall von zwei
|
||||
Werten zu erläutern und den Ablauf des Beweises verständlich zu machen. Dabei ist
|
||||
aufgefallen, dass an etlichen Stellen der Rechenweg bzw. allgemeiner der Weg
|
||||
zum Ergebnis im zugrundeliegenden Paper nicht erwähnt oder nur sehr vage
|
||||
beschrieben wurde. Diese Zwischenschritte wurden in dieser Arbeit bestmöglich
|
||||
nachvollzogen, sodass der Beweis auch für Personen verständlich ist, die sich
|
||||
nicht im Bereich der Algorithmik bzw. spezifischer der randomisierten Algorithmen
|
||||
heimisch fühlen.
|
||||
|
||||
Allerdings ist auch klar, dass diese Arbeit nur einen kleinen Bruchteil des Papers
|
||||
bzw. des Beweises erklärt. Offen bleibt der dritte Fall, sowie der gesamte Fall
|
||||
von mehr als zwei Werten. Ebenfalls wurde der Bereich zu einem "average case"
|
||||
ausgespart.
|
||||
|
||||
Ingesamt lässt sich die Einschätzung geben, dass viele Paper, die zum Teil
|
||||
wichtige Erkenntnisse beschreiben, durch eine Erläuterung des Rechenweges --
|
||||
notfalls im Anhang -- deutlich verständlicher würden.
|
||||
|
||||
\subsection{Bezug zum M.Sc. Studium}
|
||||
|
||||
Als allgemeine Erkenntnis für das Studium lässt sich entnehmen, dass jedwede
|
||||
Annahmen zu erklären und explizit zu machen sind. Man kann sich nie darauf verlassen,
|
||||
dass nur Menschen die eigenen Texte lesen, die genau wissen, was womit gemeint
|
||||
oder angedeutet ist. Daher sollte ein Text stets so geschrieben werden, dass auch
|
||||
jemand, der sich mit der spezifischen Fachmaterie noch nie oder nur rudimentär
|
||||
auseinandergesetzt hat, dem Text folgen und ihn verstehen kann.
|
||||
|
||||
|
||||
\newpage
|
||||
|
||||
\printbibliography
|
||||
|
|
Loading…
Reference in New Issue