Tuesday 24 October 2017

Bewegungs Durchschnitt Vorhersage Fehler


Gleitende durchschnittliche Vorhersage Einführung. Wie Sie vielleicht vermuten, sehen wir uns einige der primitivsten Ansätze zur Prognose an. Aber hoffentlich sind dies zumindest eine lohnende Einführung in einige der Computing-Fragen im Zusammenhang mit der Umsetzung von Prognosen in Tabellenkalkulationen. In diesem Sinne werden wir fortfahren, indem wir am Anfang beginnen und mit Moving Average Prognosen arbeiten. Gleitende durchschnittliche Prognosen. Jeder ist mit gleitenden durchschnittlichen Prognosen vertraut, unabhängig davon, ob sie glauben, dass sie sind. Alle College-Studenten machen sie die ganze Zeit. Denken Sie an Ihre Testergebnisse in einem Kurs, wo Sie vier Tests während des Semesters haben werden. Nehmen wir an, Sie haben eine 85 bei Ihrem ersten Test. Was würdest du für deinen zweiten Test-Score vorhersagen Was denkst du, dein Lehrer würde für deinen nächsten Test-Score voraussagen Was denkst du, deine Freunde können für deinen nächsten Test-Score voraussagen Was denkst du, deine Eltern können für deinen nächsten Test-Score voraussagen All das Blabbing, das du mit deinen Freunden und Eltern machen kannst, sie und deinem Lehrer sind sehr wahrscheinlich zu erwarten, dass du etwas im Bereich der 85 bekommst, die du gerade bekommen hast. Nun, jetzt können wir davon ausgehen, dass trotz Ihrer Selbst-Förderung zu Ihren Freunden, Sie über-schätzen Sie sich selbst und Figur können Sie weniger für den zweiten Test zu studieren und so erhalten Sie eine 73. Nun, was sind alle betroffenen und unbekümmert zu gehen Erwarten Sie auf Ihrem dritten Test zu bekommen Es gibt zwei sehr wahrscheinlich Ansätze für sie eine Schätzung zu entwickeln, unabhängig davon, ob sie es mit Ihnen teilen wird. Sie können sich selbst sagen, "dieser Kerl ist immer bläst Rauch über seine smarts. Er wird noch 73, wenn er glücklich ist. Vielleicht werden die Eltern versuchen, mehr unterstützend zu sein und zu sagen, quotWell, so weit hast du eine 85 und eine 73 bekommen, also vielleicht solltest du auf eine (85 73) 2 79 kommen. Ich weiß nicht, vielleicht, wenn du weniger feiern musst Und werent wedelte den Wiesel überall auf den Platz und wenn du anfing, viel mehr zu studieren, könntest du eine höhere Punktzahl bekommen. Diese beiden Schätzungen belegen tatsächlich durchschnittliche Prognosen. Die erste nutzt nur Ihre aktuellste Punktzahl, um Ihre zukünftige Leistung zu prognostizieren. Dies wird als eine gleitende durchschnittliche Prognose mit einer Periode von Daten bezeichnet. Die zweite ist auch eine gleitende durchschnittliche Prognose, aber mit zwei Perioden von Daten. Nehmen wir an, dass all diese Leute, die auf deinem großen Verstand zerschlagen sind, dich irgendwie verärgert haben und du entscheidest, den dritten Test aus deinen eigenen Gründen gut zu machen und eine höhere Punktzahl vor deinem Quoten zu setzen. Sie nehmen den Test und Ihre Partitur ist eigentlich ein 89 Jeder, auch Sie selbst, ist beeindruckt. So, jetzt haben Sie die endgültige Prüfung des Semesters kommen und wie üblich fühlen Sie sich die Notwendigkeit, goad jeder in die Herstellung ihrer Vorhersagen darüber, wie youll auf den letzten Test zu tun. Nun, hoffentlich sehen Sie das Muster. Nun, hoffentlich kannst du das Muster sehen. Was glaubst du, ist die genaueste Pfeife während wir arbeiten. Jetzt kehren wir zu unserer neuen Reinigungsfirma zurück, die von deiner entfremdeten Halbschwester namens Whistle während wir arbeiten. Sie haben einige vergangene Verkaufsdaten, die durch den folgenden Abschnitt aus einer Kalkulationstabelle dargestellt werden. Zuerst stellen wir die Daten für eine dreistellige gleitende durchschnittliche Prognose vor. Der Eintrag für Zelle C6 sollte jetzt sein. Du kannst diese Zellformel auf die anderen Zellen C7 bis C11 kopieren. Beachten Sie, wie sich der Durchschnitt über die aktuellsten historischen Daten bewegt, aber genau die drei letzten Perioden verwendet, die für jede Vorhersage verfügbar sind. Sie sollten auch bemerken, dass wir nicht wirklich brauchen, um die Vorhersagen für die vergangenen Perioden zu machen, um unsere jüngsten Vorhersage zu entwickeln. Dies unterscheidet sich definitiv von dem exponentiellen Glättungsmodell. Ive enthalten die quotpast Vorhersagen, weil wir sie in der nächsten Webseite verwenden, um die Vorhersagegültigkeit zu messen. Jetzt möchte ich die analogen Ergebnisse für eine zweistufige gleitende durchschnittliche Prognose vorstellen. Der Eintrag für Zelle C5 sollte jetzt sein. Du kannst diese Zellformel in die anderen Zellen C6 bis C11 kopieren. Beachten Sie, wie jetzt nur die beiden letzten Stücke der historischen Daten für jede Vorhersage verwendet werden. Wieder habe ich die quotpast-Vorhersagen für illustrative Zwecke und für die spätere Verwendung in der Prognose-Validierung enthalten. Einige andere Dinge, die wichtig sind, um zu bemerken. Für eine m-Periode gleitende durchschnittliche Prognose werden nur die m aktuellsten Datenwerte verwendet, um die Vorhersage zu machen. Nichts anderes ist nötig Für eine m-Periode gleitende durchschnittliche Prognose, wenn Sie quotpast Vorhersagen quot, bemerken, dass die erste Vorhersage in Periode m 1 auftritt. Beide Themen werden sehr wichtig sein, wenn wir unseren Code entwickeln. Entwicklung der beweglichen Mittelfunktion. Jetzt müssen wir den Code für die gleitende Mittelprognose entwickeln, die flexibler genutzt werden kann. Der Code folgt. Beachten Sie, dass die Eingaben für die Anzahl der Perioden gelten, die Sie in der Prognose und dem Array von historischen Werten verwenden möchten. Sie können es in der beliebigen Arbeitsmappe speichern. Funktion MovingAverage (Historical, NumberOfPeriods) Als Single Declaring und Initialisierung von Variablen Dim Item als Variant Dim Zähler als Integer Dim Akkumulation als Single Dim HistoricalSize als Integer Initialisierung von Variablen Counter 1 Akkumulation 0 Bestimmen der Größe von Historical Array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Akkumulation der entsprechenden Anzahl der aktuellsten bisher beobachteten Werte Akkumulation Akkumulation Historical (HistoricalSize - NumberOfPeriods Counter) MovingAverage Accumulation NumberOfPeriods Der Code wird in der Klasse erklärt. Sie wollen die Funktion auf der Kalkulationstabelle positionieren, so dass das Ergebnis der Berechnung erscheint, wo es folgendes aussieht. In der Praxis wird der gleitende Durchschnitt eine gute Schätzung des Mittelwerts der Zeitreihen liefern, wenn der Mittelwert konstant oder langsam verändert wird. Im Falle eines konstanten Mittels wird der größte Wert von m die besten Schätzungen des zugrunde liegenden Mittels geben. Eine längere Beobachtungsperiode wird die Effekte der Variabilität ausgleichen. Der Zweck der Bereitstellung eines kleineren m ist es, die Prognose auf eine Änderung des zugrunde liegenden Prozesses zu reagieren. Zur Veranschaulichung schlagen wir einen Datensatz vor, der Änderungen des zugrunde liegenden Mittels der Zeitreihen beinhaltet. Die Figur zeigt die Zeitreihen, die für die Illustration verwendet wurden, zusammen mit der mittleren Nachfrage, aus der die Serie erzeugt wurde. Der Mittelwert beginnt als Konstante bei 10. Beginnend um die Zeit 21 erhöht er sich in jeder Periode um eine Einheit, bis er zum Zeitpunkt 30 den Wert von 20 erreicht. Dann wird er wieder konstant. Die Daten werden durch Addition des Mittelwertes, eines zufälligen Rauschens aus einer Normalverteilung mit Nullmittelwert und Standardabweichung simuliert. 3. Die Ergebnisse der Simulation werden auf die nächste ganze Zahl gerundet. Die Tabelle zeigt die simulierten Beobachtungen für das Beispiel. Wenn wir den Tisch benutzen, müssen wir uns daran erinnern, dass zu irgendeiner Zeit nur die bisherigen Daten bekannt sind. Die Schätzungen des Modellparameters, für drei verschiedene Werte von m werden zusammen mit dem Mittelwert der Zeitreihen in der folgenden Abbildung dargestellt. Die Figur zeigt die gleitende durchschnittliche Schätzung des Mittelwertes zu jeder Zeit und nicht die Prognose. Die Prognosen würden die gleitenden Durchschnittskurven nach Perioden nach rechts verschieben. Aus der Figur ergibt sich sofort eine Schlussfolgerung. Für alle drei Schätzungen liegt der gleitende Durchschnitt hinter dem linearen Trend zurück, wobei die Verzögerung mit m zunimmt. Die Verzögerung ist der Abstand zwischen dem Modell und der Schätzung in der Zeitdimension. Wegen der Verzögerung unterschätzt der gleitende Durchschnitt die Beobachtungen, wenn der Mittelwert zunimmt. Die Vorspannung des Schätzers ist die Differenz zu einer bestimmten Zeit im Mittelwert des Modells und der durch den gleitenden Durchschnitt vorhergesagte Mittelwert. Die Vorspannung, wenn der Mittelwert zunimmt, ist negativ. Für ein abnehmendes Mittel ist die Vorspannung positiv. Die Verzögerung in der Zeit und die Vorspannung, die in der Schätzung eingeführt werden, sind Funktionen von m. Je größer der Wert von m. Je größer die Größe der Verzögerung und der Vorspannung ist. Für eine stetig wachsende Serie mit Trend a. Die Werte der Verzögerung und der Vorspannung des Schätzers des Mittels sind in den nachstehenden Gleichungen angegeben. Die Beispielkurven stimmen nicht mit diesen Gleichungen überein, weil das Beispielmodell nicht kontinuierlich zunimmt, sondern es beginnt als Konstante, ändert sich zu einem Trend und wird dann wieder konstant. Auch die Beispielkurven sind vom Lärm betroffen. Die gleitende durchschnittliche Prognose der Perioden in die Zukunft wird durch die Verschiebung der Kurven nach rechts dargestellt. Die Verzögerung und die Bias steigen proportional an. Die nachfolgenden Gleichungen zeigen die Verzögerung und die Vorspannung einer Prognoseperiode in die Zukunft im Vergleich zu den Modellparametern. Wiederum sind diese Formeln für eine Zeitreihe mit einem konstanten linearen Trend. Wir sollten uns über dieses Ergebnis nicht wundern. Der gleitende durchschnittliche Schätzer beruht auf der Annahme eines konstanten Mittels, und das Beispiel hat einen linearen Trend im Mittel während eines Teils des Untersuchungszeitraums. Da Echtzeit-Serien den Annahmen eines Modells nur selten gehorchen, sollten wir auf solche Ergebnisse vorbereitet sein. Wir können auch aus der Figur schließen, dass die Variabilität des Rauschens die größte Wirkung für kleinere m hat. Die Schätzung ist viel volatiler für den gleitenden Durchschnitt von 5 als der gleitende Durchschnitt von 20. Wir haben die widersprüchlichen Wünsche, m zu erhöhen, um den Effekt der Variabilität aufgrund des Rauschens zu reduzieren und m zu reduzieren, um die Prognose besser auf Veränderungen zu reagieren Im gemein Der Fehler ist die Differenz zwischen den tatsächlichen Daten und dem prognostizierten Wert. Ist die Zeitreihe wirklich ein konstanter Wert, so ist der erwartete Wert des Fehlers Null und die Varianz des Fehlers besteht aus einem Begriff, der eine Funktion und ein zweiter Term ist, der die Varianz des Rauschens ist. Der erste Term ist die Varianz des Mittelwertes, der mit einer Stichprobe von m Beobachtungen geschätzt wird, vorausgesetzt, die Daten stammen aus einer Population mit einem konstanten Mittelwert. Dieser Begriff wird minimiert, indem man m so groß wie möglich macht. Eine große m macht die Prognose nicht mehr auf eine Veränderung der zugrunde liegenden Zeitreihen. Um die Prognose auf Veränderungen zu reagieren, wollen wir m so klein wie möglich (1), aber das erhöht die Fehlerabweichung. Die praktische Vorhersage erfordert einen Zwischenwert. Vorhersage mit Excel Das Prognose-Add-In implementiert die gleitenden durchschnittlichen Formeln. Das folgende Beispiel zeigt die Analyse, die durch das Add-In für die Beispieldaten in Spalte B bereitgestellt wird. Die ersten 10 Beobachtungen sind indiziert -9 bis 0. Im Vergleich zur obigen Tabelle werden die Periodenindizes um -10 verschoben. Die ersten zehn Beobachtungen liefern die Startwerte für die Schätzung und werden verwendet, um den gleitenden Durchschnitt für die Periode 0 zu berechnen. Die MA (10) - Spalte (C) zeigt die berechneten Bewegungsdurchschnitte. Der gleitende Mittelwert m ist in Zelle C3. Die Fore (1) Spalte (D) zeigt eine Prognose für einen Zeitraum in die Zukunft. Das Prognoseintervall befindet sich in Zelle D3. Wenn das Prognoseintervall auf eine größere Zahl geändert wird, werden die Zahlen in der Spalte Fore nach unten verschoben. Die Err (1) Spalte (E) zeigt den Unterschied zwischen Beobachtung und Prognose. Zum Beispiel ist die Beobachtung zum Zeitpunkt 1 gleich 6. Der prognostizierte Wert aus dem gleitenden Durchschnitt zum Zeitpunkt 0 beträgt 11,1. Der Fehler ist dann -5.1. Die Standardabweichung und die mittlere mittlere Abweichung (MAD) werden in den Zellen E6 bzw. E7 berechnet. Durchgehende Mittelwerte Durchgehende Mittelwerte Bei herkömmlichen Datensätzen ist der Mittelwert oft der erste und eine der nützlichsten Zusammenfassungsstatistiken zu berechnen. Wenn Daten in Form einer Zeitreihe vorliegen, ist das Serienmittel ein nützliches Maß, entspricht aber nicht der Dynamik der Daten. Mittelwerte, die über kurzgeschlossene Perioden berechnet werden, die entweder der aktuellen Periode vorausgeht oder auf der aktuellen Periode zentriert sind, sind oft nützlicher. Weil diese Mittelwerte variieren oder sich bewegen, wenn sich die aktuelle Periode von der Zeit t 2, t 3 usw. bewegt, werden sie als gleitende Mittelwerte (Mas) bezeichnet. Ein einfacher gleitender Durchschnitt ist (typischerweise) der ungewichtete Durchschnitt von k vorherigen Werten. Ein exponentiell gewichteter gleitender Durchschnitt ist im Wesentlichen derselbe wie ein einfacher gleitender Durchschnitt, aber mit Beiträgen zum Mittelwert, der durch ihre Nähe zur aktuellen Zeit gewichtet wird. Weil es nicht eine, sondern eine ganze Reihe von gleitenden Durchschnitten für jede gegebene Serie gibt, kann der Satz von Mas selbst auf Graphen aufgetragen, als Serie analysiert und bei der Modellierung und Prognose verwendet werden. Eine Reihe von Modellen kann mit gleitenden Durchschnitten konstruiert werden, und diese sind als MA-Modelle bekannt. Wenn solche Modelle mit autoregressiven (AR) Modellen kombiniert werden, sind die resultierenden zusammengesetzten Modelle als ARMA - oder ARIMA-Modelle bekannt (die I ist für integriert). Einfache Bewegungsdurchschnitte Da eine Zeitreihe als ein Satz von Werten betrachtet werden kann, kann t 1,2,3,4, n der Mittelwert dieser Werte berechnet werden. Wenn wir annehmen, daß n ziemlich groß ist und wir eine ganze Zahl k wählen, die viel kleiner als n ist. Wir können einen Satz von Blockdurchschnitten oder einfache gleitende Mittelwerte (der Ordnung k) berechnen: Jede Maßnahme repräsentiert den Mittelwert der Datenwerte über ein Intervall von k Beobachtungen. Beachten Sie, dass die erste mögliche MA der Ordnung k gt0 die für t k ist. Im Allgemeinen können wir den zusätzlichen Index in den obigen Ausdrücken fallen lassen und schreiben: Dies besagt, dass der geschätzte Mittelwert zum Zeitpunkt t der einfache Durchschnitt des beobachteten Wertes zum Zeitpunkt t und der vorhergehenden k -1 Zeitschritte ist. Wenn Gewichte angewendet werden, die den Beitrag von Beobachtungen, die weiter weg in der Zeit sind, verringern, wird der gleitende Durchschnitt exponentiell geglättet. Bewegliche Mittelwerte werden oft als eine Form der Prognose verwendet, wobei der Schätzwert für eine Reihe zum Zeitpunkt t 1, S t1. Wird als MA für den Zeitraum bis einschließlich Zeit t genommen. z. B. Die heutige Schätzung basiert auf einem Durchschnitt der bisher aufgezeichneten Werte bis einschließlich gestern (für Tagesdaten). Einfache gleitende Durchschnitte können als eine Form der Glättung gesehen werden. In dem unten dargestellten Beispiel wurde der in der Einleitung zu diesem Thema gezeigte Luftverschmutzungs-Datensatz um eine 7-Tage-Gleitende Durchschnitt (MA) - Linie erweitert, die hier in rot dargestellt ist. Wie man sehen kann, glättet die MA-Linie die Gipfel und Tröge in den Daten und kann sehr hilfreich bei der Identifizierung von Trends sein. Die Standard-Vorwärtsberechnungsformel bedeutet, dass die ersten k -1 Datenpunkte keinen MA-Wert haben, aber danach rechnen die Berechnungen bis zum endgültigen Datenpunkt in der Serie. PM10 tägliche Mittelwerte, Greenwich Quelle: London Air Quality Network, londonair. org. uk Ein Grund für die Berechnung einfacher gleitender Durchschnitte in der beschriebenen Weise ist, dass es ermöglicht, Werte für alle Zeitschlitze von der Zeit tk bis zur Gegenwart berechnet werden, und Da eine neue Messung für die Zeit t 1 erhalten wird, kann die MA für die Zeit t 1 dem bereits berechneten Satz hinzugefügt werden. Dies stellt eine einfache Prozedur für dynamische Datensätze zur Verfügung. Allerdings gibt es einige Probleme mit diesem Ansatz. Es ist vernünftig zu argumentieren, dass der Mittelwert über die letzten 3 Perioden, sagen wir, zum Zeitpunkt t -1 liegen sollte, nicht Zeit t. Und für eine MA über eine gerade Anzahl von Perioden vielleicht sollte es sich am Mittelpunkt zwischen zwei Zeitintervallen befinden. Eine Lösung für dieses Problem ist die Verwendung von zentrierten MA-Berechnungen, bei denen das MA zum Zeitpunkt t der Mittelwert eines symmetrischen Satzes von Werten um t ist. Trotz seiner offensichtlichen Verdienste wird dieser Ansatz im Allgemeinen nicht verwendet, weil es erfordert, dass Daten für zukünftige Ereignisse verfügbar sind, was möglicherweise nicht der Fall ist. In Fällen, in denen die Analyse vollständig aus einer bestehenden Serie besteht, kann die Verwendung von zentriertem Mas vorzuziehen sein. Einfache gleitende Durchschnitte können als eine Form der Glättung betrachtet werden, wobei einige hochfrequente Komponenten einer Zeitreihe entfernt werden und die Trends in ähnlicher Weise wie der allgemeine Begriff der digitalen Filterung hervorgehoben werden (aber nicht entfernen) werden. In der Tat sind gleitende Mittelwerte eine Form des linearen Filters. Es ist möglich, eine gleitende Durchschnittsberechnung auf eine Reihe anzuwenden, die bereits geglättet worden ist, d. h. Glätten oder Filtern einer bereits geglätteten Reihe. Zum Beispiel können wir mit einem gleitenden Durchschnitt von Ordnung 2, wie sie mit Gewichten berechnet werden, also die MA bei x 2 0,5 x 1 0,5 x 2 betrachten. Ebenso ist die MA bei x 3 0,5 x 2 0,5 x 3. Wenn wir Eine zweite Glättung oder Filterung anwenden, haben wir 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 dh die zweistufige Filterung Prozess (oder Faltung) hat einen variabel gewichteten symmetrischen gleitenden Durchschnitt mit Gewichten erzeugt. Mehrere Windungen können sehr komplexe gewichtete Bewegungsdurchschnitte erzeugen, von denen einige von besonderem Gebrauch in spezialisierten Bereichen, wie in Lebensversicherungsberechnungen, gefunden wurden. Bewegliche Mittelwerte können verwendet werden, um periodische Effekte zu entfernen, wenn sie mit der Länge der Periodizität als bekannt berechnet werden. Zum Beispiel, mit monatlichen Daten saisonale Variationen können oft entfernt werden (wenn dies das Ziel ist), indem Sie einen symmetrischen 12-Monats-gleitenden Durchschnitt mit allen Monaten gleich gewichtet, mit Ausnahme der ersten und letzten, die mit 12 gewichtet werden. Dies ist, weil es wird 13 Monate im symmetrischen Modell (aktuelle Zeit, t. - 6 Monate). Die Summe wird durch 12 geteilt. Ähnliche Verfahren können für jede klar definierte Periodizität angenommen werden. Exponentiell gewichtete Bewegungsdurchschnitte (EWMA) Mit der einfachen gleitenden Durchschnittsformel: Alle Beobachtungen werden gleich gewichtet. Wenn wir diese gleichen Gewichte nennen, alpha t. Jedes der k Gewichte würde 1 k betragen. So wäre die Summe der Gewichte 1, und die Formel wäre: Wir haben bereits gesehen, dass mehrere Anwendungen dieses Prozesses dazu führen, dass die Gewichte variieren. Bei exponentiell gewichteten Bewegungsdurchschnitten wird der Beitrag zum Mittelwert aus Beobachtungen, die in der Zeit mehr entfernt werden, reduziert und damit neue (lokale) Ereignisse hervorgehoben. Im wesentlichen wird ein Glättungsparameter, 0lt alpha lt1, eingeführt und die Formel überarbeitet: Eine symmetrische Version dieser Formel wäre von der Form: Werden die Gewichte im symmetrischen Modell als Begriffe der Binomialexpansion ausgewählt, (1212) 2q. Sie werden auf 1 summieren, und wenn q groß wird, wird die Normalverteilung angenähert. Dies ist eine Form der Kernel-Gewichtung, wobei die Binomie als Kernfunktion fungiert. Die im vorigen Unterabschnitt beschriebene zweistufige Faltung ist genau diese Anordnung, wobei q 1 die Gewichte ergibt. Bei der exponentiellen Glättung ist es notwendig, einen Satz von Gewichten zu verwenden, die auf 1 summieren und die Größe geometrisch verkleinern. Die verwendeten Gewichte sind typischerweise in der Form: Um zu zeigen, dass diese Gewichte auf 1 summieren, betrachten wir die Ausdehnung von 1 als Reihe. Wir können den Ausdruck in Klammern mit der Binomialformel (1- x) p schreiben und erweitern. Wobei x (1-) und p -1, was ergibt: Dies ergibt dann eine Form des gewichteten gleitenden Durchschnitts der Form: Diese Summation kann als eine Wiederholungsrelation geschrieben werden, die die Berechnung stark vereinfacht und das Problem vermeidet, dass das Gewichtungsregime Sollte strikt unendlich sein, damit die Gewichte auf 1 summieren (für kleine Werte von alpha ist dies normalerweise nicht der Fall). Die Notation, die von verschiedenen Autoren verwendet wird, variiert. Manche verwenden den Buchstaben S, um anzuzeigen, daß die Formel im wesentlichen eine geglättete Variable ist und schreibt: Während die Kontrolle Theorie Literatur oft Z anstelle von S für die exponentiell gewichteten oder geglätteten Werte verwendet (siehe z. B. Lucas und Saccucci, 1990, LUC1 , Und die NIST-Website für weitere Details und bearbeitete Beispiele). Die oben zitierten Formeln stammen aus der Arbeit von Roberts (1959, ROB1), aber Hunter (1986, HUN1) verwendet einen Ausdruck der Form: die für die Verwendung in einigen Kontrollverfahren besser geeignet ist. Bei alpha 1 ist die mittlere Schätzung einfach der gemessene Wert (oder der Wert des vorherigen Datenelementes). Mit 0,5 ist die Schätzung der einfache gleitende Durchschnitt der aktuellen und früheren Messungen. Bei der Vorhersage der Modelle ist der Wert S t. Wird oft als Schätz - oder Prognosewert für den nächsten Zeitraum verwendet, dh als Schätzung für x zum Zeitpunkt t 1. Damit haben wir: Dies zeigt, dass der Prognosewert zum Zeitpunkt t 1 eine Kombination aus dem vorherigen exponentiell gewichteten gleitenden Durchschnitt ist Plus eine Komponente, die den gewichteten Vorhersagefehler darstellt, epsilon. Zum Zeitpunkt t. Unter der Annahme, dass eine Zeitreihe gegeben ist und eine Prognose erforderlich ist, ist ein Wert für Alpha erforderlich. Dies kann aus den vorhandenen Daten abgeschätzt werden, indem die Summe der quadratischen Vorhersagefehler mit variierenden Werten von alpha für jedes t 2,3 ausgewertet wird. Einstellung der ersten Schätzung als der erste beobachtete Datenwert x 1. Bei den Steuerungsanwendungen ist der Wert von alpha wichtig, der bei der Bestimmung der oberen und unteren Kontrollgrenzen verwendet wird und die erwartete durchschnittliche Lauflänge (ARL) beeinflusst Bevor diese Kontrollgrenzen kaputt sind (unter der Annahme, dass die Zeitreihe einen Satz von zufälligen, identisch verteilten unabhängigen Variablen mit gemeinsamer Varianz darstellt). Unter diesen Umständen ist die Varianz der Kontrollstatistik: (Lucas und Saccucci, 1990): Kontrollgrenzen werden gewöhnlich als feste Vielfache dieser asymptotischen Varianz gesetzt, z. B. - 3 mal die Standardabweichung. Wenn beispielsweise Alpha 0,25 und die zu überwachenden Daten eine Normalverteilung N (0,1) haben, wenn die Kontrolle begrenzt wird, werden die Regelgrenzen - 1.134 sein und der Prozeß erreicht eine oder andere Grenze in 500 Schritten im Durchschnitt. Lucas und Saccucci (1990 LUC1) leiten die ARLs für eine breite Palette von Alpha-Werten und unter verschiedenen Annahmen mit Markov Chain Verfahren ab. Sie tabellieren die Ergebnisse, einschließlich der Bereitstellung von ARLs, wenn der Mittelwert des Kontrollprozesses um ein Vielfaches der Standardabweichung verschoben wurde. Zum Beispiel ist bei einer 0,5-Schicht mit alpha 0,25 die ARL weniger als 50 Zeitschritte. Die oben beschriebenen Ansätze werden als einzelne exponentielle Glättung bezeichnet. Da die Prozeduren einmal auf die Zeitreihen angewendet werden und dann analysiert oder kontrolliert werden, werden Prozesse auf dem resultierenden geglätteten Datensatz durchgeführt. Wenn der Datensatz einen Trend und saisonale Komponenten enthält, kann eine zweidimensionale oder dreistufige Exponentialglättung als Mittel zur Beseitigung (expliziten Modellierung) dieser Effekte angewendet werden (siehe weiter unten den Abschnitt "Vorhersage" und das NIST-Beispiel). CHA1 Chatfield C (1975) Die Analyse der Times-Serie: Theorie und Praxis. Chapman und Hall, London HUN1 Hunter J S (1986) Der exponentiell gewichtete gleitende Durchschnitt. J von Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Exponentiell gewichtete Moving Average Control Schemes: Eigenschaften und Erweiterungen. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrolltabelle Tests basierend auf geometrischen Moving Averages. Technometrics, 1, 239-250

No comments:

Post a Comment