Was sind die Nachteile der gleitenden mittleren Filter, wenn es mit Zeitreihen-Daten verwenden Es ist ein wenig verwirrend in der Terminologie in der Signalverarbeitung. Gleitende Durchschnittsfilter sind Filter, die eine Reihe von gewichteten Mitteln des Eingangssignals berechnen. Zusätzlich zu Balaacutezs Kotoszrsquo Kommentar, ist es wichtig, dass die Gewichte nicht gleich sind, d. h. Sie berechnen das laufende arithmetische Mittel des Eingangssignals. Dieser Filtertyp wird üblicherweise als laufender Mittelwert bezeichnet. Sie sollten nicht verwenden, weil sie einige Frequenzen in Ihrem Spektrum zu beseitigen und andere sind umgekehrt. Das ist schlecht, wenn man sich für ein bestimmtes Frequenzband interessiert, das entweder eliminiert (keine Antwort) oder umgekehrt (Zeichenwechsel und damit Kausalität) ist (siehe auch MATLAB Rezepte für Geowissenschaften, Springer 2010). Heres ein MATLAB Beispiel, um den Effekt der laufenden Mittel zu sehen. Beispielsweise beseitigt das Anlegen des Filters an ein Signal mit einer Periode von etwa 1 / 0,09082 vollständig dieses Signal. Da ferner die Größe des Frequenzgangs der Absolutwert des komplexen Frequenzgangs ist, ist die Betragsantwort tatsächlich zwischen 0,3633 und zwischen 0,4546 und der Nyquist-Frequenz negativ. Alle Signalanteile mit Frequenzen innerhalb dieser Intervalle werden auf der t-Achse gespiegelt. Als ein Beispiel versuchen wir eine Sinuswelle mit einer Periode von 7.0000, z. B. Eine Frequenz von ungefähr 0,1499, die innerhalb des ersten Intervalls mit einer negativen Amplitudenantwort ist: t (1: 100) × 10²sin (2pit / 7) b10 Eins (1,11) / 11m10 Länge (b10) y10 Filter (b10, (M10-1) / 2: end - (m10-1) / 2,1) y10 (end1: endm10-1,1) Nullen (m10-1,1) grafische Darstellung (t, Hierbei ist die Amplitudenantwort des Filters, die die Nullen und die Begrenzung zeigt: h, w freqz (b10,1,512) f 1w / (2pi) Größe abs (h) Diagramm (f, Größe) Die Sinuswelle Mit einer Periode von 7 eine Amplitudenreduktion von z Um 80 aber auch geändertes Zeichen, wie Sie von der Handlung sehen können. Die Beseitigung bestimmter Frequenzen und das Spiegeln des Signals haben wichtige Bedeutung bei der Interpretation der Kausalität in den Geowissenschaften. Diese Filter, obwohl sie standardmäßig in Tabellenkalkulationsprogrammen zum Glätten angeboten werden, sollten daher vollständig vermieden werden. Als Alternative sollten Filter mit einem spezifischen Frequenzgang verwendet werden, wie z. B. ein Butterworth-Tiefpassfilter. Sie haben eine Frage, die Sie schnell beantworten müssen. Moving Average Filter Sie können das Moving Average Filter-Modul verwenden, um eine Reihe von einseitigen oder doppelseitigen Durchschnittswerten über eine Datenmenge zu berechnen, indem Sie eine Fensterlänge angeben, die Sie angeben. Nachdem Sie einen Filter definiert haben, der Ihren Anforderungen entspricht, können Sie ihn auf ausgewählte Spalten in einem Dataset anwenden, indem Sie ihn an das Apply Filter-Modul anschließen. Das Modul übernimmt alle Berechnungen und ersetzt Werte in numerischen Spalten mit entsprechenden gleitenden Mittelwerten. Sie können den resultierenden gleitenden Durchschnitt für Plotten und Visualisierung als neue glatte Grundlinie für die Modellierung, für die Berechnung von Varianzen gegen Berechnungen für ähnliche Perioden, und so weiter verwenden. Diese Art von Durchschnitt hilft Ihnen zu entdecken und zu prognostizieren nützliche zeitliche Muster in retrospektive und Echtzeit-Daten. Der einfachste Typ des gleitenden Durchschnitts beginnt bei irgendeinem Muster der Reihe und verwendet den Mittelwert dieser Position plus die vorherigen n Positionen anstelle des tatsächlichen Wertes. (Sie können n wie Sie wollen definieren.) Je länger die Periode n, über die der Durchschnitt berechnet wird, desto weniger Varianz haben Sie unter den Werten. Wenn Sie die Anzahl der verwendeten Werte erhöhen, verringert sich der Effekt, den ein einziger Wert auf den resultierenden Durchschnitt hat. Ein gleitender Durchschnitt kann einseitig oder zweiseitig sein. In einem einseitigen Durchschnitt werden nur Werte verwendet, die dem Indexwert vorangehen. In einem zweiseitigen Durchschnitt werden vergangene und zukünftige Werte verwendet. Für Szenarien, in denen Sie Streaming-Daten lesen, sind kumulative und gewichtete gleitende Mittelwerte besonders nützlich. Ein kumulativer gleitender Durchschnitt berücksichtigt die Punkte, die der aktuellen Periode vorangehen. Sie können alle Datenpunkte gleichmäßig bei der Berechnung des Mittelwertes gewichten, oder Sie können sicherstellen, dass Werte, die näher am aktuellen Datenpunkt liegen, stärker gewichtet werden. In einem gewichteten gleitenden Durchschnitt. Alle Gewichte müssen sich auf 1. In einem exponentiellen gleitenden Durchschnitt. Die Mittelwerte bestehen aus Kopf und Schwanz. Die gewichtet werden können. Ein schwach gewichteter Schwanz bedeutet, dass der Schwanz dem Kopf sehr nahe kommt, so dass der Durchschnitt sich wie ein gleitender Durchschnitt auf einer kurzen Gewichtungsperiode verhält. Wenn Schwanzgewichte schwerer sind, verhält sich der Durchschnitt eher wie ein längerer einfacher gleitender Durchschnitt. Fügen Sie das Moving Average Filter-Modul zu Ihrem Experiment hinzu. Für Länge. Geben Sie einen positiven Ganzzahlwert ein, der die Gesamtgröße des Fensters definiert, über dem das Filter angewendet wird. Dies wird auch Filtermaske genannt. Für einen gleitenden Durchschnitt bestimmt die Länge des Filters, wie viele Werte im Schiebefenster gemittelt werden. Längere Filter werden auch Filter höherer Ordnung genannt und bieten ein größeres Berechnungsfenster und eine nähere Annäherung der Trendlinie. Filter mit kürzerer oder niedrigerer Ordnung verwenden ein kleineres Berechnungsfenster und ähneln stärker den ursprünglichen Daten. Für Typ. Wählen Sie die Art der gleitenden Durchschnitt anzuwenden. Azure Machine Learning Studio unterstützt die folgenden Arten von gleitenden Durchschnittsberechnungen: Ein einfacher gleitender Durchschnitt (SMA) wird als ungewichtetes Rollmittel berechnet. Dreieckige Bewegungsdurchschnitte (TMA) werden zweimal für eine glattere Trendlinie gemittelt. Das Wort Dreieck wird aus der Form der Gewichte abgeleitet, die auf die Daten angewendet werden, was zentrale Werte hervorhebt. Ein exponentieller gleitender Durchschnitt (EMA) gibt den jüngsten Daten mehr Gewicht. Die Gewichtung fällt exponentiell ab. Ein modifizierter exponentieller gleitender Durchschnitt berechnet einen laufenden gleitenden Durchschnitt, wobei das Berechnen des gleitenden Durchschnitts an einem beliebigen Punkt den vorher berechneten gleitenden Durchschnitt an allen vorhergehenden Punkten berücksichtigt. Dieses Verfahren ergibt eine glattere Trendlinie. Bei einem einzigen Punkt und einem aktuellen gleitenden Durchschnitt berechnet der kumulative gleitende Durchschnitt (CMA) den gleitenden Durchschnitt an dem aktuellen Punkt. Fügen Sie den Dataset hinzu, der die Werte enthält, für die Sie einen gleitenden Durchschnitt berechnen möchten, und fügen Sie das Modul "Filter anwenden" hinzu. Verbinden Sie den Moving Average Filter mit dem linken Eingang des Apply Filters. Und verbinden Sie den Datensatz mit dem rechten Eingang. Verwenden Sie im Anwendungsfilter-Modul die Spaltenauswahl, um anzugeben, auf welche Spalten der Filter angewendet werden soll. Der von Ihnen erstellte Filter wird standardmäßig auf alle numerischen Spalten angewendet. Daher sollten Sie alle Spalten ausschließen, für die keine entsprechenden Daten vorhanden sind. Führen Sie das Experiment aus. Zu diesem Zeitpunkt wird für jeden durch den Filterlängenparameter definierten Wertsatz der aktuelle (oder Index) Wert durch den gleitenden Mittelwert ersetzt. Bei einer Zeitreihe xi möchte ich einen gewichteten gleitenden Durchschnitt mit einem Mittelwertfenster berechnen N Punkte, wobei die Gewichtungen für ältere Werte jüngere Werte begünstigen. Bei der Wahl der Gewichte verwende ich die bekannte Tatsache, daß eine geometrische Reihe gegen 1 konvergiert, d. H. Sum (frac) k, sofern unendlich viele Begriffe genommen werden. Um eine diskrete Zahl von Gewichtungen zu erhalten, die zu einer Einheit summieren, nehme ich einfach die ersten N-Terme der geometrischen Reihe (frac) k und normalisiere dann ihre Summe. Bei N4 ergeben sich zum Beispiel die nicht normierten Gewichte, die nach Normalisierung durch ihre Summe ergibt. Der gleitende Mittelwert ist dann einfach die Summe aus dem Produkt der letzten 4 Werte gegen diese normierten Gewichte. Diese Methode verallgemeinert sich in der offensichtlichen Weise zu bewegten Fenstern der Länge N und scheint auch rechnerisch einfach. Gibt es einen Grund, diese einfache Methode nicht zu verwenden, um einen gewichteten gleitenden Durchschnitt mit exponentiellen Gewichten zu berechnen, frage ich, weil der Wikipedia-Eintrag für EWMA komplizierter erscheint. Was mich fragt, ob die Lehrbuch-Definition von EWMA hat vielleicht einige statistische Eigenschaften, die die obige einfache Definition nicht oder sind sie in der Tat gleichwertig sind, beginnen Sie mit 1), dass es keine ungewöhnlichen Werte Und keine Pegelverschiebungen und keine Zeittrends und keine saisonalen Dummies 2), dass das optimale gewichtete Mittel Gewichte aufweist, die auf eine gleichmäßige Kurve fallen, die durch einen Koeffizienten 3 beschreibbar ist), dass die Fehlerabweichung konstant ist, dass es keine bekannten Ursachenreihen gibt Annahmen. Ndash IrishStat Okt 1 14 am 21:18 Ravi: In dem gegebenen Beispiel ist die Summe der ersten vier Ausdrücke 0,9375 0,06250,1250.250,5. Die ersten vier Ausdrücke haben also 93,8 des Gesamtgewichts (6,2 ist im abgeschnittenen Schwanz). Verwenden Sie diese, um normierte Gewichte zu erhalten, die zu einer Einheit durch Reskalierung (dividieren) um 0,9375 zusammenkommen. Dies ergibt 0,06667, 0,1333, 0,267, 0,5333. Ndash Assad Ebrahim Ich habe festgestellt, dass die Berechnung der exponentiell gewichteten laufenden Durchschnitte mit overline leftarrow overline alpha (x - overline), alphalt1 ist eine einfache einzeilige Methode, die leicht, wenn auch nur annähernd interpretierbar in Bezug auf Eine effektive Anzahl von Proben Nalpha (vergleichen Sie diese Form an die Form für die Berechnung der laufenden Mittelwert), erfordert nur das aktuelle Datum (und den aktuellen Mittelwert), und ist numerisch stabil. Technisch integriert dieser Ansatz alle Geschichte in den Durchschnitt. Die beiden Hauptvorteile bei der Verwendung des Vollfensters (im Gegensatz zum verkürzten, in der Frage diskutierten) liegen darin, dass es in einigen Fällen die analytische Charakterisierung der Filterung erleichtert und die Schwankungen, die bei sehr großen (oder kleinen) Daten induziert werden, reduziert Wert ist Teil des Datensatzes. Zum Beispiel betrachten das Filter-Ergebnis, wenn die Daten sind alle Null, außer für ein Datum, dessen Wert 106. beantwortet Nov 29 12 bei 0:33
No comments:
Post a Comment