Loess Vs Moving Average


Ada sejumlah pendekatan untuk memodelkan time series. Kami menguraikan beberapa pendekatan yang paling umum di bawah ini. Trend, Seasonal, Residual Decompositions Salah satu pendekatannya adalah menguraikan seri waktu menjadi komponen tren, musiman, dan residual. Triple smoothing eksponensial adalah contoh dari pendekatan ini. Contoh lain, disebut loess musiman, didasarkan pada kuadrat terkecil tertimbang lokal dan dibahas oleh Cleveland (1993). Kami tidak membahas permainan musiman di buku pegangan ini. Metode Berbasis Frekuensi Pendekatan lain, yang umum digunakan dalam aplikasi ilmiah dan teknik, adalah menganalisis rangkaian dalam domain frekuensi. Contoh dari pendekatan ini dalam pemodelan kumpulan data tipe sinusoidal ditunjukkan dalam studi kasus defleksi balok. Plot spektral adalah alat utama untuk analisis frekuensi deret waktu. Model Autoregressive (AR) Pendekatan umum untuk pemodelan rangkaian waktu univariat adalah model autoregresif (AR): Xt delta phi1 X phi2 X cdots phip X Di mana (Xt) adalah deret waktu, (At) adalah white noise, dan delta Kiri (1 - sum p phii kanan) mu. Dengan (mu) yang menunjukkan mean prosesnya. Model autoregresif hanyalah sebuah regresi linier dari nilai arus seri terhadap satu atau lebih nilai awal dari rangkaian. Nilai (p) disebut urutan model AR. Model AR dapat dianalisis dengan salah satu dari berbagai metode, termasuk teknik kuadrat linier standar. Mereka juga memiliki interpretasi langsung. Model Moving Average (MA) Pendekatan umum lainnya untuk memodelkan model seri waktu univariat adalah model moving average (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, di mana (Xt) adalah deret waktu, (mu ) Adalah mean dari rangkaian, (A) adalah istilah white noise, dan (theta1,, ldots, thetaq) adalah parameter dari model. Nilai (q) disebut urutan model MA. Artinya, model rata-rata bergerak secara konseptual merupakan regresi linier dari nilai arus seri terhadap noise putih atau guncangan acak dari satu atau lebih nilai awal dari rangkaian. Guncangan acak pada masing-masing titik diasumsikan berasal dari distribusi yang sama, biasanya merupakan distribusi normal, dengan lokasi pada nol dan skala konstan. Perbedaan dalam model ini adalah bahwa guncangan acak ini digabungkan ke nilai masa depan dari seri waktu. Pemasangan perkiraan MA lebih rumit daripada model AR karena istilah kesalahan tidak dapat diamati. Ini berarti bahwa prosedur pemasangan nonlinear iteratif perlu digunakan sebagai pengganti kuadrat terkecil linier. Model MA juga memiliki interpretasi yang kurang jelas dibanding model AR. Kadang-kadang ACF dan PACF akan menyarankan bahwa model MA akan menjadi pilihan model yang lebih baik dan terkadang istilah AR dan MA harus digunakan pada model yang sama (lihat Bagian 6.4.4.5). Namun, perlu diingat bahwa istilah kesalahan setelah model sesuai harus independen dan mengikuti asumsi standar untuk proses univariat. Box dan Jenkins mempopulerkan pendekatan yang menggabungkan rata-rata bergerak dan pendekatan autoregresif dalam buku Time Series Analysis: Forecasting and Control (Box, Jenkins, dan Reinsel, 1994). Meskipun kedua pendekatan rata-rata autoregresif dan bergerak sudah diketahui (dan pada awalnya diselidiki oleh Yule), kontribusi Box and Jenkins adalah dalam mengembangkan metodologi sistematis untuk mengidentifikasi dan memperkirakan model yang dapat menggabungkan kedua pendekatan tersebut. Hal ini membuat model Box-Jenkins menjadi model kelas yang hebat. Beberapa bagian selanjutnya akan membahas model-model ini secara rinci. KAJIAN adalah salah satu dari banyak metode pemodelan modern yang menggunakan metode klasik, seperti regresi linier dan nonlinear least squares. Metode regresi modern dirancang untuk mengatasi situasi di mana prosedur klasik tidak berjalan dengan baik atau tidak dapat diterapkan secara efektif tanpa tenaga kerja yang tidak semestinya. LOESS menggabungkan sebagian besar kesederhanaan regresi linier kuadrat linier dengan fleksibilitas regresi nonlinier. Hal ini dilakukan dengan menyesuaikan model sederhana dengan himpunan bagian lokal dari data untuk membangun sebuah fungsi yang menggambarkan bagian deterministik dari variasi data. Point demi point. Sebenarnya, salah satu atraksi utama metode ini adalah analis data tidak diminta untuk menentukan fungsi global dari bentuk apapun agar sesuai dengan model dengan data, hanya untuk menyesuaikan segmen data. Trade-off untuk fitur ini adalah perhitungan yang meningkat. Karena sangat komputasi intensif, LOESS secara praktis tidak mungkin digunakan di era ketika regresi kuadrat sedang dikembangkan. Sebagian besar metode modern lainnya untuk pemodelan proses serupa dengan LOESS dalam hal ini. Metode ini telah dirancang secara sadar untuk menggunakan kemampuan komputasi saat ini sebaik mungkin untuk mencapai tujuan yang tidak mudah dicapai dengan pendekatan tradisional. Definisi LOESS Model LOESS, awalnya diusulkan oleh Cleveland (1979) dan dikembangkan lebih lanjut oleh Cleveland dan Devlin (1988). Secara khusus menunjukkan metode yang (agak) lebih deskriptif dikenal sebagai regresi polinomial tertimbang lokal. Pada setiap titik dalam kumpulan data, polinomial tingkat rendah sesuai dengan subkumpulan data, dengan nilai variabel penjelasan mendekati titik yang responsnya diperkirakan. Polinom sesuai dengan bujur sangkar terkecil, memberi bobot lebih pada titik di dekat titik yang responsnya diperkirakan dan bobotnya lebih sedikit untuk poin lebih jauh. Nilai fungsi regresi untuk titik tersebut kemudian diperoleh dengan mengevaluasi polinomial lokal dengan menggunakan nilai variabel penjelas untuk titik data tersebut. Kesesuaian LOESS selesai setelah nilai fungsi regresi dihitung untuk masing-masing titik data (n). Banyak dari rincian metode ini, seperti tingkat model polinomial dan bobotnya, fleksibel. Kisaran pilihan untuk setiap bagian dari metode dan default tipikal akan dibahas secara singkat selanjutnya. Subset Data Lokal Subset dari data yang digunakan untuk masing-masing kuadrat terkecil tertimbang dalam LOESS ditentukan oleh algoritma tetangga terdekat. Masukan yang ditentukan pengguna ke prosedur yang disebut parameter bandwidth atau smoothing menentukan berapa banyak data yang digunakan agar sesuai dengan masing-masing polinomial lokal. Parameter smoothing, (q), adalah angka antara ((d1) n) dan (1), dengan (d) yang menunjukkan derajat polinomial lokal. Nilai (q) adalah proporsi data yang digunakan pada setiap kecocokan. Subset data yang digunakan pada masing-masing bujur sangkar terkecil sesuai terdiri dari titik (nq) (bulat ke bilangan bulat terbesar berikutnya) yang nilai variabel penjelasnya paling dekat dengan titik di mana respons diperkirakan. (Q) disebut parameter smoothing karena mengendalikan fleksibilitas fungsi regresi LOESS. Nilai besar (q) menghasilkan fungsi paling halus yang menggoyangkan paling sedikit dalam menanggapi fluktuasi data. Semakin kecil (q), semakin dekat fungsi regresi akan sesuai dengan data. Dengan menggunakan nilai parameter smoothing yang terlalu kecil, hal ini tidak diinginkan, karena fungsi regresi pada akhirnya akan menangkap kesalahan acak dalam data. Nilai yang berguna dari parameter penghalusan biasanya terletak pada kisaran 0,25 sampai 0,5 untuk kebanyakan aplikasi LOESS. Derajat Polinomial Lokal Polinomial lokal yang sesuai untuk setiap subset data hampir selalu dari tingkat pertama atau kedua, baik secara linier lokal (dalam pengertian garis lurus) atau kuadrat lokal. Menggunakan polinomial derajat nol mengubah LOESS menjadi rata-rata bergerak tertimbang. Model lokal sederhana semacam itu bisa berjalan dengan baik untuk beberapa situasi, namun mungkin tidak selalu mendekati fungsi dasarnya dengan cukup baik. Polinomial tingkat tinggi akan bekerja secara teori, namun menghasilkan model yang tidak benar-benar dalam semangat LOESS. LOESS didasarkan pada gagasan bahwa fungsi apapun dapat didekati dengan baik di lingkungan kecil oleh polinomial dengan urutan rendah dan model sederhana dapat disesuaikan dengan data dengan mudah. Polinomial tingkat tinggi akan cenderung terlalu banyak menerima data di setiap subset dan secara numerik tidak stabil, membuat perhitungan akurat menjadi sulit. Seperti disebutkan di atas, fungsi bobot memberi bobot paling besar pada titik data yang terdekat dengan titik estimasi dan bobot paling kecil ke titik data yang terjauh. Penggunaan bobot didasarkan pada gagasan bahwa titik di dekat satu sama lain dalam ruang variabel penjelasan lebih cenderung saling terkait satu sama lain dengan cara yang sederhana daripada titik yang terpisah lebih jauh. Mengikuti logika ini, poin yang cenderung mengikuti model lokal mempengaruhi parameter lokal yang paling banyak perkiraan parameter. Poin yang cenderung tidak sesuai dengan model lokal kurang berpengaruh pada estimasi parameter model lokal. Fungsi berat tradisional yang digunakan untuk LOESS adalah fungsi berat tri-kubus, w (x) kiri (1 - x3) 3 mboxmike, pasang dulu R (jika belum), jalankan R dan pasang paket TeachingDemos (seberapa tepatnya tergantung Pada sistem anda), muat paket dengan library (TeachingDemos) lalu ketik loess. demo untuk membuka halaman bantuan untuk melihat bagaimana cara menjalankannya, Anda bisa menggulir ke bagian bawah dimana contohnya dan copy dan paste kode tersebut ke perintah R39s Line untuk melihat contohnya, lalu jalankan dengan data sendiri untuk lebih jelajahi. Ndash Greg Snow 23 Maret pukul 17.15 Berikut adalah tanggapan yang sederhana tapi rinci. Model linier sesuai dengan hubungan melalui semua titik data. Model ini bisa menjadi urutan pertama (arti lain dari linear) atau polinomial untuk memperhitungkan kelengkungan, atau dengan splines untuk memperhitungkan daerah yang berbeda yang memiliki model pemerintahan yang berbeda. Kesesuaian LOESS adalah regresi tertimbang yang bergerak secara lokal berdasarkan data asli. Apa yang dimaksud dengan LOESS sesuai dengan input nilai X dan Y asli, ditambah seperangkat nilai output X untuk menghitung nilai Y baru (biasanya nilai X yang sama digunakan untuk keduanya, namun nilai X yang lebih sedikit digunakan untuk pasangan XY yang pas Karena perhitungan yang meningkat diperlukan). Untuk setiap nilai output X, sebagian data masukan digunakan untuk menghitung kecocokan. Bagian data, umumnya 25 sampai 100 tetapi biasanya 33 atau 50, adalah lokal, artinya bagian dari data asli yang paling dekat dengan masing-masing nilai output X tertentu. Ini adalah fit yang bergerak, karena setiap nilai keluaran X memerlukan subset berbeda dari data asli, dengan bobot yang berbeda (lihat paragraf berikutnya). Subset titik data masukan ini digunakan untuk melakukan regresi tertimbang, dengan titik yang paling dekat dengan nilai output X yang diberi bobot lebih besar. Regresi ini biasanya orde pertama orde kedua atau yang lebih tinggi adalah mungkin, namun membutuhkan daya komputasi yang lebih besar. Nilai Y dari regresi tertimbang ini yang dihitung pada output X digunakan sebagai nilai model Y untuk nilai X ini. Regresi dihitung ulang pada setiap nilai output X untuk menghasilkan satu set lengkap nilai output Y. Jawab 21 Feb 15 jam 21:08

Comments