Wednesday 7 March 2018

चलती - औसत - बाहरी - खोज


मैं आउटलाइयर हटाने के लिए डेटा को सुचारू करने के लिए चलती औसत फिल्टर का उपयोग कर रहा हूं औसत अंकों की संख्या को बदलकर, मुझे अलग-अलग परिणाम मिल रहा है.मेरा डेटा बहु-आयामी सुविधा वैक्टर हैं। मैंने चलती औसत को पूरे मैट्रिक्स और फिर व्यक्तिगत चर पर लागू किया था वे अलग-अलग परिणाम देते हैं। तो, कैसे औसत से अधिक अंकों की संख्या का अनुमान लगाया जाए और इसे पूरे मैट्रिक्स पर या किसी एक आधार पर लागू किया जाना चाहिए। 1 नवंबर को 21 44. ग्लैंबर 163 के 20 274 ​​557 एक चिकनाई पैरामीटर चुनने के लिए एक दृष्टिकोण एक-कदम-आगे पूर्वानुमान की त्रुटियों को अनुकूलित करना होगा जैसे कि एक-चरण-आगे पूर्वानुमान की त्रुटियों के वर्गों की रकम जैसे आप आउटलेटर्स की पहचान करने की कोशिश कर रहे हैं, तो आप भविष्यवाणी त्रुटि के एक अलग उपाय चाहते हैं - एक आउटलेरों के लिए काफी हद तक मजबूत और फिर औसत चलने के लिए एक अजीब विकल्प होगा - क्यों नहीं ग्लेनब 2 नवंबर 1 1 11 को आउटलेयर के लिए और अधिक मजबूत। दोनों तो नहीं। माफ करना, लेकिन मुझे लगता है कि यह एक चतुर एक है, जो कि स्वचालित टी वास्तव में या aut omitted बेशक अलग-अलग तरीकों को अलग-अलग परिणाम देते हैं, केवल समय वे नहीं चाहते हैं, जहां से बाहर जाना इतना स्पष्ट है कि आपको एक परीक्षण की आवश्यकता नहीं है। मेरा सुझाव संभव outliers की पहचान करने के लिए विभिन्न तरीकों का उपयोग करना है, फिर एक व्यक्ति पर उन outliers की जांच करना आधार। मैं समय की एक बड़ी श्रृंखला के साथ काम कर रहा हूं ये समय श्रृंखला मूल रूप से हर 10 मिनट में आने वाली नेटवर्क मापन होती है, और उनमें से कुछ समय-समय पर होते हैं अर्थात बैंडविड्थ, जबकि कुछ अन्य रूट वाले ट्रैफ़िक की मात्रा टाई करते हैं। मैं एक सरल एक ऑनलाइन बाउली पता लगाने के लिए एल्गोरिथ्म मूलतः, मैं प्रत्येक समय श्रृंखला के लिए स्मृति या डिस्क पर पूरे ऐतिहासिक डेटा रखना चाहता हूं, और हर बार जब कोई नया नमूना कैप्चर किया जाता है तो मैं किसी लाइव परिदृश्य का पता लगा सकता हूं सबसे अच्छा तरीका क्या है इन परिणामों को प्राप्त करने के लिए. मैं वर्तमान में चलती औसत का उपयोग कर रहा हूं ताकि कुछ शोर को हटाया जा सके, परन्तु फिर अगले सरल चीजें जैसे मानक विचलन, पूरे डेटा सेट के विरूद्ध पागल होकर अच्छी तरह से काम नहीं कर पा रहा है, ई टाइम सीरीज़ स्थिर हैं, और मैं कुछ और सटीक, आदर्श रूप से एक ब्लैक बॉक्स चाहूंगा। वेक्टर, ऐतिहासिक डेटा वाले डबल की सरणी है, और रिटर्न वैल्यू नए नमूना मान के लिए विसंगति स्कोर है। 2 अगस्त 18 03 पर। मैं नीचे दी गई योजना का सुझाव देता हूं, जिसे एक दिन में या तो लागू किया जाना चाहिए। जैसा कि आप स्मृति में रख सकते हैं, उतने नमूने एकत्रित करें। प्रत्येक विशेषता के लिए मानक विचलन का उपयोग करके स्पष्ट आउटलेरों को हटा दें। सहसंबंध मैट्रिक्स को क्ल्यूलेट करें और स्टोर करें प्रत्येक विशेषता का मतलब. आपके सभी नमूनों के महलोनोबिस दूरी को व्यवस्थित करें और संग्रहीत करें। बाह्यता की गणना। एक नमूना के लिए जिसे आप अपनी पारदर्शिता जानना चाहते हैं। साधनों को पुनः प्राप्त करें, मैट्रिक्स और महालनोबिस दूरी को प्रशिक्षित करने से लाभान्वित करें। महालनोबिस दूरी की गणना करें आपके नमूने के लिए घ। प्रतिशत्य को वापस लौटाएं जिसमें प्रशिक्षण से महलानोबिस की दूरी का उपयोग करते हुए डी गिर जाता है। यह आपका आउटएयर स्कोर 100 है, जो बेहद बाधित है। पीएस महालनोबिस् डिस्ट एनसीई सहसंबंध मैट्रिक्स का उपयोग नहीं करता है, संप्रभु मैट्रिक्स नहीं, यह अधिक मजबूत है यदि नमूना माप इकाइयों और संख्या में भिन्नता है। स्वचालित आउटएर डिटेक्शन ब्लेसिंग या शाप। एक और उलझन वाले प्रश्नों में से एक डिमांड प्लानर्स हमारे प्रशिक्षण कार्यशालाओं में पूछते हैं कि उनका सॉफ़्टवेयर फ्लैट भविष्यवाणी 90 बार एक महंगे सॉफ्टवेयर जो एक सेना और कुछ वर्षों तक लागू करने के लिए आम तौर पर एक निरंतर मॉडल का सुझाव दिया है या औसत मॉडल चल रहा है, इसका परिणामस्वरूप फ्लैट पूर्वानुमान हुआ। यद्यपि नग्न आंखें ग्राफ़िक रूप से देखते हैं यदि ग्राफ़ को उपलब्ध कराया जाता है उपयोगकर्ता एक अच्छा मौसमी पैटर्न, सॉफ्टवेयर में विशेषज्ञ चयन ने अनंतकाल के लिए लगातार पूर्वानुमान का उत्पादन किया है इस अंतिम परिणाम के तहत कई गुर कुछ ज्ञात हैं और इनमें से कुछ छिपे हुए हैं। दोषियों में से एक का पता लगाने वाला प्रक्रिया है सॉफ़्टवेयर समझदारी से पता लगा सकता है किसी दिए गए सेटिंग और outlier पहचान पद्धति के लिए outliers आमतौर पर आप पूर्व के कारक के आसपास सहिष्णुता बैंड विकसित करने के लिए एक K - कारक का उपयोग आउटलेटर्स की पहचान क्या-कारक हैं और कितने मामलों में अच्छा पूर्वानुमान मॉडल तैयार करने के लिए कश्मीर-कारक सेटिंग्स का लाभ उठाना है। हम कई मामलों में मनाया करते हैं, लोग कम कारकों का उपयोग करते हैं, जो तब सभी मौसमी चोटियों और गर्तों को फेंक देते हैं एक कम कश्मीर का कारक सुपर सतर्क है यह किसी भी पैटर्न को मॉडलिंग इंजन के माध्यम से भागने की अनुमति नहीं देता है सभी इंजन देखता है कि कुछ डेटा बिंदुओं का सिर्फ एक क्लस्टर होता है जो पूर्व-पूर्व पूर्वानुमान के आसपास या सिर्फ एक ऐतिहासिक मतलब के आसपास बिखरे हुए हैं। नीचे की तस्वीर देखें। 1 के कश्मीर का कारक, मांग प्रोफाइल में देखा गया सभी पैटर्नों को समाप्त करेगा, यह मूल डेटा सेट का एक अंश रखता है, जो हिंसक रूप से सटीक पूर्वानुमान के रूप में ऐतिहासिक मतलब के सभी बिंदुओं को उपलब्ध है, इसका उपयोग सांख्यिकीय इंजन की शक्ति के साथ कुछ नहीं करना है सॉफ्टवेयर के लिए। हमारे तीन दिवसीय कार्यशाला में आने पर हम स्वत: आउटलर डिटेक्शन के खतरों पर चर्चा करेंगे और उपस्थित लोगों को एक हाथ से व्यायाम के माध्यम से काम करेंगे, जो पूरे आउटएयर डिटेक्शन प्रक्रिया को बेहतर दृश्यता देगा। मैं इस खतरनाक प्रक्रिया के माध्यम से नेविगेट करने के लिए एसएपी एपीओ डिमांड प्लानिंग मॉड्यूल की खातिर सुविधाओं को समझाता हूं। 3 सितंबर को सॉफ्टवेयर प्लेटफॉर्म पर हाथों की प्रशिक्षण के साथ सभी एसएपी एपीओ होंगे। सितंबर 2011 में कार्यशाला सीधे मॉडल और पैरामीटर कार्यशाला में अपने लाइव भविष्यवाणियों में परिवर्तन। कार्यशाला पर अधिक जानकारी के लिए जाएं कृपया अगर आपके पास और अधिक प्रश्न हैं या एपीओ डीपी में आउटएयर डिटेक्शन प्रक्रिया पर चर्चा करना चाहते हैं, तो कृपया मुझसे संपर्क करें।

No comments:

Post a Comment