Sunday 4 February 2018

جار نقل متوسط البيانات المفقودة


يتم استخراج الجدول أدناه من ويكيبيديا. وهو يظهر قراءات مؤشر تلوث المعايير (يسي) في سنغافورة. أحاول تقدير نقاط البيانات الأربعة المفقودة (2-5 صباحا) في يوم 20 يونيو. فعلت ذلك عن طريق التآمر أولا رسم بياني للقراءات لمدة 3 ساعات. ثم أحاول استخلاص القراءات ساعة واحدة مع الصيغة: ثم يتم استخدام هذه البيانات المشتقة لرسم رسم بياني للقراءات 1 ساعة. من الناحية النظرية، منحنى 3 ساعات مثل منحنى المتوسط ​​المتحرك الذي يتخلف منحنى ساعة واحدة. لا ينبغي أن يكون هناك الكثير من الانحراف. حاولت بعض القيم ولكن أنا الحصول على نتائج غير منتظمة بعنف. يتم رسم منحنى أدناه على أساس القيم 200،200،140 و 200. هل هناك طريقة للحصول على تقدير تقريبي للبيانات المفقودة طلب يونيو 21 14 في 14: 28A طريقة بسيطة وعامة لملء البيانات المفقودة، إذا كان لديك تشغيل البيانات كاملة ، هو استخدام الانحدار الخطي. ويقول لديك 1000 يدير من 5 في صف واحد مع عدم وجود عداد المفقودين. إعداد 1000 × 1 متجه y و 1000 × 4 مصفوفة X: الانحدار تعطيك 4 أرقام ب ج د التي تعطي أفضل مباراة ل 1000 صفوف من البيانات الخاصة بك مداش البيانات المختلفة، مختلفة ب ج د. ثم تستخدم هذه b c d لتقدير (التنبؤ، إنتيربولات) مفقود wt0. (بالنسبة للأوزان البشرية، يتوقع إد أبسد أن يكون في جميع أنحاء 14.) (هناك زيليونس من الكتب والأوراق على الانحدار، على جميع المستويات. للاتصال مع الاستيفاء، على الرغم من أنني لا أعرف من أي شخص مقدمة جيدة) ستاتا: البيانات تحليل والبرمجيات الإحصائية نيكولاس J. كوكس، جامعة دورهام، المملكة المتحدة كريستوفر بوم، كلية بوسطن إغن، ما () وحدودها ستاتارسكوس الأمر الأكثر وضوحا لحساب المتوسطات المتحركة هي وظيفة ما () من إغن. ونظرا للتعبير، فإنه يخلق المتوسط ​​المتحرك-بيريود من هذا التعبير. افتراضيا، يؤخذ على النحو 3. يجب أن تكون غريبة. ومع ذلك، كما يشير الإدخال اليدوي، إغن، ما () قد لا تكون مقترنة مع فارليست:. ولهذا السبب وحده، فإنه لا ينطبق على بيانات الفريق. في أي حال، فإنه يقف خارج مجموعة من الأوامر المكتوبة خصيصا لسلاسل زمنية انظر سلسلة زمنية للحصول على التفاصيل. النهج البديلة لحساب المتوسطات المتحركة لبيانات اللوحة، هناك خياران على الأقل. كلاهما يعتمد على مجموعة البيانات التي كانت تسيت مسبقا. هذا هو الكثير يستحق القيام به: ليس فقط يمكنك حفظ نفسك مرارا وتكرارا تحديد متغير لوحة ومتغير الوقت، ولكن ستاتا يتصرف بذكاء إعطاء أي ثغرات في البيانات. 1. اكتب التعريف الخاص بك باستخدام توليد باستخدام مشغلي سلسلة الوقت مثل L. و F.. تعطي تعريف المتوسط ​​المتحرك كحجة إلى بيان توليد. إذا قمت بذلك، فإنك، بطبيعة الحال، لا تقتصر على الوزن المرجح (غير مرجحة) المتوسطات المتحركة المتمركزة المحسوبة بواسطة إغن، ما (). على سبيل المثال، سيتم إعطاء متوسطات متحرکة متساوية الترجيح لثلاث فترات من خلال بعض الأوزان يمكن تحديدها بسهولة: يمكنك، بطبيعة الحال، تحديد تعبير مثل السجل (ميفار) بدلا من اسم متغير مثل ميفار. ميزة واحدة كبيرة من هذا النهج هو أن ستاتا تلقائيا يفعل الشيء الصحيح للبيانات لوحة: القيم الرائدة والتخلف يتم العمل بها داخل لوحات، تماما كما يملي المنطق يجب أن تكون. والعيب الأبرز هو أن سطر الأوامر يمكن أن يكون طويلا إذا كان المتوسط ​​المتحرك ينطوي على عدة مصطلحات. مثال آخر هو متوسط ​​متحرك من جانب واحد يعتمد فقط على القيم السابقة. ويمكن أن يكون ذلك مفيدا لتوليد توقعات تكيفية لما يمكن أن يستند إليه المتغير فقط على المعلومات حتى الآن: ما يمكن أن يتنبأ به شخص ما للفترة الحالية استنادا إلى القيم الأربع الماضية، باستخدام مخطط الترجيح الثابت (قد يكون الفارق الزمني 4 فترات (تستخدم عادة مع أوقات الفصول الربع سنوية.) 2. استخدام إغن، مرشح () من سك استخدم مرشح وظيفة إغن المكتوب من المستعمل () من حزمة إغنمور على سك. في ستاتا 7 (تحديث بعد 14 نوفمبر 2001)، يمكنك تثبيت هذه الحزمة التي بعد ذلك مساعدة إغنمور نقاط للتفاصيل على مرشح (). سيتم تقديم المثالين أعلاه (في هذه المقارنة قد يكون نهج التوليد أكثر شفافية، ولكننا سنرى مثالا على العكس في لحظة). يؤدي إلى تأخر سلبي: في هذه الحالة -11 يوسع إلى -1 0 1 أو الرصاص 1، تأخر 0، تأخر 1. و فيسينتس كويف، نومليست آخر، مضاعفة المتخلفة أو العناصر الرائدة المقابلة: في هذه الحالة هذه البنود هي F1.myvar . ميفار و L1.myvar. ويتمثل تأثير خيار التطبيع في قياس كل معامل بمجموع المعاملات بحيث يكون معامل التطبيع (1 1 1) معادلا لمعاملات 13 13 13 و كوف (1 2 1) تطبيع يعادل معاملات 14 12 14 يجب أن تحدد ليس فقط التأخر ولكن أيضا المعاملات. ونظرا لأن إغين، ما () توفر الحالة المرجحة بالتساوي، فإن الأساس المنطقي الرئيسي ل إغين، فيلتر () هو دعم الحالة المرجحة غير المتكافئة، والتي يجب أن تحدد معاملاتها. ويمكن القول أيضا أن إلزام المستخدمين بتحديد المعاملات هو ضغط إضافي قليلا عليهم للتفكير في المعاملات التي يريدون. المبرر الرئيسي لأوزان متساوية هو، ونحن نخمن، والبساطة، ولكن الأوزان متساوية لديها خصائص نطاق التردد رديء، على سبيل المثال الاعتبار واحد فقط. والمثال الثالث أعلاه يمكن أن يكون إما معقدا تماما مثل النهج المولد. هناك حالات حيث إغن، مرشح () يعطي صياغة أبسط من توليد. إذا كنت ترغب في مرشح ثنائي الحدين لمدة تسعة، والتي يجد علماء المناخ مفيدة، ثم يبدو ربما أقل رهيبة من وأسهل للحصول على الحق من، تماما كما هو الحال مع نهج توليد، إغن، تصفية () يعمل بشكل صحيح مع بيانات لوحة. في الواقع، كما ذكر أعلاه، فإنه يعتمد على مجموعة البيانات التي كانت تسيت مسبقا. نصيحة رسومية بعد حساب المتوسطات المتحركة الخاصة بك، وربما كنت تريد أن ننظر إلى الرسم البياني. الأمر المكتوب المستخدم تسغراف هو الذكية حول تسيت مجموعات البيانات. تثبيته في ما يصل إلى تاريخ ستاتا 7 التي كتبها سك إنست تسغراف. ماذا عن التقسيم الفرعي إذا لم يستفد أي من الأمثلة أعلاه من القيود. في الواقع إغن، ما () لن تسمح إذا كان سيتم تحديدها. أحيانا الناس يريدون استخدام إذا عند حساب المتوسطات المتحركة، ولكن استخدامه هو أكثر تعقيدا قليلا مما هو عليه عادة. ما الذي تتوقعه من المتوسط ​​المتحرك المحسوب إذا كان. دعونا نحدد إمكانيتين: التفسير الضعيف: أنا لا أريد أن أرى أي نتائج للملاحظات المستبعدة. تفسير قوي: أنا لا أريد حتى لك لاستخدام القيم للملاحظات المستبعدة. هنا مثال ملموس. لنفترض كنتيجة لبعض إذا الشرط، الملاحظات 1-42 مدرجة ولكن لا الملاحظات 43 جرا. ولكن المتوسط ​​المتحرك ل 42 سيعتمد، من بين أمور أخرى، على قيمة الملاحظة 43 إذا كان المتوسط ​​يمتد إلى الوراء وإلى الأمام، وهو طوله 3 على الأقل، وسيعتمد بالمثل على بعض الملاحظات 44 وما بعدها في بعض الظروف. تخميننا هو أن معظم الناس سوف تذهب للتفسير الضعيف، ولكن ما إذا كان هذا هو الصحيح، إغن، مرشح () لا يدعم إذا كان أي منهما. يمكنك دائما تجاهل ما كنت دونرسكوت تريد أو حتى تعيين القيم غير المرغوب فيها إلى المفقودين بعد ذلك باستخدام استبدال. ملاحظة حول النتائج المفقودة في نهايات السلسلة لأن المتوسطات المتحركة هي وظائف تأخر و يؤدي، إغن، ما () تنتج مفقودة حيث لا توجد تأخرات و يؤدي في بداية ونهاية السلسلة. وهناك خيار نوميس يجبر على حساب المتوسطات المتحركة الأقصر غير المقوسة للتيول. في المقابل، لا تولد ولا إيجين، تصفية () يفعل، أو يسمح، أي شيء خاص لتجنب النتائج المفقودة. إذا كان أي من القيم المطلوبة للحساب مفقود، فإن هذه النتيجة مفقودة. والأمر متروك للمستعملين لتحديد ما إذا كانت الجراحة التصحيحية مطلوبة لهذه الملاحظات وما إذا كان ذلك مفترضا بعد النظر إلى مجموعة البيانات والنظر في أي علم أساسي يمكن حمله.

No comments:

Post a Comment