که با حد بالای زیری مقایسه میگردد:
برای زیر گروه n مشاهدی جدید i=1,…,n y1 با میانگین تغییر پذیری را به صورت زیر محاسبه می کنیم.
وقتی انحراف همهی مشاهدات در زیر گروه جدید از میانگین نمونه مرجع را در نظر میگیرد تغییر پذیری کل بدست میآید:
و داریم
محاسبات آماردههای دادههای گروهبندی شده همراه بررسی دادههای مطالعهی کارایی فرایند پینهای آلومینومی (مطالعه موردی ۱) شرح میدهیم. در فصل قبل ذکر که در ۷۰ مشاهدهی اول به عنوان نمونههای مرجع در نظر گرفته شد و ۴۰ مشاهدهی بعدی با آن مقایسه گردید. علاوه بر این دادههای هر دو نمونه مرجع و آزمایشی در زیر گروهها متوالی دو مشاهدهای (۱۵ و ۲۰ زیر گروه) گروهبندی شدهاند در جدول ۵٫۳ هر دو آمارهی مربوط به نمونه مرجع علاوه بر دو مشاهدهی اول زیر گروه ۱۶ ام که اولین زیر گروه نمونه آزمایشی است. آمده است که دادهها در مجموعهای اصلی دادهها هستند. بردار میانگین نیز ارائه شده است. آمارههای نمونه مرجع بردار میانگین و ماتریس کوواریانس (برای ۱۵ زیر گروه) و معکوس آن است. آمارهی را رابطهی زیر محاسبه می گردد
*
دقت کنید در خلاف محاسبات فصل قبل اکنون اهداف یامیانگین نمونهی مرجع هستند. در فصل ۳ اهداف مقادیری خارجی بودند در حالی که در فصل ۴ ابتدا مقادیر درونی بر مبنای کل ۷۰ مشاهده بودند. همچنین ماتریس بالا از فصول قبل متمایز است زیرا محاسبات به جای ۳۵ بر مبنای ۱۵ زیرگروه است.
معیار تغییرپذیری درونی به صورت زیر است:
=۲*۰٫۹۹=۱٫۹۸
ومقدار به طور خلاصه از برابر است با ۲۰٫۴۶٫
تجزیه به مولفه های آن که به ترتیب فاصله از هدف و تغییرپذیری درونی را اندازه گیری می کند،به وضوح نشان می دهد که فاصله از هدف قسمت اصلی تغییرپذیری کل (۱۸٫۴۸ از ۲۰٫۴۶) را تشکیل می دهد. به طور کلی مقادیر بزرگ متناظر انحراف اصلی از میانگین مرجع را نشان می دهد در حالیکه مقادیر کوچک نشان می دهد مشاهدات زیر گروه درونا همجنس هستند.
۳-۵ ارزیابی داده ها با نمودارهای کنترل چند متغیره
نمایش گرافیکی داده ها نقش مهمی در یافتن تغییرات در سطح متغیر شرح دهنده یک فرایند دارد. در حقیقت در مثال های بسیاری با تک متغیر نشان داده شده،کنترل کیفیت آماری عمدتأ شامل نمایش داده ها روی یک نمودار کنترلی و نمایش گرافیکی امتداد داده ها روی آن؛ و اقدام در زمانیست که یک عامل غیر تصادفی مشخص شود. علاوه بر این در مواردی که چندین خصوصیت تصویر می شوند، راه معمول آن تصویر کردن آنها روی چندین نمودار است. در نتیجه وقتی روی مشاهدات چند متغیر متمرکز می کنیم، مرور مختصر نمودارهای کنترل تک متغیره در بسیاری موارد حداقل مکمل نمودارهای چند متغیره است.
نمودارهای تک متغیره در سال (۱۹۲۴)توسط شوهارت معرفی و در سال ۱۹۳۱ در کتاب او توصیف شد؛ و به عنوان اساس گسترش کنترل کیفیت آماری درضایع درنظر گرفته می شود. تمایلات و تغییرات در سطوح متغیرها به صورت طبیعی و وسیع از روی نمودارهای گرافیکی درک خواهد شد تا جداول عددی. این دید خصوصأ در شرایط صنعتی بسیار معمول و معتبر است.
نمودارهای کنترل شوهارت، مقادیر مشاهدات مجزا و میانگین مشاهدات زیرگروه ها را به ترتیب در نمودار نمایش می-دهد. وقتی داده ها گردهمبندی هستند، نمودار اغلب با نمودارهایی که مقدار آماره یا پراکندگی را نشان می دهند همراه است (مثل نمودار دامنه یا انحراف استاندارد). در نمودار ۶٫۱ زوج نمودار (,R) برای ششمین متغیر مطالعه موردی اول نشان داده شده اند
نمودارهای اضافی متنوعی برای تصویر کردن پراکندگی فرایند و پارامتر مکانی آن گسترش یافته اند و درضایع بکار می روند. نظیر نمودار میانه، نیم دامنه، CUSUM، دامنه متحرک ، میانگین متحرک وزی نمایی و غیره. توضیحات پیرامون این نمودارها در کتب کنترل کیفیت تک متغیره، موجود است.
با این وجود متغیرهای متعددی می توانند توامأ تصویر شوند؛ حتی اگر نمودارهای تک متغیره وابسته به همه متغیرها ساخته شوند، این نمایش جداگانه اطلاعات ناقصی درمورد فرایند می دهد. این نقص خصوصأ درمورد خصوصیات کیفیتی که همبستگی کامل یا متوسط دارند صادق است همچنین به وضوح مشکلاتی در ارزیابی همزمان نمودارهای متعدد وجود دارد. به خصوص وقتی چندین بعد را توامأ بررسی می کنیم تصمیم اینکه مشاهده درحالت خارج از کنترل است، نسبت به حالتی که یک نمودار با مقایسات متعدد داریم، در معرض نرخ بالاتری از زنگ خطرهای اشتباه است.
نمودار ۳-۶ ]۲۴[
یک رویه برای غلبه در این مشکلات، گسترش ارزیابی تک متغیره با تصویر کردن آماره ایست که انحراف کلی مشاهدات (چند متغیره) از هدف را اندازه گیری می کند. پرکاربردترین آماره در این زمینه هتلینگ است که در فصول قبل شرح داده شد. نمودارهای چند متغیره که آماره هتلینگ را نمایش می دهند نیز گاهی نمودارهای کنترل شوهارت نامیده می شوند، اگرچه شوهارت در توسعه آن هیچ نقشی نداشته است. همانند حالت تک متغیره وقتی داده ها گروهی باشند، نموداری که فاصله میانگین گروه ها را از مقدار هدف را نشان می دهد، می تواند با نمودارهایی که میزان پراکندگی درون زیرگروه ها را برای همه خصوصیات ارزیابی شد، تصویر می کند همراه شود نظیر آماره ی .نمودارهای ترکیبی و مکمل های چند متغیره برای نمودارهای تک متغیره و هستند و برای داده های چند متغیره معیارهای کلی فاصله از هدف و پراکندگی درون گروه ها را نشان می دهند. در نمودار a 6.2 نمودار و در نمودار b 6.2 نمودار برای داده های مطالعه قابلیت همه شش پین های آلومینیومی را داریم. محور عددی نظیر مقادیر (یا ) برای هر زیرگروه مشاهدات است.
نمودار ۳-۷ نمودار و برای تغییرپذیری نمونه ها و درونی هر نمونه مطالعه موردی اول]۲۴[
بررسی دو نمودار بسیار ساده تر از بررسی ۶ نمودار شوهارت تک متغیره برای هر متغیر است.با این وجود نمودار های شوهارت چند متغیره کمتر از نظایر تک متغیره ی خود کمتر محبوبیت دارند. علاوه بر مشکلات محاسباتی آنها، برخی ویژگی ها وجود دارند که از جذابیت آنها می کاهند. اول اینکه برخلاف موارد تک متغیره مقیاس مقادیر نمایش داده شده روی نمودار به مقیاس هیچ یک از متغیرهای گفته شده مربوط نیست. دوم وقتی آماره از مقادیر بحرانی نشان داده شده روی گراف تخطی می کند، درمورد متغیر یا متغیرهای باعث این حالت شده اند. این اطلاعات به وضوح برای هر تلاشی در جهت یافتن انحرافات و امکان اصلاح فرایند لازم و ضروریست. در بخش ۷ برخی روش های تحلیلی گسترش یافته اخیر برای بحث پیرامون این مشکل بیان می شود. در بخش یازدهم نیز برخی روش های گرافیکی برای تشخیص علل انحراف را ارائه می دهیم. کاربرد و اهمیت روش های ارائه شده در فصل ۱۱ با بررسی مجدد داده های گروه های دور از مرکز شرح داده شده فوق، توضیح داده می شود.
۳-۶ شناسایی مشخصات خارج از کنترل
در فصل های قبل آماده ی و نمودار های کنترل را برای آزمون فرض اینکه مشاهده ی چند متغیره ی جدید(گروهی از مشاهدات) از توزیع یکسان با توزیع “مقادیر هدف” برخوردارند ارائه کردیم. وقتی مقدار علامت خارج از کنترل را نشان می دهد موضوع مهم تشخیص متغیر یا متغیرهایست که آن علامت را ایجاد می کنند. درحالیکه که در صنایع بسیار معمول است خصوصیات منفرد مشاهده می شوند. چنین رویکردهایی به تنهایی رضایتبخش نیست چون این رویه ها برای همستگی بین متغیرها پاسخگو نیست.
در سال های اخیر یک سری رویکردهای کنترل چند متغیره برای یافتن متغیرهای خارج از کنترل گسترش یافته است. درکل روش ها از توابع مختلف تجزیه آمارهای استفاده می کنند، که آمارهای آمارهای کلی هستند که ارزیابی اولیه یا ارزیابی زیرمجموعه p خصوصیت بدست می آیند. روش های مختلفی در این فصل ارائه می شوند. برای سادگی آنها را به مواردی که مقادیر هدف از نمونه مرجع به اندازه و نمونه آزمایشی یک مشاهده p بعدی جدید(یعنی ) است محدود می کنیم..
همانطور که در بخش پنجم ذکر شد در این حالت آماره کلی عبارت است از :
و تحت فرض صفر داریم :
وقتی مقدار از مقدار بحرانی تخطی می کند، سعی ما یافتن متغیرهای موجب این موضوع است. روش های مناسب اینکار به دو گروه تقسیم می شوند :
رویکردهایی که فرض می کنند بین زیرمجموعه های متغیرها اولیت ترتیبی وجود دارد. این آزمون ها مکرر انجام می شود. در هر مرحله(غیر مرحله اول) فرضیه های شرطی را برای یک زیرمجموعه خاص امتحان می کنیم. مشروط کردن اینگونه است که میانگین های متغیرها در زیرمجموعه های قبلی مثل جمعیت مرجع است یاخیر(رویکرد برگشتی یا گام پایینی).
رویکردهایی که هیچ ترتیب مشخصی بین متغیرها فرض نمی کنند.
۳-۷ کاربردهای اجزا اصلی
یک رویکرد معمول در کنترل کیفیت چند متغیر، تلاش برای کاهش ابعاد داده ها با تبدیل p متغیر اصلی به یک مجموعه داده ها با بعد کمتر با تشخیص چندین ترکیب خطی معنی دارند p بعد است. ساختار ترکیب خطی مشخص را جزاصلی گویند که اینک آنرا توضیح می دهیم. مطالعه موردی اول برای شرح و تفسیر مبحث اجزاء اصلی در کنترل کیفیت به کار می رود :
اگر iامین مشاهده p بعدی در داده های اصلی باشد، یک مشاهده p بعدی جدید می سازیم بطوریکه lامین متغیر در Z یعنی ترکیب خطی از انحرافات p بعد اصلی از مقدار هدفشان است یعنی :
اکنون شرح منطق و ساختار اجزاء اصلی را ارائه می دهیم. برای یک فرایند با داده های چند متغیره، واریانس کلی به صورت مجموع واریانس های p متغیر یعنی مجموع عناصر قطر اصلی ماتریس تعریف می گردد.
اگر ریشه های مشخص (تابع) ماتریس کوداریانس (مقادیر ایگن) را با نشان دهیم، مجموع آنها با مجموع واریانس فرایند بالا برابر است یعنی
به علاوه اگر ریشه های مشخص را طوری مرتب کنیم که باشد ماتریس C که سطرها متناظر بردارهای مشخصه (بردارهای ایگن) هستند روابط را ارضا می کند که ماتریسی است که ها روی قطر اصلی قرار دارند و همه ی عناصر غیر قطری صفر هستند، اکنون می توان نشان داد که اگر تبدیلات خطی زیر بکار روند :
متغیرهای جدید غیر همبسته هستند و اگر ماتریس کوواریانس معلوم باشد، واریانس ترتیبی آن است. برای iامین مشاهده به ترکیب خطی بیشترین واریانس را در میان تمام ترکیبات خطی ممکن از Xها دارد. گاهی اوقات نسبت را"واریانس مشروح” جزء اصلی اول می نامند، متشابهأ برای تا آخر ادامه دارد. برای چند جزء اصلی آخر نسبت چنان کوچک است که می توان متغیرهای Z متناظرشان را در ارزیابی نادیده گرفت.
وقتی ماتریس نامعلوم باشد ولی بتوان آنرا تخمین زد، متغیرهای Z هنوز هم متعامد هستند و تخمین آنها نسبت به ماتریس کوداریانس اصلی است.
آنالایز داده ها با نمودارهای اجزاء اصلی :
برای هر مشاهده چند متغیره، اجزاء اصلی ترکیبات خطی انحرافات p متغیر از اهداف مربوط هستند. اجزاء اصلی دو ویژگی دارند که در کنترل کیفیت بسیار مفید است :
متغیرهای جدید ناهمبسته کامل (یا تقریبأ ناهمبسته) هستند.
در بسیاری موارد، تعداد کمی از اجزاء اصلی می تواند بیشتر تغییر پذیری داده ها را مجسم کند، بنابراین به همه p جزو اصلی برای کنترل نیاز نداریم.
مزایای نمودارهای اجزاء اصلی نسبت به نمودارهای کنترلی انفرادی شوهارت (ناهمبستگی متغیرها و امکان صرفه جویی) با از دست دادن ماهیت اصلی متغیرها بدست می آید. بعلاوه در برخی موارد، ترکیبات خطی شخص متناظر با اجزاء اصلی با مقادیر ایگن بزرگ می توانند واحدهای اندازه گیری معناداری بدست بدهند.
اکنون با داده های مطالعه موردی اول b را شرح می دهیم، دقت کنید جزاول ۶۷ درصد تغییر کلی را شرح می دهد و این مقادیر برای اجزای دوم و سوم به ترتیب ۲۱٫۴۷ و ۱۰ درصد است ، همانطور که مشاهده می شود بیش از ۹۸ درصد تغییرات را این سه متغیر شرح می دهند و بقیه متغیرها قابل چشم پوشی هستند.
جدول ۳-۱۶- مقادیر و بردارهای ایگن ماتریس واریانس کواریانس ۳۰ مشاهده مطالعه موردی اول
مقادیر ایگن | درصد | درصد تجمعی | vec 1 | vec 2 |