جدول ۴-۳۰ : مقادیر بیشینه آگاهی سوالات و تتای ماکسیمم در مدل دو پارامتری در آزمون ادبیات فارسی ۱۲۸
جدول۴-۳۱: توزیع سوالات آزمون ادبیات فارسی برحسب دامنه ی آگاهی در مدل دو پارامتری ۱۲۹
جدول۴-۳۲: مقادیر برآورد شده ی آگاهی و خطای استاندارد اندازه گیری آزمون ادبیات فارسی در سطوح مختلف توانایی برحسب مدل دو پارامتری ۱۳۰
جدول۴-۳۳: مقادیر برآوردشده ی پارامترهای سوال به همراه آزمون خی دو و سطح معناداری در مدل های یک پارامتری و دو پارامتری در آزمون زیست شناسی ۱۳۲
جدول۴-۳۴: بررسی برازندگی تک تک سوالات با مدل یک پارامتری و دو پارامتری در سطوح آلفای ۰۱/۰ و ۰۵/۰ ۱۳۵
جدول ۴-۳۵: توزیع سوالات آزمون زیست شناسی بر اساس پارامترهای سوال در مدل دو پارامتری ۱۳۶
جدول ۴-۳۶ : مقادیر بیشینه آگاهی سوالات و تتای ماکسیمم در مدل دو پارامتری در آزمون زیست شناسی ۱۴۰
جدول ۴-۳۷ : توزیع سوالات آزمون زیست شناسی برحسب دامنه ی آگاهی در مدل دو پارامتری ۱۴۲
جدول۴-۳۸: مقادیر برآورد شده ی آگاهی و خطای استاندارد اندازه گیری آزمون زیست شناسی در سطوح مختلف توانایی برحسب مدل دو پارامتری ……………………………………………………………………………………………………………………………………………………… ۱۴۲ جدول ۴-۳۹ : توزیع فراوانی وضعیت قبولی آزمودنیها به تفکیک جنسیت و درس…… ۱۴۵
جدول ۴-۴۰ : شاخص های توصیفی توزیع نمرات آزمودنی ها ۱۴۶
جدول ۴-۴۱: شاخص های توصیفی شکل توزیع نمرات آزمودنی ها ۱۴۶
جدول۴-۴۲: شاخص های توصیفی توزیع نمرات آزمودنی ها به تفکیک جنسیت ۱۴۸
جدول۴-۴۳: شاخص های توصیفی شکل توزیع نمرات آزمودنی ها به تفکیک جنسیت ۱۴۸
جدول ۴-۴۴: نتایج آزمون t مستقل بین دو گروه آزمودنی های پسر و دختر ۱۴۹
جدول ۵-۱ : میزان توافق دو مدل کلاسیک و IRT در تعیین سوالات مناسب و نامناسب از نظر قدرت تشخیص برای آزمون ادبیات فارسی………………………………………………………………………………………………………………………………………………………………………………۱۶۰
جدول ۵-۲ : میزان توافق دو مدل کلاسیک و IRT در تعیین سوالات مناسب و نامناسب از نظر قدرت تشخیص برای آزمون زیست شناسی……………………………………………………………………………………………………………………………………………………………………………..۱۶۱
فهرست نمودارها
نمودار۲-۱ : طرح ۱ ۳۲
نمودار۲-۲ : طرح ۲ ۳۳
نمودار۲-۳: طرح ۳ ۳۴
نمودار ۲-۴: سهم واریانس خطای نسبی و مطلق در طرح یک رویه ای متقاطع……………………………………………………….۳۶
نمودار۲-۵: روش های برآورد اعتبار………………………………………………………………………………………………………………….۴۹
نمودار۲-۶: روش های برآورد روایی…………………………………………………………………………………………………………………۶۱
نمودار۳-۱: تقسیم بندی واریانس برای طرح برآورد I(S:G:R)……………………………………………………………………………..49
نمودار۴-۱: نمودار اسکری آزمون ادبیات فارسی ۱۱۹
نمودار۴-۲ : منحنی ویژگی سوال های آزمون ادبیات فارسی در مدل یک پارامتری ۱۲۵
نمودار ۴-۳ : منحنی ویژگی سوال های آزمون ادبیات فارسی در مدل دو پارامتری ۱۲۶
نمودار ۴-۴ : منحنی ویژگی سوال ۴۸ آزمون ادبیات فارسی بر اساس مدل دو پارامتری ۱۲۷
نمودار ۴-۵: منحنی آگاهی سوال ۴۸ آزمون ادبیات فارسی بر اساس مدل دو پارامتری ۱۲۸
نمودار ۴-۶: منحنی آگاهی و خطای استاندارد اندازه گیری آزمون ادبیات فارسی برحسب مدل دو پارامتری ۱۳۱
نمودار۴-۷ : هیستوگرام توزیع توانایی آزمودنی ها در آزمون ادبیات فارسی برحسب مدل دو پارامتری ۱۳۱
نمودار۴-۸ : نمودار اسکری آزمون زیست شناسی ۱۳۲
نمودار۴-۹: منحنی ویژگی سوال های آزمون زیست شناسی در مدل یک پارامتری ۱۳۷
نمودار ۴-۱۰: منحنی ویژگی سوال های آزمون زیست شناسی در مدل دو پارامتری ۱۳۸
نمودار ۴-۱۱: منحنی ویژگی سوال ۲۴ آزمون زیست شناسی بر اساس مدل دو پارامتری ۱۳۹
نمودار ۴-۱۲ : منحنی آگاهی سوال ۲۴ آزمون زیست شناسی بر اساس مدل دو پارامتری ۱۴۰
نمودار ۴-۱۳ : منحنی آگاهی و خطای استاندارد اندازه گیری آزمون زیست شناسی برحسب مدل دو پارامتری ۱۴۳
نمودار۴-۱۴: هیستوگرام توزیع توانایی آزمودنی ها در آزمون زیست شناسی برحسب مدل دو پارامتری ۱۴۳
نمودار۴-۱۵ : منحنی توزیع نمرات آزمودنی ها…………………………………………………………………………………………………۱۴۷
فصل اول
کلیات تحقیق
مقدمه
در طول پنجاه سال اخیر، در جامعه جهانی دیدگاهی نسبت به آموزش و پرورش به وجود آمده است که گزارش اخیر شورای بین المللی آموزش و پرورش برای قرن بیست و یکم (دلورس[۱]، ۱۹۹۶) آن را ” آرمانی ضروری” تلقی می کند. این گزارش با قاطعیت ادعا می کند که آموزش و پرورش تنها یک سازوکار برای اکتساب دامنه محدودی از مهارت های پایه نیست، بلکه عاملی ارزشمند برای توسعه اجتماعی و فردی است. دارایی بیمانندی است برای تلاش (نوع بشر) به سوی دستیابی به آرمانهای ” صلح، آزادی و عدالت” و یکی از راههای اصلی در دسترسی برای پرورش الگویی عمیقتر و هماهنگتر از توسعه انسانی میباشد و از طریق آن، فقر، تبعیض، جهل، استضعاف و جنگ را میتوان کاهش داد (یونسکو[۲]، ۲۰۰۱، ترجمه سعیدی، ۱۳۸۴،ص ۱۸). امروزه جوامع به آموزش و پرورش به عنوان یکی از مهمترین راههای توسعه و پیشرفت همه جانبه مینگرند و هزینه های کلانی را در آن صرف می کنند. جوامع دریافتهاند که برای تحقق اهداف گوناگون، نیازمند نیروی انسانی ماهر و کارآمد هستند که دو دستگاه آموزش و پرورش و آموزش عالی متولی این امر میباشند. آنچه این دو را به هم پیوند میدهد، فرایند گزینش دانشجو است که در جوامع مختلف، متفاوت و بر مبنای انگیزه های گوناگونی شکل یافته است. اما در این میان سعی همه جوامع بر این است که امکانات آموزش عالی به شایستهترین و اصلحترین افراد تخصیص یابد.
در ایران دیر زمانی است که نظام پذیرش دانشجو از طریق کنکور صورت میگیرد که در بین جوانان به معنای” سرنوشت” تعبیر می شود و در کشور باعث تولید نوعی بحران شده است. از تحولات سالهای اخیر در زمینه نظام پذیرش دانشجو، مطرح کردن جایگزینی سوابق تحصیلی بجای کنکور است که در سال ۱۳۸۶ با عنوان قانون حذف کنکور به تصویب مجلس شورای اسلامی رسید و میبایست از سال ۹۰ اجرایی میشد که با توجه به مشکلات علمی، فنی و اجرایی به سرانجام نرسید. تا اینکه در مرداد ماه ۱۳۹۲ کلیات طرح جدید سنجش و پذیرش دانشجو به تصویب نمایندگان مجلس شورای اسلامی رسید که بر اساس آن، این مصوبه از کنکور سال آینده اجرا می شود و تأثیر سوابق تحصیلی (دور دوم دوره متوسطه) از سال ۹۳ به صورت پلکانی از تأثیر ۲۵ درصد شروع می شود تا در نهایت به ۸۵ درصد طی ۵ سال برسد.
با توجه به طرح جدید سنجش و پذیرش دانشجو، از امتحاناتنهایی مقطع متوسطه میتوان به عنوان یکی از مهمترین و سرنوشتسازترین ابزار سنجش علمی دانش آموزان نام برد. آنچه در این میان مهم جلوه می کند، کیفیت این آزمونها و استاندارد بودن سوالات آنهاست. از اولین گامها در کیفیت مستندسازی فنی ابزار اندازه گیری، تعیین روایی[۳] و اعتبار[۴] نمراتی است که از یک ارزیابی به دست میآیند.
با نگاهی به مجلات علمی کشورمان، میتوان دریافت در بسیاری از مطالعات صورت گرفته، نه تنها در زمینه آموزش و پرورش بلکه در رشته های گوناگون، با وجود منابع چندگانهی خطا باز محققان ضرایب اعتبار کلاسیک را گزارش می دهند. این در حالی است که در وضعیتهای اندازه گیری پیچیده که منابع چندگانهای از خطای اندازه گیری وجود دارد، نظریه کلاسیک آزمون[۵](CTT) قادر به برآورد اعتبار نیست. از این رو، تحقیق حاضر در پی آن است که ضمن معرفی نظریه تعمیمپذیری[۶](GT)، اعتبار امتحانات نهایی سال سوم متوسطه رشته تجربی در دو درس ادبیاتفارسی و زیستشناسی را با بهره گرفتن از طرحهای اندازه گیری این نظریه تعیین نموده و همچنین روایی آنها را مورد بررسی قرار دهد.
علاوه بر این، این تحقیق می کوشد ویژگیهای روانسنجی سوالات امتحانات نهایی را بر اساس CTT با توجه به اهمیتی که این مدل در تحلیل سوالات آزمونهای مختلف روانی- تربیتی داشته است، در کنار مدلهای نظریه پرسش- پاسخ[۷](IRT) مورد بررسی قرار دهد.
بیان مسئله
ارزشیابی پیشرفت تحصیلی فرایند منظمی است که با به کارگیری روشهای علمی، عملکرد یادگیرندگان و میزان آموختههایشان را میسنجد و در مورد عملکرد آنها با توجه به اهداف آموزشی مورد نظر به قضاوت و داوری می پردازد. امتحانات نهایی سال سوم متوسطه نوعی از ارزشیابی پیشرفت تحصیلی هستند که در پایان دوره آموزشی اجرا میشوند. از نتایج این امتحانات جهت سنجش آموختههای دانش آموزان، تصمیم گیری در مورد رد یا قبول شدن آنها و نیز ارزشیابی اثر بخشی برنامه آموزشی و شیوه تدریس مدرس استفاده می شود. همچنین با توجه به طرح جدید سنجش و پذیرش دانشجو در کشورمان، این امتحانات پلی برای ورود به دانشگاه محسوب میشوند. این کارکرد اخیر، بیش از پیش بر حساسیت این امتحانات میافزاید.
زمانی این امتحانات به عنوان ابزار گزینشی کارا و سودمند تلقی میشوند و میتوان به نتایج آنها اعتماد کرد که کیفیت این آزمونها در سطح مطلوبی باشد. به بیانی دیگر، در فرایند طراحی سوالات امتحانی و تصحیح اوراق امتحانی ملاکهای علمی و اصول روانسنجی رعایت شود. همچنین به دلیل هماهنگ بودن این امتحانات در سطح کشوری، صحت اجرا و امنیت آن نیز تضمین شود. به منظور برنامه ریزی، اتخاذ تصمیم در حدود اختیارات، اجرا، هماهنگی و نظارت بر حسن برگزاری امتحانات ستادی تحت عنوان ستاد امتحانات در سطح استان، شهرستان، منطقه، ناحیه برای انجام وظایف مورد نظر تشکیل میگردد و افراد زیادی در قبل، حین و بعد از برگزاری این امتحانات درگیر هستند و انجام وظیفه می کنند. همانطور که حسنی و کیامنش (۱۳۸۸) نیز مطرح کرده اند، سازوکار امتحانات نهایی تمامی بخشهای آموزش و پرورش از وزارتخانه تا منطقه و مدارس را درگیر می کند. روشن است که همه این تشکیلات عریض و طویل که سراسر کشور را در بر میگیرد، برای بالا بردن ضریب صحت اجرای امتحان است و با صحت نتایج آزمون و طراحی سوال کاملاً تفاوت دارد.
با اینکه برای طراحی سوالات این امتحانات از دبیران مجرب و آشنا با اصول طراحی سوال استفاده می شود با این حال در خصوص کیفیت سوالات این امتحانات و دقت عمل مصححان هنوز تردیدهایی وجود دارد و نمی توان با اطمینان گفت آیا اصول و قواعد آزمون سازی در مورد این سوالات رعایت می شود یا خیر. و آیا این امتحانات به عنوان ابزار گزینشی از روایی و اعتبار لازم برای شناسایی استعدادها برخوردارند یا نه. برای پاسخگویی به این سوالات، از علم روان سنجی و تئوری های آن استفاده می شود. تئوریهای روانسنجی به دو دسته تقسیم می شوند: دستهی اول نظریه نمونهبرداری تصادفی، که این نظریه خود شامل نظریه کلاسیک آزمون و نظریه تعمیمپذیری و دسته دوم شامل نظریه پرسش پاسخ است .
از فعالیتهای عمده و مهم متخصصان تعلیم و تربیت، ساخت و تفسیر آزمون و تحلیل سوالات آنها بر پایه تئوریهای جدید و پیشرفته روانسنجی میباشد که متأسفانه این مهم برای خیلی از متخصصان این عرصه ناشناخته است. در همین راستا، در این پژوهش ضمن بکارگیری نظریه های روانسنجی، روایی و اعتبار امتحاناتنهایی دروس زیستشناسی و ادبیاتفارسی سال سوم متوسطه رشته تجربی مورد بررسی قرار میگیرد. همچنین این پژوهش رسالت خود را معرفی یکی از چندین حیطه ی کاربردی نظریه های کلاسیک، تعمیمپذیری و پرسش - پاسخ برای شناساندن گوشه ای از مزایای علمی آنها و نهایتاً ایجاد رغبت برای مطالعه، پژوهش و نیز باز کردن دریچهی دیگری بر روی پژوهشگران میداند.
پایان نامه درباره بررسی روایی و اعتبار آزمون دروس زیست شناسی و ادبیات-فارسی در ...