24 اسفند 1404
حميد كرمي كبير

حمید کرمی کبیر

مرتبه علمی: استادیار
نشانی: دانشکده مهندسی سیستم های هوشمند و علوم داده - گروه آمار
تحصیلات: دکترای تخصصی / آمار
تلفن: -
دانشکده: دانشکده مهندسی سیستم های هوشمند و علوم داده

مشخصات پژوهش

عنوان
منظم سازی و انتخاب ویژگی با استفاده از رگرسیون شبکه الاستیک و کاربرد آن در داده های با بعد بالا
نوع پژوهش پارسا
کلیدواژه‌ها
رگرسیون شبکه الاستیک، رگرسیون لاسو، رگرسیون ستیغی، تاوان، منظم سازی، انتخاب متغیر
پژوهشگران حمیدرضا دبیرزاده (دانشجو) ، حمید کرمی کبیر (استاد راهنما اول) ، احمد کشاورز (استاد مشاور)

چکیده

در بسیاری از کاربردهای واقعی از جمله داده کاوی، زیست اطلاعات، اقتصادسنجی و یادگیری ماشین، تحلیل داده های با بعد بالا و همبستگی شدید میان متغیرهای توضیحی با چالش هایی نظیر چندهمخطی، ناپایداری ضرایب و کاهش قدرت تعمیم پذیری مدل های رگرسیونی کلاسیک همراه است. در چنین شرایطی، روش های منظم سازی و انتخاب ویژگی نقش مهمی در کنترل پیچیدگی مدل، کاهش واریانس برآوردها و بهبود دقت پیش گویی و تفسیرپذیری ایفا می کنند. از این رو، مدل های خطی منظم سازی شده مانند رگرسیون ستیغی، لاسو و شبکه الاستیک به عنوان ابزارهای مؤثر برای مواجهه با داده های با بعد بالا مورد توجه قرار گرفته اند. در این پایان نامه، مدل های خطی کلاسیک و منظم سازی شده از جنبه های نظری، آماری و محاسباتی بررسی شده و عملکرد آن ها در شرایط وجود همبستگی و ابعاد بالا به صورت مقایسه ای تحلیل می شود. سپس با هدف بهبود همزمان انتخاب ویژگی، پایداری ضرایب و دقت پیش گویی، یک مدل توسعه یافته مبتنی بر چارچوب رگرسیون شبکه الاستیک پیشنهاد می گردد. کارایی مدل پیشنهادی با استفاده از چندین مجموعه داده شبیه سازی شده و واقعی با بعد بالا ارزیابی شده و نتایج نشان می دهد که این مدل در اغلب موارد عملکردی رقابتی و در بسیاری سناریوها برتری محسوسی نسبت به روش های کلاسیک و شبکه الاستیک استاندارد دارد‏.