سامانه پژوهشی دانشگاه خلیج فارس

عنوان	شناسایی هرزنامه ها با استفاده از مدل n-gram
نوع پژوهش	مقالات در همایش ها
کلیدواژه‌ها	فیلترینگ هرزنامه، دسته بندی، یادگیری ماشینی، مدل n-gram.
چکیده	با توجه به گرایش افراد و دولت ها به کاربرد ارتباطات الکترونیکی، سودجویان هر روز به دنبال راهی برای بهره برداری از این محیط ارتباطی مجازی دارند. یکی از موارد ناخواسته در ارتباطات الکترونیکی پیام های ناخواسته و غیر معتبر می باشد. در محیط تبادل نامه های الکترونیکی این پیام ها با نام هرزنامه شناخته می شوند. از جمله مواردی که در عمل باعث مقبولیت یک سرویس-دهنده پست الکترونیکی می گردد، توانایی فیلترینگ خودکار این گونه نامه ها می باشد. لذا الگوریتم های فیلترینگ هرزنامه ها به طور مداوم در حال پیشرفت و تکامل هستند و در مقابل نیز فرستندگان هرزنامه روش های جدیدی برای عبور از فیلترها ابداع می کنند. یکی از روش های مناسب برای فیلترینگ هرزنامه ها، مدل n-gram می باشد که اساس آن بر فرض وابسته بودن هر کلمه از نامه به n کلمه قبلی استوار است. این روش از دقت و سرعت مناسبی برخوردار می باشد. در این مقاله کارایی و نرخ موفقیت این مدل در تشخیص و دسته بندی هرزنامه ها مورد مطالعه قرار گرفته است. نتایج نشان داد که عملکرد این روش در شناسایی هرزنامه ها و متمایز نمودن آنها از نامه های معمولی، قابل قبول بوده و در عمل قابل استفاده می باشد.
پژوهشگران	فتانه دلاوری (نفر اول)، سیدمحمد بیدکی (نفر دوم)
تاریخ انجام	1390-12-03

مشخصات پژوهش