Title
|
پيشنهاد يك روش جديد فشرده سازي رشته هاي يونيكد چند زبانه
|
Type
|
Presentation
|
Keywords
|
يونيكد، چند زبانه، پردازش متن، فشرده سازي
|
Abstract
|
استاندارد يونيكد يا Unicode ابتدا براي زبان انگليسي و كشورهاي انگليسي زبان ايجاد شد و در ادامه براي ساير زبان ها در كشورهاي مختلف دستورالعملي را تدوين نمود. با دستورالعمل يونيكد براي ذخيره سازي داده هاي چند زبانه مانند كدگذاري نويسه ها يا كاراكترهاي: عربي و فارسي، روي رايانه ها نياز به توسعه فضايي حداقل دو بايت است. لذا ارائه روشهاي مؤثر فشرده سازي براي متنهاي چند زبانه بدليل اهميت فضاي ارسال اطلاعات ضرورت پيدا مي كند. روشهاي متداول فشرده سازي نظير لغتنامه و تصادفي و هافمن مي توانند براي فشرده سازي رشته هاي چند زبانه به كار روند. ولي متأسفانه رشته هاي فشرده شده با اين روشها غير قابل پردازش مي شوند، زيرا اين روشهاي فشرده سازي كلاً ساختار رشته را به هم مي ريزند. بنابراين جستجوي يك رشته ساده در ميان رشته فشرده شده با مشكل مواجه مي شود. اين مقاله روشي براي فشرده سازي رشته هاي چند زبانه يونيكد ارائه مي كند كه رشته هاي فشرده شده همچنان قابل پردازش هستند و يك رشته را مي توان ميان رشته فشرده شده جستجو كرد و با اين شيوه براي فرستادن پيامك يا SMS كه فقط 140 بايت فضا موجود است، تعداد كاراكترهاي فارسي قابل انتقال از روي سامانه ها نسبت به انگليسي به دو برابر افزايش مي يابد.
|
Researchers
|
Vahid Meigoli (First researcher) , Mohsen Maygoli (Second researcher) , Fatemeh Nemati (Third researcher) , Hossein Mohtadi (Fourth researcher)
|