روشی جدید در خلاصه‌سازی متون فارسی بر اساس عبارت پرس‌وجوی کاربر

نویسندگان

صنعتی مالک‌اشتر

چکیده

سیستم‌های خلاصه‌سازی خودکار متون یکی از انواع سیستم‌های مدیریت اطلاعات حجیم هستند. این مقاله به یکی از شکل‌های خلاصه‌سازی‌های استخراجی به نام خلاصه‌سازی مبتنی بر پرس‌وجوی کاربر بر روی زبان فارسی می‌پردازد. مهم‌ترین فاز در این نوع خلاصه‌سازی محاسبه شباهت بین عبارت پرس‌وجو و اجزای متن اصلی است. در اینجا برای رسیدن به این مهم، بعد از طی کردن فاز پیش‌پردازش، تبدیل عبارت پرس‌وجو به جمله و بهره بردن از ابهام زدایی معنایی کلمات، به محاسبه شباهت معنایی بین عبارت پرس‌وجو و جملات متن پرداخته می‌شود و جملاتی که بیشترین شباهت معنایی را با عبارت پرس‌وجو داشته باشند برای حضور در خلاصه انتخاب می‌شوند. ارزیابی‌های حاصل از رویکرد پیشنهادی پایان‌نامه نشان از مطلوب بودن نسبی الگوریتم موردنظر دارد. با توجه به نوپا بودن زبان فارسی در زمینه پردازش زبان طبیعی، توسعه آنچه در این مقاله بررسی شده‌است و نظایر آن می‌تواند به بهبود اوضاع، کمک شایانی کند.

کلیدواژه‌ها