ارائه یک روش بازیابی اطلاعات مبتنی بر شبکه های عصبی عمیق برای سامانه‌های پرسش‌و‌پاسخ پیچیده

1 دانشجوی دکتری ، دانشگاه علم و صنعت ، تهران ، ایران

2 دانشیار ، دانشگاه علم و صنعت ، تهران ، ایران

3 استاد، دانشگاه جامع امام حسین(ع)، تهران، ایران


سامانه‏های پرسش‏پاسخ به عنوان نسل جدید موتورهای جستجو، توانایی بازیابی پاسخ مرتبط به پرسش‌های ارائه شده به زبان طبیعی را دارند. عموما این سامانه‏ها از سه بخش اصلی پردازش پرسش، بازیابی اطلاعات و استخراج پاسخ تشکیل شده‏اند و برای هر بخش روش‏های متعددی معرفی شده است. یکی از مهمترین بخش‏ها بازیابی اطلاعات و انتخاب پاراگراف‏های مرتبط است. امروزه اغلب پرسش های کاربران در سامانه‌های پرسش و پاسخ از نوع پیچیده است. برای پاسخدهی به این گونه پرسش‌ها ابتدا نیازمند درک پرسش و سپس بازیابی اسناد مختلف است که از نظر واژگانی و معنایی به هم مرتبط هستند. در سال‏های اخیر پیشرفت یادگیری مبتنی بر شبکه‏های عصبی عمیق از یک سو و معرفی مجموعه‏داده‏های باکیفیت در مقیاس بزرگ از سوی دیگر باعث جلب توجه پژوهشگران به این حوزه شده است.

در این پژوهش یک روش برای انتخاب پاراگراف‏های مرتبط برای سامانه‏های پرسش پاسخ پیچیده روی مجموعه داده هات پات کیوای معرفی شده است. برای انتخاب پاراگراف‏های مرتبط ابتدا نوع پرسش را با استفاده از یک شبکه عصبی عمیق تشخیص داده می‌شود. سپس با استفاده از مدل‏های زبانی برت در چند گام پاراگراف‏های مرتبط که شواهدی از پاسخ در آن نمایان باشد انتخاب می‏شوند. برای این‏کار از روش استخراج کلمات کلیدی در پرسش استفاده شده است. نتایج بدست آمده نشان از بهتر بودن نتایج نسبت به روش پایه دارد.


A Deep Neural Network-Based Information Retrieval Method for Complex Question-Answering Systems

  • Arash ghafouri 1
  • Hassan Naderi 2
  • Mohammad Hasani Ahangar 3
1 PhD student, University of Science and Technology, Tehran, Iran
2 Associate Professor, University of Science and Technology, Tehran, Iran
3 Professor, Imam Hossein University, Tehran, Iran
Question-answering systems, as the next generation of search engines, have the capability to retrieve relevant answers to queries posed in natural language. These systems generally consist of three main components: question processing, information retrieval, and answer extraction, with various methods introduced for each component. One of the most important aspects is information retrieval and selecting relevant paragraphs. Nowadays, most user queries in question-answering systems are complex. To respond to such queries, it initially requires understanding the question and then retrieving various documents that are lexically and semantically related to the query. In recent years, advancements in deep neural network-based learning on one hand and the introduction of high-quality datasets on a large scale on the other have attracted researchers' attention to this field. In this research, a method for selecting relevant paragraphs for complex question-answering systems on the HotpotQA dataset is introduced. To select relevant paragraphs, the type of question is first recognized using a deep neural network. Then, using BERT language models, relevant paragraphs that show evidence of the answer are selected in several steps. This process uses keyword extraction from the question. The results obtained indicate that the outcomes are better compared to the baseline method

  • Information Retrieval
  • Complex Question Answering
  • Paragraph Selection
  • Deep Neural Networks

دوره 12، شماره 1 - شماره پیاپی 45
شماره پیا پی 45 بهار 1403
خرداد 1403
صفحه 1-11
  • تاریخ دریافت: 11 اسفند 1402
  • تاریخ بازنگری: 26 فروردین 1403
  • تاریخ پذیرش: 20 اردیبهشت 1403
  • تاریخ انتشار: 13 خرداد 1403