هوش مصنوعي IBM؛ حريفي قدر در مناظره با انسان
در چند سال اخير، هوش مصنوعي توانسته است بسياري از تواناييهاي انساني، از جمله خواندن، نوشتن، ديدن، لمس كردن، درك كردن، خلق كردن و بازي كردن را به طرز شگفتانگيزي حتي بهتر از انسان انجام بدهد؛ اما با تمام اين پيشرفتها، اين تكنولوژي هنوز نتوانسته است در مناظرهي رسمي با انسان عملكرد قابل قبولي داشته باشد.
براي غلبه بر اين اشكال، IBM كه چندي پيش براي كمك به مطالعات دربارهي ويروس كروناي جديد، هوش مصنوعياش را در اختيار دانشمندان گذاشت، پروژهي Debater را راهاندازي كرده است تا نشان بدهد هوش مصنوعي ميتواند حتي از پس مناظره با انسان دربارهي موضوعات پيچيده برآيد.
بسياري از پروژههاي هوش مصنوعي، مخصوصا آنهايي كه بر بازي متمركز هستند، به كمك ارزيابي معيارهاي عددي، برنده و بازندهي مشخصي دارند؛ اما شركت در مناظره با انسان به مهارت بسيار متفاوتي نياز دارد. پروژهي Debater نشان داد هوش مصنوعي ساخت شركت IBM نهتنها قادر است دربارهي موضوعي تحقيق كند، بلكه ميتواند متناسب با موضوع مباحثه، انديشه متخصصينات جذاب و درگيركنندهاي مطرح كند و در رد انديشه متخصصينات حريف انساني، از استدلال متقابل كمك بگيرد.
به گزارش Extremetech، مقالهي جديدي در مجلهي Nature نتايج آزمايشي كه در سال ۲۰۱۹ بين Project Debater و هريش ناتاراجان، قهرمان جهاني مناظره، برگزار شد، منتشر كرده است. در اين آزمايش، هوش مصنوعي و انسان دربارهي اينكه آيا بايد پيشدبستاني مشمول يارانه شود يا خير با يكديگر مناظره كردند. هر سمت مناظره ۱۵ دقيقه وقت داشت بدون دسترسي به اينترنت، خود را براي مباحثه آماده كند كه Project Debater در اين مدت، محتواي ذخيرهشده در ديتابيس داخلي خود را مطالعه كرد. هر دو طرف چهار دقيقه دربارهي موضوع مباحثه صحبت كردند و دو دقيقه هم به جمعبندي اختصاص داشت.
از آنجايي كه پروژهي Debater در نوع خود بينظير است، محققان نميتوانستند نتيجهي اين آزمايش را با نمونههاي پيشين مقايسه كنند؛ در نتيجه تصميم گرفتند جملهي آغازين اين پروژه را با جملات آغازيني كه از روشهاي ديگر به دست آمده بود، مقايسه كنند.
در نمودار زير، Summit سيستم جمعبندي چندسندي، Speech-GPT2 «مدل زباني بسيار دقيق» و Arg-GPT2 استدلالهايي است كه از پيوند زنجيرهاي ايجاد شده. Arg-Search به سخنرانيهايي اشاره ميكند كه از فناوري استخراج استدلال ArgumenText به دست آمدهاند. Arg-Human1 و Arg-Human2 به رويكردي تركيبي اشاره دارند كه در آن ماژول استخراج استدلال Debater را در مقابل نگارش و درستيسنجي انساني ميآزمايد. آخرين ستون مربوط به سخنرانيهايي است كه مستقيما از متخصص كارشناسان انساني به دست آمده.
براي مقايسهي عملكرد هر يك از اين موارد در مناظره، از خوانندگان خواسته شده بود به گزارهي «اين جملهي آغازين خوبي براي اين موضوع است»، از ۱ تا ۵ (بهشدت مخالف تا بهشدت موافق) نمره بدهند. از انديشه متخصصين خوانندگان، جملهاي كه هوش مصنوعي Debater براي شروع مناظره مطرح كرده بود، از انديشه متخصصين تناسب با موضوع مباحثه، فاصلهي چنداني با جملات متخصص كارشناسان انساني نداشت.
اين نمودار تنها قابليت اين پروژهي هوش مصنوعي را در طرح جملات آغازين مناظره ارزيابي ميكند؛ اما در اين حد نشان ميدهد كه اين سيستم قادر است در مناظرات، استدلالهاي منسجم و منطقي مطرح كند.
البته جواب اين سؤال كه برندهي مناظره كيست، هميشه برداشتي شخصي خواهد بود و حتي در اين آزمايش هم انسانها عملكرد بهتري نسبت به پروژهي Debater داشتند؛ اما نميتوان پيشرفت چشمگير بشر را در حوزهي هوش مصنوعي، از زمان پروژهي پردازش زبان طبيعي Eliza (كه توانست براي اولين بار تست تورينگ را با موفقيت پشت سر بگذارد) تا به امروز انكار كرد.
هم انديشي ها