بهينهسازي هوش مصنوعي فقط با جمعآوري دادههاي متخصصان ممكن است؟
مجلهي مادربورد در اوت امسال پروندهاي را به مايكروسافت و گوشدادن به صداي متخصصان ايكسباكس اختصاص داد. در آن پرونده، گفته شد ردمونديها براي بهبود كارايي سرويس خود، صداي ضبطشدهي متخصصان را به پيمانكاران ارسال ميكنند تا به آنها گوش دهند. در ابتداي همان ماه، خبر مشابهي دربارهي گوشدادن به صداي متخصصان اسكايپ و دستيار صوتي كورتانا منتشر شده بود. طبق ادعاي پيمانكاران، برخي از محتواي مطالعهشدهي متخصصان حاوي اطلاعات بسيار شخصي آنان بود.
دستيارهاي هوشمند صوتي و چتباتها روزبهروز محبوبتر ميشوند. در اين ميان، شركتهاي فناوري با اشكال بزرگ و جديدي روبهرو هستند. الگوريتمهاي هوش مصنوعي آنها براي كار با پيچيدگيهاي زباني انسانها طراحي نشدهاند؛ به همين دليل، آنها عموما در درك زمينه و موضوع دستورهاي متخصصان با اشكال مواجه ميشوند.
درحالحاضر، بهترين راه براي رفع اشكال مذكور، استخدام نيروي انساني است كه الگوريتمها را به مسير صحيح هدايت كند. براي پيادهسازي اين راهكار نيز عموما پيمانكاران بايد به صداي متخصصان واقعي گوش دهند. آنها برخي اوقات با مكالمههاي بسيار شخصي متخصصان سروكار دارند كه بايد به متن تبديل شوند.
مسئلهي درك زبان
دستيارهاي صوتي مبتنيبر صدا مانند الكسا و سيري و كورتانا بهدليل فناوري يادگيري عميق به پيشرفتهاي كنوني دست يافتهاند. يادگيري عميق زيرمجموعهاي از هوش مصنوعي محسوب ميشود كه در سالهاي اخير، بيش از همه در صدر اخبار بوده است. الگوريتمهاي يادگيري عميق عموما در پيداكردن الگوهاي مشابه و دستهبندي اطلاعات قوي هستند.
وقتي الگوريتم يادگيري عميق ميليونها صداي ضبطشده را بههمراه متن هركدام بهعنوان ورودي دريافت ميكند، در تبديل مكالمههاي جديد به متن، دقت بسيار زيادي مييابد. يادگيري عميق در پيشبيني رخدادها نيز بسيار قدرتمند است. وقتي الگوريتم هوش مصنوعي را با دادههاي بسيار زياد تربيت كنيد، توانايي تشخيص روابط رياضي را در ترتيب كلمههاي هر متن و مكالمه پيدا ميكند و درنهايت، وظايفي همچون كاملسازي جملهها را با قدرت بيشتري انجام خواهد داد.
يادگيري عميق با وجود همهي مزايا، در درك معني كلمهها و جملهها ناتوان است. چنين وظيفهاي هيچگاه فقط با تكيه بر مهارتهاي رياضي و آمار انجامشدني نخواهد بود. گري ماركوس، دانشمند علوم شناختي و مديرعامل شركت Robust AI، دربارهي درك صحبت و فهم زبان طبيعي ازطريق هوش مصنوعي ميگويد:
تشخيص گفتار و درك زبان طبيعي بهانديشه متخصصين اشكالات مشابهي هستند؛ اما درنهايت، آنها تفاوتهاي عمدهاي باهم دارند. در تشخيص گفتار، سيلابها و واجهاي محدودي در زبان داريد. بهعلاوه، تلاش ميكنيد جرياني صوتي را به مفهومي در دستهبنديهاي محدود تبديل كنيد.
زبان انگليسي بهعنوان پركاربردترين زبان جهان براي مطالعه قدرت هوش مصنوعي مطالعه ميشود. درحالحاضر، دههاهزار كلمهي پركاربرد در اين زبان وجود دارد. در دوران كنوني كه بهنام «كلانداده» شناخته ميشود، ميتوان بهآساني ميليونها مثال از هريك از كلمهها پيدا كرد و هوش مصنوعي را بهكمك آنها يادگيري داد.
درمقابل درك كلمهها، تجزيه و تفسير جملهها فرايندي بسيار دشوارتر خواهد بود. در موضوع تنوع جملهها، ميتوان تعداد نمونهها را بيشمار دانست كه هركدام هم معاني متفاوتي دارند. در اين ميان، معاني كلمهها هم بسته به موقعيت قرارگيري در جمله و كلمههاي قبل و بعد متفاوت ميشود. ماركوس درادامهي صحبتهاي خود دربارهي درك و تفسير جملهها ميگويد:
تقريبا تمامي جملههايي كه روزانه ميشنويم، جملهي منحصربهفرد محسوب ميشوند؛ البته تعداد بسيار محدودي از آنها از اين قائده مستثني هستند. درواقع، هيچ دادهي مستقيمي از جملهها نداريم و درنتيجه، در تفسير و درك آنها با اشكال مواجه خواهيم بود. روشهايي كه اكنون براي دستهبندي موارد و جانمايي آنها در گروههاي متعدد استفاده ميشوند، براي درك جملهها متخصصدي نخواهند بود. درك زبان بهمعناي اتصال درك كنوني شما از جهان پيرامون به كلمههايي است كه مخاطبان براي توضيح آن بهكار ميبرند.
يادگيري هوش مصنوعي هميشه به دادههاي فراوان محتاج است
ماركوس جزوه رايگان جديدي بهنام Rebooting AI دارد كه در آن به اشكالات درك و رمزگشايي زبان انساني بهوسيلهي هوش مصنوعي اشاره ميكند. از تواناييهاي كه ما انسانها در درك جملهها داريم، ميتوان به استفاده از دانش كنوني دربارهي جهان براي گرهگشايي از مسئلهها و پيچيدگيهاي زبان نوشتاري و گفتاري مخاطبان اشاره كرد.
مكالمههاي روزمره ابهامهاي زيادي دارند. بهعنوان مثال، ميتوان بهمعني متفاوت كلمهي «در» در جملههاي گوناكون اشاره كرد. در جملهاي «در» ميتواند ورودي اتاق يا ساختمان يا هر مفهوم بسته باشد و در مثالي ديگر، «در» براي مفهوم داخل چيزي بودن استفاده ميشود. انسانها با شنيدن جملههاي شامل اين كلمه، دشواري زيادي در تشخيص مفهوم آن نخواهند داشت؛ چون تركيب كلمههاي قبل و بعد و شرايط گفتن جمله را درك ميكنند.
چرخهي بيپايان يادگيري
همه ميدانيم ابزارهاي يادگيري عميق، عقل سليم بهمعناي عقل انساني ندارند. آنها فاقد دانشي جامع از جهان هستند و شركتهاي فناوري براي بهبود آنها هيچ چارهاي جز افزايش يادگيري با مثالهاي متنوع نخواهند داشت. درواقع، آنها اميدوار هستند تمامي نمونهها و انواع مثالهاي داده را بهعنوان ورودي به الگوريتم وارد كنند تا همهي آنها را بشناسد؛ درنتيجه، شركتها به نيروي انساني نياز پيدا ميكنند كه عموما هم بهصورت دوركار و پيمانكاري، وظايف را انجام ميدهند. آنها كارايي هوش مصنوعي شركت را مطالعه و اعتبارسنجي و دادههاي صوتي را به متن تبديل ميكنند كه الگوريتم از تبديل آنها عاجز است.
درك و تفسير جملهها در زبان طبيعي، به دركي جامع از جهان هستي نياز دارد
انسانها براي توضيح انواع موضوعات، از مفاهيم و تعريفهاي گوناگوني استفاده ميكنند و هرروز نيز به تعداد تعريفها و عبارتها افزوده ميشود؛ درنتيجه، يادگيري بيشتر مانند راهكاري موقت براي چالش هوش مصنوعي خواهد بود.
درواقع، هميشه مثالهايي وجود دارند كه هوش مصنوعي براي درك آنها يادگيري نديده است. پيشرفت و تكامل زبان بشري نيز هميشه ادامه دارد. تمام آنچه گفته شد، نياز به يادگيري را تشديد ميكنند و درنتيجه، بازهم داستانها و اخباري دربارهي گوشدادن نيروي انساني به صداهاي متخصصان را شاهد خواهيم بود.
ماركوس دربارهي روشهاي كنوني تكامل هوش مصنوعي ميگويد:
ضعف فناوري كنوني در نياز هميشگي آن به داده ديده ميشود؛ بهويژه در مسائل باز همچون درك مفاهيم زبان طبيعي، چنين نيازي بيشتر ميشود؛ درنتيجه شركتها براي تأمين نياز فناوري، انواع فعاليتها را انجام ميدهند. از انديشه متخصصينات من، جمعآوري دادهي بيشتر به حل اشكالات شركتها كمك نميكند. شايد اين رويكرد تا حدودي به كاهش اشكالات كمك كند؛ اما قطعا آنها را بهصورت كامل رفع نميكند.
بدون تزريق مفهوم عقل جامع و دانش پايهاي به الگوريتمهاي يادگيري عميق، نميتوان هيچ اميدي به حل كوتاهمدت اشكال آنها داشت. تا وقتي شركتها براي يادگيري الگوريتمهاي خود دادههاي متخصصان را جمعآوري و تفسير ميكنند، بايد براي واكنش شديد حاميان حريم خصوصي و اقدامهاي احتمالي قانونگذاران اين حوزه آماده باشند. همين موارد باعث شد تعدادي از شركتها سرعت روند جمعآوري و تفسير دادههاي متخصصان را كاهش دهند؛ ولي بهصورت كامل آن را متوقف نكردند.
اپل در اوت امسال، بيانيهي عذرخواهي در وبسايت خود منتشر كرد كه به اشتراك دستورهاي متخصصان در سيري با پيمانكاران مرتبط بود. كوپرتينوييها متعهد شدند تنها درصورت مشاركت مستقيم متخصص در طرحهاي آزمايشي و تحليل داده از اطلاعات او براي يادگيري هوش مصنوعي استفاده خواهند كرد. گوگل هم فعاليتهاي تحليل دادههاي متخصصان را در اروپا متوقف كرده است. قوانين حفاظت از دادههاي متخصصان در اين قاره با جديت بيشتري اجرا ميشوند؛ البته برنامهي اهالي مانتينويو در مناطق ديگر جهان نيز ادامه دارد.
مايكروسافت هم مانند غولهاي ديگر دنياي فناوري اسناد سياست حريم خصوصي خود را بهروزرساني كرد. اكنون متخصصان آنها ميدانند شايد مكالمهها و دستورهاي صوتيشان را نيروي انساني شنيده و مطالعه كرده باشد. درنهايت، آمازون نيز سياستهاي خود را تغيير و امكان خروج از برنامهي تفسير داده را به متخصصان داد؛ هرچند بسياري از آنها به چنين امكاني توجه نميكنند يا از آن اطلاع ندارند.
ماركوس اعتقاد دارد در طولانيمدت بايد چشماندازهاي جديدي در حوزهي هوش مصنوعي ايجاد شود. او درپايان مصاحبه ميگويد:
بايد در حوزهي هوش مصنوعي بيشتر تحقيق كنيم. درواقع، بايد فرهنگ را از ساختار مبتنيبر داده و رباضيات به فرهنگي تبديل كنيم كه ايدههاي موجود در زمينههاي ديگر همچون روانشناسي و فلسفه و زبانشناسي را هم بپذيرد. زمينههاي مذكور مطالعهي دقيقي دربارهي چگونگي فعاليت ذهن انسان كردهاند و احتمالا به ساختن تجربههاي بهتر و دقيقتر هوش مصنوعي كمك ميكنند.
هم انديشي ها