يادگيري عميق چيست و چه متخصصدهايي دارد؟
ترنس سجنوفسكي، يك عصبپژوه محاسباتي در موسسه مطالعات بيولوژيكي سالك است. او ميگويد كه كليدواژههايي نظير يادگيري عميق و شبكههاي عصبي همه جا به چشم ميخورند؛ اما درك بيشتر مردم درمورد اين مفاهيم، كاملاً اشتباه است.
سجنوفسكي، پيشگام در مطالعهي الگوريتمهاي يادگيري و نويسندهي جزوه رايگان انقلاب يادگيري عميق (كه هفتهي آينده از انتشارات MIT منتشر ميشود) است. او استدلال ميكند كه ما راجع به مباحثي نظير هوش مصنوعي قاتل يا رباتهايي كه قرار است جايگزين ما شوند، تفكري اعتيادآميز داريم؛ اين در حالي است كه در سايهي اين طرز تفكر، پتانسيلهاي هيجانانگيز پيش رو در زمينههاي علوم كامپيوتر و اعصاب ونيز اتفاقاتي كه در صورت تلاقي هوش مصنوعي با هوش انساني رخ خواهند داد، كاملاً به حاشيه رانده شدهاند.
مجلهي خبري ورج با سجنوفسكي درمورد اينكه چگونه يادگيري عميق ناگهان فراگير شد، دربارهي تواناييها و محدوديتهاي اين دانش و نيز مسائل اغراقآميز درمورد آن مصاحبه كرده است كه شرحي از آن براي شما ارائه كردهايم.
ترنس سجنوفسكي ميگويد كه درك عموم درمورد مفاهيمي نظير «يادگيري عميق» و «شبكههاي عصبي»، كاملاً اشتباه است. اشكال اين است كه مردم در مورد مقياس زماني، اشتباه ميكنند. آنها انتظار دارند كه خيلي زود، تغييراتي بسيار بزرگ روي دهد.
مردم كلماتي مانند «هوش مصنوعي»، « شبكههاي عصبي»، «يادگيري عميق» و «يادگيري ماشيني» را با يكديگر اشتباه ميگيرند، اما اينها مفاهيمي متفاوتي هستند. تفاوت آنها در چيست؟
تعريف مفهوم هوش مصنوعي به سال ۱۹۵۶ در آمريكا بازميگردد؛ زماني كه مهندسان تصميم گرفتند تا يك برنامه رايانهاي با تقليد از هوش بشري بنويسند. در دل هوش مصنوعي، يك مفهوم جديد با نام يادگيري ماشين خلق شد. در اين روش، بهجاي آن كه شما يك برنامهي گامبهگام براي انجام يك كار بنويسيد (كه يك رويكرد سنتي در زمينهي هوش مصنوعي است)، اطلاعات فراواني در مورد آنچه كه ميخواهيد بفهميد، جمعآوري ميكنيد. براي مثال، تصور كنيد كه قصد داريد كه اشيا را از يكديگر تشخيص دهيد، بنابراين شروع به جمعآوري تعداد زيادي از تصاوير مربوط به آنها ميكنيد. سپس با يادگيري ماشين، يك فرايند خودكار آغاز ميشود كه ويژگيهاي مختلف اشيا را تجزيهوتحليل ميكند. در نهايت، سيستم تشخيص ميدهد كه فلان تصوير مربوط به يك خودرو است؛ درحاليكه تصوير ديگر يك منگنه را نشان ميدهد.
يادگيري ماشين يك عرصهي بسيار وسيع است كه پيدايش آن به مدتها قبل بازميگردد. در اصل، اين علم با نام تشخيص الگو شناخته ميشد، اما بهمرور الگوريتمها، از انديشه متخصصين رياضي، بسيار وسيعتر و البته پيچيدهتر شدند. در يادگيري ماشين، از دو مفهوم شبكههاي عصبي (با الهام از ساختار مغز) و يادگيري عميق استفاده ميشود. الگوريتمهاي يادگيري عميق، داراي معماري ويژهاي با تعداد لايههاي فراوان است كه در يك شبكه جريان مييابند. بنابراين، يادگيري عميق بخشي از يادگيري ماشين و يادگيري ماشين خود بخشي از هوش مصنوعي به حساب ميآيد.
يادگيري عميق چه قابليتهايي نسبت به ساير برنامهها دارد؟
نوشتن يك برنامه، كاري بسيار دشوار است. در گذشته، رايانهها چنان كند بودند و حافظه نيز به حدي گرانارزش بود كه ناچار به علم منطق روي آورده شد؛ اين همان علمي است كه رايانههاي فعلي بر اساس آن كار ميكنند. منطق، زبان پايهي ماشينهاست كه توسط آن، اطلاعات بهصورت بيت به بيت پردازش ميشوند. اما رايانهها همچنان بسيار كند و محاسبات بسيار پرهزينه بود.
اما اكنون هزينهي محاسبات روز به روز كمتر ميشود و از سوي ديگر هزينهي نيروي كار مدام در حال افزايش است. هزينهي محاسبات به حدي ارزان شده است كه تهيهي يك رايانه براي يادگيري يك برنامه، به صرفهتر از استخدام يك فرد براي نوشتن همان برنامه است. در اين برهه از زمان، يادگيري عميق شروع به حل مسائلي كرد كه هيچ انساني تا آن زمان براي آن برنامهاي ننوشته بود؛ حوزههايي مانند بينايي رايانهاي و ترجمه، نمونههايي از اين پيشرفت بودند.
يادگيري فرايندي بهشدت محاسباتي است، اما شما فقط نياز داريد يك بار برنامه بنويسيد و سپس با دادن اطلاعات مختلف به آن، ميتوانيد مسائل مختلف را حل كنيد. ديگر نيازي نيست كه شما حتماً در يك موضوع متخصص باشيد؛ چرا كه هزاران برنامهي متخصصدي درمورد هر موضوعي ميتوان يافت كه در آن با حجم زيادي از اطلاعات سروكار داريم.
به انديشه متخصصين ميرسد كه امروزه «يادگيري عميق» در همه جا مطرح است؛ اين مفهوم چگونه تا اين حد فراگير شد؟
من در حقيقت ميتوانم به يك لحظهي خاص از تاريخ اشاره كنم: دسامبر ۲۰۱۲ در نشست NIPS (كه بزرگترين كنفرانس هوش مصنوعي است)، متخصص رايانهاي بهنام جف هينتون به همراه دو تن از دانشجويان متخصص كارشناسي ارشد خود نشان داد كه با در اختيار داشتن يك مجموعهي دادهي بسيار بزرگ بهنام ايميجنت شامل ۱۰ هزار دستهبندي و ۱۰ ميليون تصوير، ميتوان خطاي طبقهبندي را با كمك يادگيري عميق، تا ۲۰ درصد كاهش داد.
معمولاً در اين مجموعهدادهها، ميزان خطا در هر سال كمتر از يك درصد كاهش مييافت. حالا نتيجهي ۲۰ سال پژوهش، تنها در عرض يك سال حاصل شده بود. اين دستاورد، واقعاً به معناي باز شدن دريچهي يك سد بود.
يادگيري عميق از مغز الهام ميگيرد. چگونه حوزههايي نظير علوم رايانه و علوم اعصاب، در كنار يكديگر كار ميكنند؟
در حقيقت، ايدهي يادگيري عميق از علم اعصاب سرچشمه ميگيرد. نگاهي به موفقترين شبكههاي يادگيري عميق بيندازيد؛ نام اين شبكه، شبكهي عصبي پيچشي يا سي.ان.ان (CNN) است كه توسط يان ليكون توسعه يافته است.
اگر به معماري CNN توجه كنيد، ميبينيد كه آن مجموعهاي از تعداد زيادي واحدهاي مجزا نيست؛ بلكه آنها به يك روش بنيادي با يكديگر در ارتباط هستند كه به نوعي يادآور سيستم مغز است. يكي از بخشهاي مغز (كه به نحو احسن در سيستم بينايي و قشر بينايي مورد مطالعه قرار گرفته است) نشان ميدهد كه در مغز دو دسته سلول شامل انواع ساده و پيچيده وجود دارند. اگر به معماري CNN هم توجه كنيد، خواهيد ديد آنجا هم دو دسته سلول متناظر با سلولهاي ساده و سلولهاي پيچيده وجود دارند. اين تشابه بهطور مستقيم از درك سيستم بينايي در مغز ناشي شده است.
يان، كوركورانه به كپيسازي قشر مغز نپرداخته است. او پيشتر انواع مختلفي از تغييرات را امتحان كرده بود، اما در نهايت او به همان ساختاري رسيد كه پيشتر طبيعت به آن رسيده بود. اين يك نتيجهي مهم است. موضوعات فراواني در همگرايي طبيعت و هوش مصنوعي وجود دارد كه بايد ياد بگيريم و مسلما هنوز مسيري طولاني در پيش روي ما قرار دارد.
درك ما از علوم رايانه تا چه ميزان به درك ما از مغز وابسته است؟
بيشتر دستاوردهاي ما در زمينهي هوش مصنوعي، براساس دانشي است كه ما در دهه ۶۰ درباره مغز فراگرفتيم. ما در حال حاضر مقدار زيادي از اين دانش را كسب كردهايم و بخش اعظم اين دانش در معماري رايانه گنجانيده شده است.
آلفاگو (AlphaGo) برنامهاي كه قهرمان بازي Go را شكست داد، تنها يك مدلسازي از قشر مغز محسوب نميشود؛ بلكه همچنين مدلي از بخشي از مغز بهنام هستههاي قاعدهاي است كه براي ايجاد يك توالي از تصميمات براي رسيدن به يك هدف، نقشي مهم دارد. الگوريتمي بهنام تفاوتهاي زماني نيز وجود دارد كه در دههي ۸۰ توسط ريچارد ساتون توسعه يافت؛ چنانچه اين الگوريتم بههمراه يادگيري عميق مورد استفاده قرار گيرد، ميتوان شاهد عملكردهاي پيچيدهاي بود كه پيش از اين ديده نشده است.
بهمرور كه درمورد معماري مغز ياد ميگيريم و در كنار آن ميآموزيم كه چطور ميتوان اين معماري را با سيستم مصنوعي ادغام كرد، قابليتهاي بيشتري بهدست خواهيم آورد تا از نقطهاي كه هم اكنون در آن هستيم، فراتر برويم.
آيا هوش مصنوعي نيز ميتواند بر علم اعصاب تأثيرگذار باشد؟
اين دو بهموازات يكديگر پيش ميروند. پيشرفتهاي عظيمي در فناوري عصبي بهوجود آمده است كه از ثبت يك نورون در يك بازهي زماني به ثبت هزاران نورون درهمان زمان رسيده است و اين اتفاق براي بسياري از قسمتهاي مغز بهطور همزمان رخ ميدهد؛ اتفاقي كه دنياي كاملاً جديدي را به روي ما خواهد گشود.
پيش از اين نيز اشاره شد كه بين هوش مصنوعي و هوش انساني همگرايي وجود دارد. همانطور كه ما بيشتر و بيشتر درمورد نحوهي كار مغز ياد ميگيريم، اين دانش ما دوباره در عرصهي هوش مصنوعي بازتاب مييابد. اما در عين حال، آنها در حال ايجاد يك انديشه متخصصينيهي كامل از يادگيري هستند كه ميتواند براي درك مغز بهكار گرفته شود و به ما اين امكان را ميدهد كه هزاران نورون و چگونه كاركرد آنها را تجزيهوتحليل كنيم. پس ميتوان گفت كه يك حلقهي بازخورد بين علوم اعصاب و هوش مصنوعي وجود دارد؛ بازخوردي كه شايد حتي از اهميت و جذابيت بهمراتب بالاتري نسبت به دستاوردهاي ديگر برخوردار باشد.
جزوه رايگان شما بسياري از متخصصدهاي مختلف يادگيري عميق، از خودروهاي خودران گرفته تا مسائل حوزه تجارت را مورد مباحثه قرار ميدهد. آيا بخش خاصي از اين جزوه رايگان هست كه به انديشه متخصصين خودتان، جذابيت بالاتري داشته باشد؟
يكي از متخصصدهاي مورد توجه من، شبكههاي خصمانهي مولد (GANS) است. با استفاده از شبكههاي عصبي سنتي، شما با دادن يك ورودي، يك خروجي خواهيد گرفت. شبكههاي خصمانهي مولد، به شما قابليت استخراج خروجي را بدون داشتن ورودي خواهند داد.
من هم در مورد متخصصد اين شبكهها در توليد ويدئوهاي جعلي شنيدهام. آنها واقعاً چيزهاي جديدي خلق ميكنند كه به انديشه متخصصين واقعي ميآيند، اين طور نيست؟
آنها بهنوعي فعاليت دروني ايجاد ميكنند. اين همان روشي است كه مغز ما طبق آن عمل ميكند. شما ميتوانيد به بيرون نگاه كنيد و چيزي را ببينيد، سپس ميتوانيد چشمهاي خود را ببنديد و چيزهايي را تصور كنيد كه در آنجا نيستند. شما تصوراتي بصري داريد، ايدههايي داريد كه زماني كه ذهنتان آزاد است، به سراغ شما ميآيند. دليل آن اين است كه مغز انسان، مولد است. حالا اين نوع جديد از شبكهها ميتوانند الگوهاي جديدي را خلق كنند كه پيش از اين وجود نداشتهاند. بنابراين شما ميتوانيد بهعنوان مثال، صدها تصوير از خودرو را به آن بدهيد و آن شبكه يك ساختار داخلي ايجاد كند كه قابليت توليد تصاوير جديدي از خودرو را داشته باشد؛ خودروهايي كه هرگز وجود نداشتهاند؛ ولي باز هم مشابه خودروهاي واقعي هستند.
نمونهاي از تصاوير خلق شده توسط يادگيري عميق
اگر بخواهيم به آن روي سكه نگاه كنيم، فكر ميكنيد در مورد چه ايدههايي ممكن است اغراق شده باشد؟
هيچكس نميتواند پيشبيني كند كه معرفي اين فناوري جديد چه تأثيري در آينده دارد. البته موارد اغراقآميز هم وجود دارند. ما مسائل واقعاً دشواري را حل نكردهايم. ما هوش فراگير نداريم، اما مردم ميگويند كه رباتها در همين حوالي هستند و بهزودي جايگزين ما خواهند شد. اين اظهارات در حالي است كه رباتها بسيار عقبتر از هوش مصنوعي هستند؛ چرا كه بدن بايد بسيار پيچيدهتر از مغز باشد تا بتواند تكثير شود.
اجازه بدهيد تنها نگاهي به يكي از پيشرفتهاي تكنولوژيكي داشته باشيم: ليزر. اين ابزار در حدود ۵۰ سال پيش اختراع شد و آن زمان، فضايي بهاندازهي يك اتاق را اشغال ميكرد. براي رسيدن از آن دستگاهي با آن ابعاد تا وسيلهاي به كوچكي يك نشانگر ليزري كه امروزه در سخنرانيها از آن استفاده ميشود، نياز به ۵۰ سال تجاريسازي فناوري بود. اين فناوري بايد بهاندازهاي پيشرفت ميكرد كه اينگونه كوچك شود و بتوان با تنها ۵ دلار آن را خريد.
همين قضيه درمورد فناوريهايي مانند خودروهاي خودران نيز رخ خواهد داد. انتظار نميرود كه اين فناوري يك سال يا حتي تا ۱۰ سال آينده، فراگير شود. ممكن است اين روند ۵۰ سال طول بكشد؛ اما نكته اين است كه در طول اين مسير، شاهد پيشرفتي روزافزون خواهيم بود كه منجر به انعطافپذيرتر شدن، ايمنتر شدن و سازگارتر شدن اين فناوري با سازوكار فعلي شبكهي حملونقل خواهد شد. اشكال اين اظهارات اغراقآميز در اين است كه مردم در مورد مقياس زماني، اشتباه ميكنند. آنها انتظار دارند كه خيلي زود، تغييراتي خيلي بزرگ روي دهد؛ اما بايد دانست كه هر اتفاقي در زمان مقتضي خود رخ خواهد داد.
هم انديشي ها