هوش مصنوعي باگهاي مايكروسافت را تا ۹۷ درصد درست تشخيص ميدهد
مايكروسافت مدعي شده است سيستمي توسعه داده تا با كمك آن باگها را شناسايي كند. بهگفتهي اين شركت، سيستم تشخيص باگ ميتواند ۹۹ درصد باگهاي امنيتي و غيرامنيتي را از يكديگر متمايز كند و با دقت ۹۷ درصد باگهاي مهم و حياتي را از بين آنها تشخيص دهد. بنابر گزارش منتشرشده، مايكروسافت برنامه دارد در ماه آتي، روش عملكرد اين سيستم را روي گيتهاب قرار دهد. علاوهبراين، مدلهايي براي مثال و ديگر منابع استفادهشده در سيستم مذكور نيز دردسترس علاقهمندان قرار خواهد گرفت.
طبق اطلاعات جديد، اين سيستم روي مجموعه دادههاي ۱۳ ميليون پروژه و باگهايي از ۴۷ هزار توسعهدهنده توسعه داده شده كه در سرور AzureDevOps مايكروسافت (ويژوال استوديو الكترونيك) و مخازن گيتهاب ذخيره شده است تا متخصصان انساني را همراهي و همراهي كند. شركت Carologix تخمين ميزند توسعهدهندگان در هر هزار خط كدنويسي، ۷۰ باگ درست ميكنند و برطرفكردن هر باگ ۳۰ برابر كدنويسي هر خط زمان خواهد برد. بنابراين، تنها در ايالات متحده سالانه ۱۱۳ ميليارد دلار براي شناسايي و تعمير عيوب محصولات هزينه ميشود.
مايكروسافت معتقد است در طول ايجاد ساختار مدلي كه اكنون رونمايي شده، متخصصان امنيت فرايند پرورش دادههاي اوليه را تأييد كردند. همچنين، نمونهگيري آماري بهگونهاي انجام شد كه براي متخصص كارشناسان مقدار مناسبي از دادهها براي مطالعه جمعآوري شود. سپس، دادهها در بازنماييهايي با نام بردار ويژگي رمزگذاري شدند و محققان مايكروسافت با قدرت تمام طراحي سيستم را با استفاده از روش فرايند دومرحلهاي آغاز كردند. در ابتدا، مدل مايكروسافت طريقهي طبقهبندي باگهاي امنيتي و غيرامنيتي و سپس ياد گرفت چگونه برچسبهاي شدت مثل بحراني يا مهم يا كماثر را به باگهاي امنيتي نسبت دهد.
مدل ارائهشدهي مايكروسافت از دو تكنيك براي پيشبيني باگها بهره ميبرد. اولين تكنيك الگوريتم فراواني وزني TF-IDF است كه رويكرد بازيابي اطلاعات بهشمار ميرود. اين رويكرد به كلمات براساس ميزان تكرار در سند ارزشي اختصاص ميدهد و مطالعه ميكند آن كلمه چقدر با عناوين موجود در مجموعه مرتبط بوده است. مايكروسافت ميگويد عناوين باگها معمولا خيلي كوتاه هستند و غالبا شامل ۱۰ كلمه ميشوند. تكنيك دوم ازطريق مدل رگرسيون لجستيك پيش ميرود. درواقع در اين تكنيك، با استفاده از تابع لجستيك، احتمال وجود كلاس معين يا رويداد را مدلسازي خواهد كرد.
علاوهبراين، مايكروسافت ميگويد مدل ساختهشده از درون در حال گسترش است. بدين معنا كه بهطورمداوم با دادههاي تأييدشدهي متخصصان امنيتي يادگيري داده ميشود. همچنين، متخصصان تعداد باگهاي توليدشده در مدت زمان توسعهي نرمافزار را كنترل ميكنند.
مدير ارشد برنامهي امنيتي مايكروسافت، اسكات كريستينسن، گفته است:
توسعهدهندگان نرمافزار همواره فهرست بلندبالاي ويژگيها و باگهايي را در انديشه متخصصين دارند كه بايد درست شوند. متخصص كارشناسان امنيتي نيز تلاش ميكنند با استفاده از ابزار خودكار اولويتبندي باگهاي امنيتي به آنها كمك كنند؛ اما اغلب اوقات، مهندسان زمان زيادي روي باگهاي نادرست هدر ميدهند يا ممكن است متوجه برخي آسيبپذيريهاي بحراني و حياتي طبقهبندينشده نشوند.
دانشمند داده و علوم متخصصدي مايكروسافت، مايانا پريرا، اضافه كرده است:
با كنارهم قراردادن مدلهاي يادگيري ماشيني و متخصص كارشناسان امنيتي، خواهيم توانست تشخيص و طبقهبندي باگهاي امنيتي را بهطرز چشمگيري بهبود ببخشيم.
مايكروسافت، تنها غول فناوري نيست كه با استفاده از هوش مصنوعي باگهاي امنيتي را شناسايي ميكند؛ زيرا سرويس CodeGuru شركت آمازون كه تاحدي براساس مرور كد و اپليكيشنها در اين شركت توسعه يافته است، توانايي تشخيص اشكالاتي نظير نشت منابع و اتلاف چرخههاي پردازشي را دارد. افزونبراين، فيسبوك ابزاري با عنوان SapFix طراحي كرده است كه قبل از ارسال اطلاعات باگها براي مهندسان، بهصورت خودكار آنها را ترميم و سپس باگها و راهحلشان را بهمنظور تأييد نهايي براي مهندسان ارسال ميكند. ابزار ديگري نيز با نام Zoncolan دراختيار فيسبوك قرار دارد كه اعمال و رفتار پايگاههاي كد را مطالعه ميكند و بهدنبال اشكالات احتمالي در شاخههاي انفرادي يا فعلوانفعالات مسيرهاي مختلف برنامه ميگردد.
هم انديشي ها