گامهاي موفقيتآميز هوش مصنوعي ديپ مايند در پيشبيني مدلسازي پروتئين
هوش مصنوعي ديپمايند گوگل ادعا ميكند كه به نقطه عطف مهمي در حوزهي پيشبيني مدلسازي پروتئين دست يافته است و ميتواند با سيستمي مبتني بر هوش مصنوعي، ساختارهاي پيچيده همانند ساختار سهبعدي پروتئين را تنها براساس توالي ژنتيكي آن پيشبيني كرده و نمايش دهد.
دانستن ساختارهاي پروتئيني در تشخيص و درمان بيماريها حائز اهميت است و ميتواند درك دانشمندان را نسبت به بدن انسان بالاتر ببرد. همچنين ميتواند بهصورت بالقوه در طراحي ساختار پروتئين و مهندسي زيستي بسيار كمككننده باشد. نزديك به دو سال است كه هوش مصنوعي ديپمايند، سخت در تلاش است تا در زمينهي پيشبيني تاشدگي پروتئين پيشرفتهايي را بهانجام برساند. در پست وبلاگ هوش مصنوعي ديپمايند به اين موضوع اشاره شده است:
مدلهاي سهبعدي پروتئين كه هوش مصنوعي AlphaFold ديپمايند توليد ميكند، بسيار دقيقتر از آن است كه پيشتر در اختيار دانشمندان قرار داشته و شاهد پيشرفتهاي قابلتوجهي در حوزههاي چالشبرانگيز زيستشناسي هستيم.
براي پيشبيني مدلسازي مولكول پروتئين، روشهاي مختلف علمي از جمله چگونگي تاشدگي پروتئين وجود دارد. تاشدگي پروتئين فرآيندي است كه در آن، پليپپتيدها به ساختار سهبعدي مشخصي پيچيده ميشوند. پلي پيتيدها، زنجيرهاي از اسيدهاي آمينه هستند كه در ابتدا ساختار سهبعدي ندارند و براساس ويژگيهاي شيميايي خاص در يك محيط سلولي برهمكنش ميكنند و در نهايت ساختار سهبعدي ويژهاي را بهنمايش ميگذارند. زنجيرهي اسيدهاي آمينه، وضعيت اين ساختار را مشخص ميكند و سازوكار تاشدگي پروتئينها در اين فرآيند ناشناخته است.
بههمين دليل، با توجه به اينكه عوامل مختلفي در سازوكار تاشدگي پروتئين دخيل هستند و تعامل بين آمينواسيدها ميتواند ساختار سهبعدي پروتئين را تغيير دهد، مدلسازي ساختار سهبعدي كاري بسيار پيچيده است. بازي پرطرفدار FoldIt، تلاش ميكند تا شكلهاي مختلف پروتئين را بهنمايش بگذارد. هوش مصنوعي ديپمايند مدعي است كه رويكردي را در پيش گرفته كه حاصل تحقيقات انجامشده در سالهاي قبل است و از دادههاي بزرگ براي پيشبيني ساختار پروتئين استفاده ميكند و بهصورت مشخص، از روشهاي يادگيري عميق براي دادههاي ژنومي استفاده ميكند. در پست وبلاگ آمده است:
«خوشبختانه، بهلطف كاهش سريع هزينههاي تواليهاي ژنتيكي، حوزهي ژنوميك در زمينهي دادهها بسيار غني است. در نتيجه، رويكردهاي يادگيري عميق براي پيشبيني اشكالات برمبناي دادههاي ژنوميك، بهصورت فزايندهاي در سالهاي اخير محبوب شده است. ديپمايند براي حل اين اشكال، هوش مصنوعي AlphaFold را معرفي كرده كه در پروژهي CASP نيز پذيرفته شده است.
مفتخريم كه بهعنوان بخشي از اعضاي انجمن CASP، پيشرفت بيسابقهاي در حوزهي روشهاي محاسباتي براي پيشبيني ساختار پروتئين در پيش گرفتهايم و در بين تيمهايي كه وارد اين حوزه شدهاند، موفق به كسب اولين رتبه شديم (ما گروه A7D هستيم).
تيم ما بهصورت خاص روي مدلسازي اشكال مختلف پروتئين متمركز شده است و از قالبهاي قبلي پروتئيني كه قبلا مورد استفاده قرار گرفتهاند نيز استفاده نميكند. در زمان پيشبيني خواص فيزيكي ساختار پروتئين، دقت بالايي به ثبت رسيد و درنهايت دو روش متمايز براي پيشبيني ساختار كامل پروتئين مورد استفاده قرار گرفت».
ديپمايند معتقد است كه در هر دو روش از شبكههاي عصبي عميق يادگيريدادهشده براي پيشبيني خواص پروتئين مربوط به توالي ژنتيكي، استفاده شده است. وبلاگ هوش مصنوعي ديپمايند اعلام كرد: «خواصي كه هوش مصنوعي ديپمايند ميتواند پيشبيني كند عبارتند از: الف) فاصله بين جفت اسيد آمينهها و (ب) زاويه بين پيوندهاي شيميايي كه اين اسيد آمينهها را به يكديگر متصل ميكند. طرح توسعهي اوليهي اين سيستم، پيشرفتهاي قابلتوجهي نسبت به روشهاي معمول از خود نشان داده است و توانسته در مورد جفت آمينه اسيدي كه در نزديكي يكديگر قرار خواهند گرفت پيشبيني كند. ما شبكهي عصبي را براي پيش بيني توزيع فاصلهي بين هر جفت آمينه اسيد در پروتئين يادگيري داديم. حاصل اين احتمالات، درنهايت بهصورت يك نمره تخمين زده شدند كه پيشبيني از ساختار پروتئين را بهصورت دقيق ارائه ميدهد. همچنين توانستيم شبكهي عصبي ديگري را بهصورت جداگانه يادگيري دهيم كه با استفاده از فاصلهها بتواند پيشبيني در مورد چگونگي ساختار نهايي ارائه دهد كه به پاسخ صحيح نزديكتر است. سپس از روشهاي جديدي براي پيشبيني ساختارهاي پروتئيني، جستجوي ساختارهاي شناختهشده كه با پيشبينيهاي انجامشده مطابقت دارند، استفاده كرديم.
روش اول برمبناي تكنيكهايي كه معمولا در زيست شناسي ساختاري استفاده ميشود و بهصورت مكرر جايگزين قطعات ساختاري پروتئين با قطعات جديد پروتئيني ميشود، شكل گرفته است. شبكهي عصبي ايجادشده، ميتواند قطعات جديد را يادگيري بدهد و بهصورت پيوسته در جهت بهبود امتياز يا نمرهي نهايي ساختار پيشنهادي پروتئين در تلاش است.
روش دوم بهينهسازي امتيازها و نمرات بهصورت شيبدار است. معمولا از روشهاي رياضي براي توسعههاي جزئي و كوچكي در سيستمهاي مبتني بر يادگيري ماشين استفاده ميكنند. استفاده از اين روشها باعث ارائهي ساختار پيشبينيشدهي بسيار دقيقتري ميشود. درنهايت اين روش به كل زنجيرهي پروتئين نسبت داده ميشود و همچنين اين روش به قطعاتي كه بهصورت جداگانه و قبل از جمعشدن، تا ميشوند نيز قابل اعمال است و از پيچيدگيهاي مربوط به پيشبيني كم ميكند».
هوش مصنوعي ديپمايند، نتايج حاصله را بهعنوان پيشرفت و توسعه در زمينهي پيشبيني ساختار زنجيرهي پروتئين مطرح كرده كه اين پيشرفت حاصل استفاده از روشهاي محاسباتي و تاثير هوش مصنوعي در اين اكتشاف علمي است.
باوجودي كه هوش مصنوعي ديپمايند تاكيد ميكند هنوز روشهاي يادگيري عميق بايد مسيري را طي كنند تا بتوانند تاثير قابلتوجهي در حوزهي درمان بيماريها و مديريت محيطزيست و موارد بيشتر داشته باشند؛ ولي ميدانيم كه پتانسيل بسيار بالايي در اين حوزه وجود دارد. با حضور تيم اختصاصي و متمركز بر چگونگي يادگيري ماشين، ميتوانيم در اين مسير گامهاي بلندي برداريم و منتظر راههاي جديدي هستيم كه ميتواند فناوري را تغيير دهد.
هم انديشي ها