مهندسان سيگنالهاي مغز را بهصورت مستقيم به گفتار تبديل كردند
در نخستين گام از تلاش علمي تازهاي، مهندسان مغز و اعصاب سيستمي ساختهاند كه ميتواند فكر را به گفتار ترجمه كند. اين پيشرفت غيرمنتظره كه بين قدرت بيان و صوت تركيبي و هوش مصنوعي پيوند زده است، ميتواند در آيندهي نزديك دنيايي را كه در آن رايانهها بهطور مستقيم با مغز ارتباط برقرار ميكنند، محقق سازد. درحاليكه هماكنون نيز اميدواري بزرگي به كساني هديه ميكند كه در صحبت كردن ناتوان هستند.
اين فناوري كه توسط مهندسان مغز و اعصاب دانشگاه كلمبيا در حال پيشرفت و ارتقا است، با نظارت بر فعاليتهاي مغز توانسته كلماتي را كه افراد ميشنوند، با وضوح بيسابقهاي نوسازي كند. اين موفقيت درخشان كه قدرت سخنوري و هوش مصنوعي را با هم ادغام كرده در دنياي مهندسي پزشكي (Biomedical engineering) همچون پرش از مانعي بلند در راه خلق رايانههايي شگفتآور محسوب ميشود كه در عرصهي ارتباط با متخصصان انقلابي را ايجاد خواهند كرد.
از ديگر زمينههاي قابلتوجه براي اين فناوري كمك به افرادي است كه نميتوانند صحبت كنند. افرادي كه دچار اشكالاتي از قبيل اسكلروز جانبي آميوتروفيك (Amyotrophic lateral sclerosis) همانند استيون هاوكينگ فقيد هستند يا افرادي كه از سكته مغزي نجات يافتهاند، ميتوانند به با اين فناوري به روزهاي خوش برقراري ارتباط با جهان خارج اميدوار باشند؛ فناوري شگفتانگيزي كه به مديريت دكتر نيما مسگراني در حال شكوفايي هرچه بيشتر است.
دكتر نيما مسگراني، نويسنده و عضو اصلي پژوهش در مؤسسه رفتار ذهني مغز مورتيمر بي زاكرمن از دانشگاه كلمبيا است. دكتر مسگراني معتقد است با نتايج مطالعات پژوهش، ميتوانيم راهي براي بازگشت قدرت سخنوري داشته باشيم. نتايج پژوهشهاي او نشان داد كه با فناوري مناسب، ميتوان انديشهي افراد را رمزگشايي و ازطريق گوش دادن قابل فهم كرد.
نتايج دهها پژوهش به پژوهشگران نشان داده بود كه وقتي افراد صحبت ميكنند يا حتي تصور ميكنند كه صحبت ميكنند، الگوهاي گفتوگو در مغز آنها ظاهر ميشود. الگوهايي متفاوت ولي قابل تشخيص از سيگنالها نيز هنگامي كه ما به سخنان ديگران گوش ميدهيم يا تصور ميكنيم كه گوش ميدهيم، در مغز پديدار ميشود. متخصص كارشناسان سعي ميكنند اين الگوهاي مغزي را ثبت و حتي رمزگشايي كنند. آنها آيندهاي را تصور ميكنند كه در آن انديشهها درون مغز پنهان نيست و بدون نياز به ترجمه به ديگران منتقل شود.
از سويي انجام اين شاهكار چالشبرانگيز است. اولين تلاشها براي رمزگشايي سيگنالها توسط دكتر مسگراني انجام شد درحاليكه ديگر همكاران تيم او روي مسئلهي تجزيه و تحليل اسپكتروگرامها و تبديل به مدلهاي رايانهاي ساده تمركز داشتند. اسپكتروگرام پارامترهاي اصوات همچون چگالي طيفي و فركانس را بهصورت بصري نمايش ميدهند كه از نمونههاي معروف آن سونوگرافي است. نتيجه اين رويكرد براي توليد خروجي كه به صحبت قابل فهم تبديل شود، ناموفق بود؛ ازاينرو دكتر مسگراني كه دانشيار رشته مهندسي الكترونيك در بنياد يادگيريي فو كلميبا و علوم متخصصدي است، بههمراه تيمش به روي فناوري وكودر تمركز كرد. دكتر مسگراني بهدنبال يك الگوريتم رايانهاي بود كه بتواند پس از يادگيري ديدن با سوابق گفتگوهاي افراد، متن را به گفتار تبديل كند. دكتر مسگراني در اينباره ميگويد:
اين همان فناورياي است كه آمازون اكو و اپل سيري براي پاسخ به درخواستهاي كلامي ما استفاده ميكنند.
دكتر مسگراني تصميم گرفت در جهت تعليم وكودر براي آنكه بتواند فعاليتهاي مغزي را تفسير كند با دكتر اشيش دينيش مِهتا همكاري كند. دكتر مهتا جراح مغز و اعصاب در مؤسسه عصبشناسي پزشكان همكار Northwell Health است كه در يك شبكه مراقبتهاي بهداشتي با مشاركت در حدود ۲۰ بيمارستان فعال است. درعينحال دكتر مهتا در today's paper نيز بهعنوان همكار نويسنده فعاليت دارد. تمركز اصلي دكتر مهتا به روي درمان بيماران صرعي است كه بايد تحت عمل جراحي منظم قرار بگيرند.
دكتر مسگراني معتقد است كه همكاري با دكتر مهتا و ياري جستن از بيماران صرع در حين عمل و رصد الگوهاي مغزي آنها در هنگام گوشدادن به صداي افراد مختلف اطلاعات خوبي براي تحليل الگوها به تيم پژوهش داده و نتايج همين الگوها بود كه وكودر را براي انجام وظيفهاش يادگيري ميدادند. در ادامهي طرح، پژوهشگران از همان بيماران خواستند به صداي ديجيتالي ارقام از ۰ تا ۹ گوش دهند. صداهاي توليدشده بهوسيله وكودر در پاسخ به اين سيگنالها توسط شبكه عصبي كه يك نوع هوش مصنوعي با توانايي تقليد ساختار نورونهاي مغز بيولوژيك بود، آناليز و پالوده شد.
نتيجه اين تلاشها براي تيم پژوهش دكتر مسگراني موفقيت درخشاني بود. آنها متوجه شدند كه افراد ميتواند در ۷۵ درصد اوقات اين صداهاي توليدشده را بفهمند و تكرار كنند و اين نتيجه برتر از هر تلاشي بود كه قبل انجام شده بود. بهبود و قابليت فهم در ضبطهاي جديد برپايه اسپكتروگرامهاي قبلي بهطور مشهودي واضح بود. درعين حال كه قدرت و دقت وكودر و شبكه عصبي، ناشي از دقت شگفتآور بيماران در شنيدن صداهاي اوليه بود. دكتر مسگراني و تيم پژوهشهاي او در ادامه تلاشهاي خود قصد دارند با آزمايش كلمهها و جملات بغرنج كار را ادامه دهند. در برنامه بعدي آنها همان آزمايشها را روي سيگنالهاي مغز فرد منتشر ميكنند درحاليكه او صحبت ميكند يا تصور ميكند درحال صحبت كردن است. درنهايت آنها اميدوارند كه اين فناوري همچون به بخشي از يك ايمپلنت مشابه يكي از انواعي كه بيماران صرع استفاده ميكنند، تبديل شود تا افكار را مستقيما به گفتار تبديل كند.
در اين محصول اگر صاحب ايمپلنت در اين انديشه باشد كه به يك ليوان آب نياز دارد، سيستم با تحليل سينگالهاي مغز ميتواند اين فكر را درك كند و آن را به ديالوگ تبديل كند. دكتر مسگراني معتقد است كه اين فناوري ميتواند تحول شگرفي ايجاد كند. اين سيستم به هر شخصي كه دچار آسيب يا صدمه در توان گفتاري است ميتواند توانايي سخن گفتن را ببخشد تا براي ارتباط با دنياي اطراف فرصتي دوباره داشته باشد.
هم انديشي ها