از دست دادن توانایی صحبت کردن پس از آسیب مغزی یا به دلیل بیماری موجب میشود فرد نتواند افکار، احساسات و ایدههای خود را بیان کند. بدین شکل فرد منزوی میشود. در دو مطالعه اخیر، پژوهشگران نشان دادند چگونه ترکیب ایمپلنتهای مغزی و هوش مصنوعی صدای دو زن را بازمیگرداند. یکی فلج پس از سکته مغزی و دیگری مبتلا به یک اختلال عصبی پیشرونده. با مجله فناوریهای توانافزا و پوشیدنی همراه باشید.
از دست دادن توانایی صحبت کردن
سکته مغزی میتواند به مناطقی از مغز که زبان و گفتار را کنترل میکنند آسیب برساند. به طور مشابه، اسکلروز جانبی آمیوتروفیک (ALS) یک بیماری عصبی پیشرونده است که به سلولهای عصبی کنترلکنندهی عضلات حمله میکند. زمانی که این بیماری بر ماهیچههایی که لبها، زبان، کام و فک را حرکت میدهند، تأثیر بگذارد، میتواند موجب مشکلات گفتاری شود. اما پژوهشگران راهی برای بازگرداندن صدای این افراد یافتند.
دو مطالعه منتشر شده در 23 آگوست در مجله Nature ثابت کردند ما تا چه حد در ترجمه افکار به کلمات گفتاری پیشرفت کردیم. نخستین مورد، توسط پژوهشگران دانشگاه کالیفرنیا، سانفرانسیسکو (UCSF) و دانشگاه کالیفرنیا، برکلی، به زنی که دچار سکته مغزی شده بود، این امکان را داد تا از طریق یک آواتار دیجیتال صحبت کند و احساسات خود را ابراز کند. دومی که توسط مدرسه پزشکی دانشگاه استنفورد انجام شد، فعالیت مغز زنی را که به دلیل ALS توانایی صحبت کردن را از دست داده بود، به متن نمایش داده شده روی صفحه رایانه تبدیل کرد.
داستان Ann
Ann در 30 سالگی دچار سکته مغزی و به شدت فلج شد. این سکته موجب ضعف شدید در عضلات صورت و صدای او شد. Ann پیش از سکته مغزی، معلم ریاضی دبیرستانی در کانادا بود.
پس از سالها توانبخشی، Ann یاد گرفت با تایپ کردن (با زحمت فراوان) بر روی نمایشگر ارتباط برقرار کند. سپس، در سال 2021، او در مورد یک مرد فلج به نام Pancho، که دچار سکته مغزی شده بود، اطلاع یافت که با کمک پژوهشگران UCSF سیگنالهای مغز خود را به متن ترجمه میکند.
اکنون Ann چهل و هفت ساله با همکاری پژوهشگران دانشگاه کالیفرنیا برکلی، راهی برای برقراری ارتباط طبیعیتر پیدا کرد. با استفاده از یک آواتار دیجیتالی که از هوش مصنوعی برای تبدیل سیگنالهای مغز به گفتار و حالات چهره استفاده میکند.
Edward Chang، نویسنده مسئول این مطالعه گفت: «هدف ما بازیابی یک راه کامل برای برقراری ارتباط است، که طبیعیترین راه برای صحبت با دیگران است. این پیشرفتها ما را به راهکاری واقعی برای بیماران بسیار نزدیکتر میکند».
پژوهشگران میخواستند آنچه را که با Pancho به دست آورده بودند، با Ann بهبود بخشند. آنها یک مستطیل نازک متشکل از 253 الکترود را روی سطح مغز او در نواحی مهم مربوط به گفتار کاشتند. نواحی که اگر سکته مغزی نبود، ماهیچههای لب، زبان، فک و باکس صدای آن را حرکت میداد. الکترودها توسط یک کابل به رایانه متصل شدند.
روش کار
Ann با پژوهشگران کار کرد تا الگوریتمهای هوش مصنوعی را برای تشخیص سیگنالهای منحصر به فرد مغز آموزش دهند. او هفتهها عبارات مختلفی را از یک واژگان 1024 کلمهای مکالمه تکرار میکرد. به جای آموزش هوش مصنوعی برای تشخیص کلمات کامل، پژوهشگران سامانهای ایجاد کردند که کلمات را از اجزای کوچکتر یا واجها رمزگشایی میکند. به این ترتیب، هوش مصنوعی تنها به یادگیری 39 واج برای رمزگشایی کلمات انگلیسی نیاز داشت.
Sean Metzger، که به توسعه رمزگشای متن کمک کرد و نویسنده اصلی این مطالعه است، گفت: «دقت، سرعت و واژگان بسیار مهم هستند. این همان چیزی است که به مرور زمان موجب میشود، افراد به همان سرعت ما ارتباط برقرار کنند و مکالمات طبیعیتر و عادیتر داشته باشند».
در مرحله بعد، پژوهشگران الگوریتمی برای ترکیب گفتار ابداع کردند که با استفاده از صدای Ann در سخنرانی در مراسم عروسیاش شخصیسازی شد و از نرمافزاری برای ایجاد آواتار استفاده کردند. این گروه فرآیندهای یادگیری ماشینی سفارشی شدهای را ایجاد کردند که به نرم افزار آواتار اجازه میداد با سیگنالهایی که مغز Ann هنگام تلاش برای صحبت کردن ارسال میکرد، ادغام شود، چهره آواتار را حرکت داده و احساساتی مانند شادی، غم و شگفتی را نشان دهد.
Kaylo Littlejohn، یکی از نویسندگان این مطالعه گفت: «ما در حال جبران ارتباطات میان مغز و دستگاه صوتی او هستیم که در اثر سکته مغزی قطع شده است. هنگامی که Ann برای نخستین بار از این سامانه برای صحبت کردن و حرکت دادن چهره آواتار به صورت پشت سر هم استفاده کرد، میدانستم این چیزی است که تأثیر واقعی خواهد داشت».
سامانه BCI قادر به رمزگشایی واژگان بزرگ و تبدیل آن به متن با سرعت متوسط 78 کلمه در دقیقه، با میانگین ضریب خطای کلمه 25٪ بود. سرعت مکالمه طبیعی در بین انگلیسی زبانان حدود 160 کلمه در دقیقه است.
Ann تایپ کرد: «بخشی از این مطالعه به من احساس هدفمندی داده است، احساس میکنم که در حال کمک به جامعه هستم. انگار دوباره کار دارم. شگفت انگیز است که من این مدت زندگی کردهام. این مطالعه به من اجازه داد تا زمانی که هنوز زنده هستم واقعاً زندگی کنم».
پژوهشگران در حال کار بر روی ایجاد یک نسخه بیسیم از این سامانه هستند که نیازی به اتصال فیزیکی Ann به BCI نداشته باشد. آنها امیدوارند این سامانه مورد تأیید سازمان غذا و دارو واقع شود.
ویدئوی زیر که توسط UCSF تهیه شده است، نشان میدهد چگونه این فناوری کار میکند.
داستان Pat
Pat شصت و هشت ساله در سال 2012 به ALS مبتلا شد. برخلاف علائم معمول ALS، که در آن بدتر شدن از نخاع آغاز میشود و اندامها را تحت تأثیر قرار میدهد، بیماری او از ساقه مغزش آغاز شد. این بدان معناست که او هنوز میتواند حرکت کند، خودش لباس بپوشد و از انگشتانش برای تایپ کردن استفاده کند، اما نمیتواند از عضلات مرتبط با گفتار برای تلفظ واضح واجها استفاده کند.
خوشبختانه، مغز Pat هنوز هم میتواند دستورالعملهایی را برای تولید واجها فرموله کند، چیزی که پژوهشگران استنفورد از آن استفاده کردند. در مارس 2022، یک جراح مغز و اعصاب دو آرایه حسگر کوچک را در سطح مغز Pat در دو ناحیه جداگانه تولید گفتار کاشت. هر آرایه شامل 64 الکترود است که در قشر مغز تا عمقی حدود 3.5 میلیمتر نفوذ میکند.
مانند Ann، هوش مصنوعی برای تشخیص فعالیت مغز مرتبط با تلاشهای Pat برای فرمولبندی هر یک از 39 واجی که شامل انگلیسی گفتاری هستند، آموزش دیده بود. Pat حدود 25 جلسه آموزشی داشت که در هر جلسه سعی میکرد 260 تا 480 جمله تصادفی از مجموعه دادههای بزرگی از نمونههای مکالمات تلفنی را تکرار کند.
Francis Willett، نویسنده اصلی این مطالعه، گفت: «این سامانه برای دانستن اینکه چه کلماتی باید پیش از کلمات دیگر قرار گیرند و کدام واجها چه کلماتی را میسازند، آموزش دیده است. اگر برخی از واجها به اشتباه تفسیر شده باشند، باز هم میتوان حدس خوبی داشت».
جیمی هندرسون، جراح مغز و اعصاب که جراحی Pat را انجام داد و یکی از نویسندگان همکار این مطالعه گفت: «ما نشان دادیم که میتوانید گفتار مورد نظر را با ثبت فعالیت از یک ناحیه بسیار کوچک در سطح مغز رمزگشایی کنید».
سخن آخر
Pat امیدوار است که ارتباطات به کمک BCI به زودی در دسترس افراد بیشتری قرار گیرد.
Pat مینویسد: «این نتایج اولیه این مفهوم را ثابت کرده است. و در نهایت، فناوری به آن دست خواهد یافت تا به راحتی برای افرادی که نمیتوانند صحبت کنند، قابل دسترسی باشد. این بدان معنی است که این افراد میتوانند با دنیای بزرگتر ارتباط برقرار کنند، شاید به کار ادامه دهند، دوستان و روابط خانوادگی خود را حفظ کنند».
اگرچه هنوز به صورت تجاری در دسترس نیست، اما پژوهشگران به پتانسیل و کاربردهای گسترده دستگاه خود امید دارند.
Willett گفت: «این یک اثبات علمی مفهوم است، نه یک وسیله واقعی که مردم میتوانند در زندگی روزمره از آن استفاده کنند. اما این پیشرفت بزرگی در جهت بازگرداندن ارتباط افرادی است که نمیتوانند صحبت کنند».
ویدئوی زیر که توسط دانشکده پزشکی استنفورد تهیه شده است، نشان میدهد چگونه اثبات مفهوم BCI به Pat امکان صحبت کردن و برنامههایش برای استفاده آینده از دستگاه را میدهد.
هر دو مطالعه در مجله Nature منتشر شد. مطالعه UCSF را میتوان در اینجا یافت. مطالعه پزشکی استنفورد را میتوانید در اینجا ببینید.
>> روش جدید استفاده از رابط مغز و رایانه برای توانبخشی پا پس از سکته
>> رابط مغز و رایانه (BCI) چیست؟
منبع: newatlas.com
«استفاده و بازنشر مطالب تنها با ذکر لینک منبع و نام (مجله فناوریهای توانافزا و پوشیدنی) مجاز است».