رابط مغز و رایانه صدای دو زن را به آنها بازگرداند

از دست دادن توانایی صحبت کردن پس از آسیب مغزی یا به دلیل بیماری موجب می‌شود فرد نتواند افکار، احساسات و ایده‌های خود را بیان کند. بدین شکل فرد منزوی می‌شود. در دو مطالعه اخیر، پژوهشگران نشان دادند چگونه ترکیب ایمپلنت‌های مغزی و هوش مصنوعی صدای دو زن را بازمی‌گرداند. یکی فلج پس از سکته مغزی و دیگری مبتلا به یک اختلال عصبی پیشرونده. با مجله فناوری‌های توان‌افزا و پوشیدنی همراه باشید.

رابط مغز و رایانه صدای دو زن را به آنها بازگرداند
.

از دست دادن توانایی صحبت کردن

سکته مغزی می‌تواند به مناطقی از مغز که زبان و گفتار را کنترل می‌کنند آسیب برساند. به طور مشابه، اسکلروز جانبی آمیوتروفیک (ALS) یک بیماری عصبی پیشرونده است که به سلول‌های عصبی کنترل‌کننده‌ی عضلات حمله می‌کند. زمانی که این بیماری بر ماهیچه‌هایی که لب‌ها، زبان، کام و فک را حرکت می‌دهند، تأثیر بگذارد، می‌تواند موجب مشکلات گفتاری شود. اما پژوهشگران راهی برای بازگرداندن صدای این افراد یافتند.

دو مطالعه منتشر شده در 23 آگوست در مجله Nature ثابت کردند ما تا چه حد در ترجمه افکار به کلمات گفتاری پیشرفت کردیم. نخستین مورد، توسط پژوهشگران دانشگاه کالیفرنیا، سانفرانسیسکو (UCSF) و دانشگاه کالیفرنیا، برکلی، به زنی که دچار سکته مغزی شده بود، این امکان را داد تا از طریق یک آواتار دیجیتال صحبت کند و احساسات خود را ابراز کند. دومی که توسط مدرسه پزشکی دانشگاه استنفورد انجام شد، فعالیت مغز زنی را که به دلیل ALS توانایی صحبت کردن را از دست داده بود، به متن نمایش داده شده روی صفحه رایانه تبدیل کرد.

داستان Ann

Ann در 30 سالگی دچار سکته مغزی و به شدت فلج شد. این سکته موجب ضعف شدید در عضلات صورت و صدای او شد. Ann پیش از سکته مغزی، معلم ریاضی دبیرستانی در کانادا بود.

پس از سال‌ها توانبخشی، Ann یاد گرفت با تایپ کردن (با زحمت فراوان) بر روی نمایشگر ارتباط برقرار کند. سپس، در سال 2021، او در مورد یک مرد فلج به نام Pancho، که دچار سکته مغزی شده بود، اطلاع یافت که با کمک پژوهشگران UCSF سیگنال‌های مغز خود را به متن ترجمه می‌کند.

اکنون Ann چهل و هفت ساله با همکاری پژوهشگران دانشگاه کالیفرنیا برکلی، راهی برای برقراری ارتباط طبیعی‌تر پیدا کرد. با استفاده از یک آواتار دیجیتالی که از هوش مصنوعی برای تبدیل سیگنال‌های مغز به گفتار و حالات چهره استفاده می‌کند.

Edward Chang، نویسنده مسئول این مطالعه گفت: «هدف ما بازیابی یک راه کامل برای برقراری ارتباط است، که طبیعی‌ترین راه برای صحبت با دیگران است. این پیشرفت‌ها ما را به راهکاری واقعی برای بیماران بسیار نزدیک‌تر می‌کند».

پژوهشگران می‌خواستند آنچه را که با Pancho به دست آورده بودند، با Ann بهبود بخشند. آنها یک مستطیل نازک متشکل از 253 الکترود را روی سطح مغز او در نواحی مهم مربوط به گفتار کاشتند. نواحی که اگر سکته مغزی نبود، ماهیچه‌های لب، زبان، فک و باکس صدای آن را حرکت می‌داد. الکترودها توسط یک کابل به رایانه متصل شدند.

رابط مغز و رایانه صدای دو زن را به آنها بازگرداند
تصویری که الکترودهای کاشته شده با جراحی را در سطح مغز Ann نشان می‌دهد.

روش کار

Ann با پژوهشگران کار کرد تا الگوریتم‌های هوش مصنوعی را برای تشخیص سیگنال‌های منحصر به فرد مغز آموزش دهند. او هفته‌ها عبارات مختلفی را از یک واژگان 1024 کلمه‌ای مکالمه تکرار می‌کرد. به جای آموزش هوش مصنوعی برای تشخیص کلمات کامل، پژوهشگران سامانه‌ای ایجاد کردند که کلمات را از اجزای کوچکتر یا واج‌ها رمزگشایی می‌کند. به این ترتیب، هوش مصنوعی تنها به یادگیری 39 واج برای رمزگشایی کلمات انگلیسی نیاز داشت.

Sean Metzger، که به توسعه رمزگشای متن کمک کرد و نویسنده اصلی این مطالعه است، گفت: «دقت، سرعت و واژگان بسیار مهم هستند. این همان چیزی است که به مرور زمان موجب می‌شود، افراد به همان سرعت ما ارتباط برقرار کنند و مکالمات طبیعی‌تر و عادی‌تر داشته باشند».

در مرحله بعد، پژوهشگران الگوریتمی برای ترکیب گفتار ابداع کردند که با استفاده از صدای Ann  در سخنرانی در مراسم عروسی‌اش شخصی‌سازی شد و از نرم‌افزاری برای ایجاد آواتار استفاده کردند. این گروه فرآیندهای یادگیری ماشینی سفارشی شده‌ای را ایجاد کردند که به نرم افزار آواتار اجازه می‌داد با سیگنال‌هایی که مغز Ann هنگام تلاش برای صحبت کردن ارسال می‌کرد، ادغام شود، چهره آواتار را حرکت داده و احساساتی مانند شادی، غم و شگفتی را نشان دهد.

Kaylo Littlejohn، یکی از نویسندگان این مطالعه گفت: «ما در حال جبران ارتباطات میان مغز و دستگاه صوتی او هستیم که در اثر سکته مغزی قطع شده است. هنگامی که Ann  برای نخستین بار از این سامانه برای صحبت کردن و حرکت دادن چهره آواتار به صورت پشت سر هم استفاده کرد، می‌دانستم این چیزی است که تأثیر واقعی خواهد داشت».

سامانه BCI قادر به رمزگشایی واژگان بزرگ و تبدیل آن به متن با سرعت متوسط 78 کلمه در دقیقه، با میانگین ضریب خطای کلمه 25٪ بود. سرعت مکالمه طبیعی در بین انگلیسی زبانان حدود 160 کلمه در دقیقه است.

رابط مغز و رایانه صدای دو زن را به آنها بازگرداند
الکترودهای روی مغز Ann به رایانه‌ای متصل است که تلاش او را به کلمات گفتاری و حرکات چهره یک آواتار ترجمه می‌کند.

Ann تایپ کرد: «بخشی از این مطالعه به من احساس هدفمندی داده است، احساس می‌کنم که در حال کمک به جامعه هستم. انگار دوباره کار دارم. شگفت انگیز است که من این مدت زندگی کرده‌ام. این مطالعه به من اجازه داد تا زمانی که هنوز زنده هستم واقعاً زندگی کنم».

پژوهشگران در حال کار بر روی ایجاد یک نسخه بی‌سیم از این سامانه هستند که نیازی به اتصال فیزیکی Ann به BCI نداشته باشد. آنها امیدوارند این سامانه مورد تأیید سازمان غذا و دارو واقع شود.

ویدئوی زیر که توسط UCSF تهیه شده است، نشان می‌دهد چگونه این فناوری کار می‌کند.

داستان Pat

Pat شصت و هشت ساله در سال 2012 به ALS مبتلا شد. برخلاف علائم معمول ALS، که در آن بدتر شدن از نخاع آغاز می‌شود و اندام‌ها را تحت تأثیر قرار می‌دهد، بیماری او از ساقه مغزش آغاز شد. این بدان معناست که او هنوز می‌تواند حرکت کند، خودش لباس بپوشد و از انگشتانش برای تایپ کردن استفاده کند، اما نمی‌تواند از عضلات مرتبط با گفتار برای تلفظ واضح واج‌ها استفاده کند.

خوشبختانه، مغز Pat هنوز هم می‌تواند دستورالعمل‌هایی را برای تولید واج‌ها فرموله کند، چیزی که پژوهشگران استنفورد از آن استفاده کردند. در مارس 2022، یک جراح مغز و اعصاب دو آرایه حسگر کوچک را در سطح مغز Pat در دو ناحیه جداگانه تولید گفتار کاشت. هر آرایه شامل 64 الکترود است که در قشر مغز تا عمقی حدود 3.5 میلی‌متر نفوذ می‌کند.

رابط مغز و رایانه صدای دو زن را به آنها بازگرداند
.

مانند Ann، هوش مصنوعی برای تشخیص فعالیت مغز مرتبط با تلاش‌های Pat برای فرمول‌بندی هر یک از 39 واجی که شامل انگلیسی گفتاری هستند، آموزش دیده بود. Pat حدود 25 جلسه آموزشی داشت که در هر جلسه سعی می‌کرد 260 تا 480 جمله تصادفی از مجموعه داده‌های بزرگی از نمونه‌های مکالمات تلفنی را تکرار کند.

Francis Willett، نویسنده اصلی این مطالعه، گفت: «این سامانه برای دانستن اینکه چه کلماتی باید پیش از کلمات دیگر قرار گیرند و کدام واج‌ها چه کلماتی را می‌سازند، آموزش دیده است. اگر برخی از واج‌ها به اشتباه تفسیر شده باشند، باز هم می‌توان حدس خوبی داشت».

جیمی هندرسون، جراح مغز و اعصاب که جراحی Pat را انجام داد و یکی از نویسندگان همکار این مطالعه گفت: «ما نشان دادیم که می‌توانید گفتار مورد نظر را با ثبت فعالیت از یک ناحیه بسیار کوچک در سطح مغز رمزگشایی کنید».

رابط مغز و رایانه صدای دو زن را به آنها بازگرداند
.

سخن آخر

Pat امیدوار است که ارتباطات به کمک BCI به زودی در دسترس افراد بیشتری قرار گیرد.

Pat می‌نویسد: «این نتایج اولیه این مفهوم را ثابت کرده است. و در نهایت، فناوری به آن دست خواهد یافت تا به راحتی برای افرادی که نمی‌توانند صحبت کنند، قابل دسترسی باشد. این بدان معنی است که این افراد می‌توانند با دنیای بزرگتر ارتباط برقرار کنند، شاید به کار ادامه دهند، دوستان و روابط خانوادگی خود را حفظ کنند».

اگرچه هنوز به صورت تجاری در دسترس نیست، اما پژوهشگران به پتانسیل و کاربردهای گسترده دستگاه خود امید دارند.

Willett گفت: «این یک اثبات علمی مفهوم است، نه یک وسیله واقعی که مردم می‌توانند در زندگی روزمره از آن استفاده کنند. اما این پیشرفت بزرگی در جهت بازگرداندن ارتباط افرادی است که نمی‌توانند صحبت کنند».

ویدئوی زیر که توسط دانشکده پزشکی استنفورد تهیه شده است، نشان می‌دهد چگونه اثبات مفهوم BCI  به Pat امکان صحبت کردن و برنامه‌هایش برای استفاده آینده از دستگاه را می‌دهد.

هر دو مطالعه در مجله Nature منتشر شد. مطالعه UCSF را می‌توان در اینجا یافت. مطالعه پزشکی استنفورد را می‌توانید در اینجا ببینید.


>> روش جدید استفاده از رابط مغز و رایانه برای توانبخشی پا پس از سکته

>> رابط مغز و رایانه (BCI) چیست؟


منبع: newatlas.com

«استفاده و بازنشر مطالب تنها با ذکر لینک منبع و نام (مجله فناوری‌های توان‌افزا و پوشیدنی) مجاز است».

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *