پژوهشگران دانشگاه HSE و دانشگاه دولتی پزشکی و دندانپزشکی مسکو یک مدل یادگیری ماشینی ایجاد کردهاند که میتواند کلمهای را که قرار است گفته شود، پیشبینی کند. این کار بر اساس فعالیت عصبی انجام میشود که مجموعه کوچکی از الکترودهای کم تهاجمی آن را ثبت میکنند. مقاله آنها در مجله مهندسی عصبی منتشر شد. با مجله فناوریهای پوشیدنی و توانافزا همراه باشید.
اختلالات گفتاری
میلیونها نفر در سراسر جهان تحت تأثیر اختلالات گفتاری قرار دارند که توانایی آنها در برقراری ارتباط را محدود میکند. علت از دست دادن گفتار میتواند متفاوت باشد و شامل سکته مغزی و برخی بیماریهای مادرزادی است.
امروزه فناوری برای بازگرداندن عملکرد ارتباطی چنین بیمارانی در دسترس است، از جمله رابطهای «گفتار بیصدا» که با ردیابی حرکت ماهیچهها زمانی که فرد بدون ایجاد صدا کلمات را به زبان میآورد، گفتار را تشخیص میدهد. چنین دستگاههایی به برخی از بیماران کمک میکند، اما به برخی نه، مانند افراد مبتلا به فلجی عضلات صورت.
پروتزهای عصبی گفتاری – رابط های مغز و رایانه که قادر به رمزگشایی گفتار بر اساس فعالیت مغز هستند – راهکاری قابل دسترس و قابل اعتماد برای بازگرداندن ارتباط به چنین بیمارانی هستند.
برخلاف رایانههای شخصی، دستگاههای دارای رابط مغز و رایانه (BCI) بدون نیاز به صفحه کلید یا میکروفون، به طور مستقیم توسط مغز کنترل میشوند.
مانع اصلی برای استفاده گستردهتر از BCI در پروتز گفتاری این است که این فناوری به جراحی بسیار تهاجمی برای کاشت الکترود در بافت مغز نیاز دارد.
مشکلات پروتزهای عصبی
دقیقترین تشخیص گفتار توسط پروتز عصبی با الکترودهایی به دست میآید که سطح وسیعی از قشر مغز را پوشش میدهند. با این حال، این راهکارها برای خواندن فعالیت مغز خطرات قابل توجهی برای بیماران ایجاد میکند و برای استفاده طولانی مدت مناسب نیست.
پژوهشگران مرکز HSE و دانشگاه دولتی پزشکی و دندانپزشکی مسکو امکان ایجاد یک پروتز عصبی کارآمد را بررسی کردند که قادر به رمزگشایی گفتار با دقت قابل قبول از طریق خواندن فعالیت مغز از مجموعه کوچکی از الکترودهای کاشته شده در ناحیه محدود از قشر مغز است. پژوهشگران معتقدند در آینده، این روش کم تهاجمی حتی میتواند تحت بیحسی موضعی انجام شود.
روش کار
در این مطالعه، پژوهشگران دادههایی را از دو بیمار مبتلا به صرع جمعآوری کردند. برای این دو بیمار، پیش از جراحی و برای تعیین مناطق آغازگر تشنج، الکترودهای داخل جمجمهای کار گذاشته شده بود.
از این بیماران خواسته شد شش جمله را با صدای بلند بخوانند. جملات از نظر ساختار متفاوت بودند. جملات در مجموع شامل 26 کلمه مختلف بودند. هنگامی که بیماران مشغول خواندن بودند، الکترودها فعالیت مغزی آنها را ثبت کردند.
سپس این دادهها با سیگنالهای صوتی همتراز شدند تا ۲۷ کلاس شامل ۲۶ کلمه و یک کلاس سکوت را تشکیل دهند. مجموعه داده آموزشی حاصل (شامل سیگنالهای ثبت شده) به یک مدل یادگیری ماشینی با معماری مبتنی بر شبکه عصبی وارد شد. وظیفهی شبکه عصبی پیشبینی کلمه بعدی (کلاس) بر اساس دادههای فعالیت عصبی پیش از بیان آن بود.
در طراحی معماری شبکه عصبی، پژوهشگران میخواستند آن را ساده، فشرده و به راحتی قابل تفسیر کنند. آنها یک معماری دو مرحلهای ایجاد کردند که ابتدا بازنمایی گفتار درونی را از دادههای فعالیت مغزی استخراج میکرد، ضرایب طیف mel را تولید و سپس یک کلاس خاص، یعنی یک کلمه یا سکوت را پیشبینی میکرد.
نتایج
بدین ترتیب، شبکه عصبی با استفاده از تنها شش کانال داده ثبت شده توسط یک الکترود sEEG در بیمار نخست به دقت 55 درصد و تنها با استفاده از هشت کانال داده ثبت شده توسط یک نوار ECoG در بیمار دوم، 70 درصد دقت را به دست آورد. چنین دقتی با آنچه در مطالعات دیگر با استفاده از وسایلی که نیاز به کاشت الکترود در کل سطح قشر مغز داشت، قابل مقایسه است.
مدل قابل تفسیر به دست آمده این امکان را فراهم میکند که در اصطلاح نوروفیزیولوژیک توضیح دهیم کدام اطلاعات عصبی بیشترین کمک را در پیشبینی کلمهای که قرار است گفته شود دارد.
مزیت دیگر این راهکار این است که نیازی به مهندسی ویژگیهای دستی ندارد. این مدل یاد گرفته است بازنمایی گفتار را به طور مستقیم از دادههای فعالیت مغز استخراج کند. تفسیرپذیری نتایج همچنین نشان میدهد که این شبکه، سیگنالهای مغز را با هر فعالیت همزمان، مانند سیگنالهای الکتریکی از ماهیچهها یا ناشی از اثر میکروفون، به خوبی رمزگشایی میکند.
پژوهشگران تأکید میکنند پیشبینی همیشه بر اساس دادههای فعالیت عصبی پیش از گفتن کلمات بود.
استفاده از چنین رابطهایی کمترین خطر را برای بیمار به همراه دارد. اگر همه چیز درست پیش برود، میتوان گفتار خیالی را از فعالیت عصبی ضبط شده توسط تعداد کمی از الکترودهای کم تهاجمی که در یک محیط سرپایی با بیحسی موضعی کاشته شدهاند رمزگشایی کرد.
>> رمزگشایی حرکت و گفتار از سیگنال مغزی افراد تتراپلژی
منبع: medicalxpress
«استفاده و بازنشر مطالب تنها با ذکر لینک منبع و نام (مجله فناوریهای توانافزا و پوشیدنی) مجاز است»