پروتز عصبی از فعالیت مغز برای رمزگشایی گفتار استفاده میکند

پژوهشگران دانشگاه HSE و دانشگاه دولتی پزشکی و دندانپزشکی مسکو یک مدل یادگیری ماشینی ایجاد کرده‌اند که می‌تواند کلمه‌ای را که قرار است گفته شود، پیش‌بینی کند. این کار بر اساس فعالیت عصبی  انجام می‌شود که مجموعه کوچکی از الکترودهای کم تهاجمی آن را ثبت می‌کنند. مقاله آنها در مجله مهندسی عصبی منتشر شد. با مجله فناوری‌های پوشیدنی و توان‌افزا همراه باشید.

پروتز عصبی از فعالیت مغز برای رمزگشایی گفتار استفاده میکند

اختلالات گفتاری

میلیون‌ها نفر در سراسر جهان تحت تأثیر اختلالات گفتاری قرار دارند که توانایی آنها در برقراری ارتباط را محدود می‌کند. علت از دست دادن گفتار می‌تواند متفاوت باشد و شامل سکته مغزی و برخی بیماری‌های مادرزادی است.

امروزه فناوری برای بازگرداندن عملکرد ارتباطی چنین بیمارانی در دسترس است، از جمله رابط‌های «گفتار بی‌صدا» که با ردیابی حرکت ماهیچه‌ها زمانی که فرد بدون ایجاد صدا کلمات را به زبان می‌آورد، گفتار را تشخیص می‌دهد. چنین دستگاه‌هایی به برخی از بیماران کمک می‌کند، اما به برخی نه، مانند افراد مبتلا به فلجی عضلات صورت.

پروتزهای عصبی گفتاری رابط های مغز و رایانه که قادر به رمزگشایی گفتار بر اساس فعالیت مغز هستند – راهکاری قابل دسترس و قابل اعتماد برای بازگرداندن ارتباط به چنین بیمارانی هستند.

برخلاف رایانه‌های شخصی، دستگاه‌های دارای رابط مغز و رایانه (BCI) بدون نیاز به صفحه کلید یا میکروفون، به طور مستقیم توسط مغز کنترل می‌شوند.

مانع اصلی برای استفاده گسترده‌تر از BCI در پروتز گفتاری این است که این فناوری به جراحی بسیار تهاجمی برای کاشت الکترود در بافت مغز نیاز دارد.

مشکلات پروتزهای عصبی

دقیق‌ترین تشخیص گفتار توسط پروتز عصبی با الکترودهایی به دست می‌آید که سطح وسیعی از قشر مغز را پوشش می‌دهند. با این حال، این راهکارها برای خواندن فعالیت مغز خطرات قابل توجهی برای بیماران ایجاد می‌کند و برای استفاده طولانی مدت مناسب نیست.

پژوهشگران مرکز HSE و دانشگاه دولتی پزشکی و دندان‌پزشکی مسکو امکان ایجاد یک پروتز عصبی کارآمد را بررسی کردند که قادر به رمزگشایی گفتار با دقت قابل قبول از طریق خواندن فعالیت مغز از مجموعه کوچکی از الکترودهای کاشته ‌شده در ناحیه محدود از قشر مغز است. پژوهشگران معتقدند در آینده، این روش کم تهاجمی حتی می‌تواند تحت بی‌حسی موضعی انجام شود.

روش کار

در این مطالعه، پژوهشگران داده‌هایی را از دو بیمار مبتلا به صرع جمع‌آوری کردند. برای این دو بیمار، پیش از جراحی و برای تعیین مناطق آغازگر تشنج، الکترودهای داخل جمجمه‌ای کار گذاشته شده بود.

از این بیماران خواسته شد شش جمله را با صدای بلند بخوانند. جملات از نظر ساختار متفاوت بودند. جملات در مجموع شامل 26 کلمه مختلف بودند. هنگامی که بیماران مشغول خواندن بودند، الکترودها فعالیت مغزی آنها را ثبت کردند.

سپس این داده‌ها با سیگنال‌های صوتی هم‌تراز شدند تا ۲۷ کلاس شامل ۲۶ کلمه و یک کلاس سکوت را تشکیل دهند. مجموعه داده آموزشی حاصل (شامل سیگنال‌های ثبت شده) به یک مدل یادگیری ماشینی با معماری مبتنی بر شبکه عصبی وارد شد. وظیفه‌ی شبکه عصبی پیش‌بینی کلمه بعدی (کلاس) بر اساس داده‌های فعالیت عصبی پیش از بیان آن بود.

در طراحی معماری شبکه عصبی، پژوهشگران می‌خواستند آن را ساده، فشرده و به راحتی قابل تفسیر کنند. آنها یک معماری دو مرحله‌ای ایجاد کردند که ابتدا بازنمایی گفتار درونی را از داده‌های فعالیت مغزی استخراج می‌کرد، ضرایب طیف mel را تولید و سپس یک کلاس خاص، یعنی یک کلمه یا سکوت را پیش‌بینی می‌کرد.

نتایج

بدین ترتیب، شبکه عصبی با استفاده از تنها شش کانال داده ثبت شده توسط یک الکترود sEEG در بیمار نخست به دقت 55 درصد و تنها با استفاده از هشت کانال داده ثبت شده توسط یک نوار ECoG  در بیمار دوم، 70 درصد دقت را به دست آورد. چنین دقتی با آنچه در مطالعات دیگر با استفاده از وسایلی که نیاز به کاشت الکترود در کل سطح قشر مغز داشت، قابل مقایسه است.

مدل قابل تفسیر به دست آمده این امکان را فراهم می‌کند که در اصطلاح نوروفیزیولوژیک توضیح دهیم کدام اطلاعات عصبی بیشترین کمک را در پیش‌بینی کلمه‌ای که قرار است گفته شود دارد.

مزیت دیگر این راهکار این است که نیازی به مهندسی ویژگی‌های دستی ندارد. این مدل یاد گرفته است بازنمایی گفتار را به طور مستقیم از داده‌های فعالیت مغز استخراج کند. تفسیرپذیری نتایج همچنین نشان می‌دهد که این شبکه، سیگنال‌های مغز را با هر فعالیت همزمان، مانند سیگنال‌های الکتریکی از ماهیچه‌ها یا ناشی از اثر میکروفون، به خوبی رمزگشایی می‌کند.

پژوهشگران تأکید می‌کنند پیش‌بینی همیشه بر اساس داده‌های فعالیت عصبی پیش از گفتن کلمات بود.

استفاده از چنین رابط‌هایی کمترین خطر را برای بیمار به همراه دارد. اگر همه چیز درست پیش برود، می‌توان گفتار خیالی را از فعالیت عصبی ضبط شده توسط تعداد کمی از الکترودهای کم تهاجمی که در یک محیط سرپایی با بی‌حسی موضعی کاشته شده‌اند رمزگشایی کرد.


>> رمزگشایی حرکت و گفتار از سیگنال مغزی افراد تتراپلژی


منبع: medicalxpress

«استفاده و بازنشر مطالب تنها با ذکر لینک منبع و نام (مجله فناوری‌های توان‌افزا و پوشیدنی) مجاز است»

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *