ما در دوره نوین تحول هنر و خلاقیت هستیم اما این بار نه به دست انسان بلکه توسط ماشینها خلاقیت و هنر متحول خواهد شد. با مجله فناوریهای توانافزا و پوشیدنی همراه باشید. در سخنرانی TED دانشمند گوگل توضیح خواهد داد چگونه شبکههای عصبی که آموزش میبینند تصاویر را درک کنند در روند معکوس به خلق تصاویر جدید پرداختند.
بلیس اگرای آرکاس (Blaise Agüera y Arcas) دانشمند ارشد گوگل بر شبکههای عصبی عمیق و یادگیری ماشین کار میکند. او با گروه خود در زمینه ادراک ماشینها و یادگیری توزیعشده فعالیت دارد. در سخنرانی TED، او نشان میدهد که چگونه شبکههای عصبی آموزش میبینند تا تصاویر را شناسایی کنند و حتی در روند معکوس تصاویر را تولید کنند. نتیجه کار ماشینها دیدنی و جذاب است. ماشینهایی که تصاویر را خود ایجاد میکنند و حتی شعر میگویند.
توانایی ادراک ماشینی
این دانشمند اعتقاد دارد ادراک و خلاقیت در فاصله تنگاتنگ از یکدیگر قرار دارند. مخلوقی که توانایی ادراک داشته باشد قدرت خلاقیت نیز دارد. او به همراه گروه خود درباره هوش ماشینی پژوهش میکند. هدف آنها خلق رایانههایی است که همانند مغز انسان عمل کنند. بلیس اگرای توضیح میدهد: «ما به علوم اعصاب و فعالیتهای مغز انسان علاقهمند هستیم. فعالیتهایی که از توانایی رایانهها فاصله زیادی دارند. یکی از تواناییهای مغز، ادراک است. فرآیندی که باعث میشود آنچه که در جهان وجود دارد همانند صدا و تصویر به مفاهیم ذهنی تبدیل شوند.» برای نمونه میتوان به الگوریتمهای ادراک ماشینی در ابزار تصاویر گوگل (Google Photos) اشاره کرد. با این الگوریتمها میتوان بر اساس آنچه در تصویر وجود دارد، تصاویر را جستجو کرد.
نقطه مقابل ادراک، خلاقیت است یعنی خلق مفهومی جدید در دنیا. در چند سال اخیر بلیس اگرای و گروهش بر ادراک ماشین تمرکز داشتند. ادراک و خلاقیت با یکدیگر پیوند دارند. در این مسیر آنها با خلاقیت و هنر ماشینی روبرو شدهاند.
نخستین تصویر از مغز در قرن ۱۹ میلادی با میکروسکوپ و روی کاغذ با رنگآمیزی خاص ترسیم شد. هماکنون از بافتهای کوچک تصویربرداری شده مغز میتوان نورونهای سهبعدی را بازسازی کرد. رایانهها بر مبنای الگوی مغز اختراع شدند. رایانهها همان ماشینهای هوشمندی هستند که آلن تورینگ پدر علم رایانه نامگذاری کرد.
در پردازش اطلاعات تصویری، وظیفه ادراک ماشینی دریافت یک تصویر و شناسایی آن است. کاری که تا چند سال پیش برای رایانهها غیرممکن بود. برای شناسایی تصویر در مغز از شبکههای عصبی شامل نورونها استفاده میشود. در رایانه نیز همین شبکه عصبی مدلسازی شده است.
در مغز از لایه نخست شبکه عصبی که شبکیه چشم است تا لایههای دیگر قشر بینایی با کمک سیناپسهایی با وزنهای متفاوت به یکدیگر متصل هستند. رفتار شبکه توسط سیناپسها و وزن آنها مشخص میشود. بین پیکسلهای تصویر و شناسایی تصویر در رایانه میتوان رفتار مغز را با سه متغیر مدل کرد. متغیر ایکس (X) حدود یک میلیارد پیکسل تصویر است و دبلیو (W) وزنهای سیناپسهای شبکه عصبی هستند و در آخر ایگرگ (y) خروجیهای شبکه هستند که تعداد کمی دارند. میتوان با بیان ساده معادله Y= X*W را درنظر گرفت. در این معادله وزنهای W مجهول هستند. برای حل آن از روشهای مبتنی بر تکرار و مرحله به مرحله استفاده میشود تا به نزدیکترین و دقیقترین پاسخ برسیم. این مرحله یادگیری الگوریتم است. مانند نوزادان که با تکرار یاد میگیرند ماشینها نیز با روشهای مبتنی بر تکرار آموزش داده میشوند.
توانایی خلاقیت و هنر ماشینی
حال معادله را با دیدگاه دیگر در نظر میگیریم. اگر ما پاسخ (Y) و وزنهای معادله را بدانیم آیا میتوانیم تصویر را بازسازی کنیم. برای نمونه اگر شبکه عصبی بداند که تصویر پرنده است در روند معکوس چه تصویری از آن میسازد؟ به صورت ناباورانه شبکه عصبی تصویر پرنده را خواهد کشید. برای تصاویر دیگر نیز میتوان این روند معکوس را طی کرد. برای نمونه برای حیوانات دیگر یا حتی تشخیص چهره.
مورد جذاب دیگری که وجود دارد سامانهای است که با دریافت یک تصویر و محتویات آن، شعر میگوید. یعنی با یک شبکه عصبی شاعر روبرو هستیم. این شبکه عصبی با مجموعهای از شعرهای قرن بیستم آموزش دیده است. شاید میکل آنژ درست میگفت که ادراک و خلاقیت بسیار به یکدیگر نزدیک هستند. شبکههای عصبی آموزش دیدهاند که آنچه در تصویر هستند را درک کنند، توانستند در روند معکوس چیزهای جدیدی از تصویر یا حتی شعر خلق کنند. هر موجودی که توانایی ادراک دارد میتواند خلاقیت داشته باشد. ادراک و خلاقیت مختص انسان نیستند. هماکنون مدلهای رایانهای همین کار را میکنند.
در زمینه شبکه عصبی مصنوعی و پیشرفت های یادگیری ماشین بیشتر بخوانید:
>>چرا یادگیری عمیق با یادگیری ماشینی متفاوت است؟
منبع: TED
استفاده و بازنشر این نوشتار تنها با ذکر لینک منبع و نام «مجلهی فناوریهای توان افزا و پوشیدنی» مجاز است.