فناوری جدید شرکت گوگل میتواند اجزای درون فیلمها را به کمک الگوریتم یادگیری ماشین جستجو و شناسایی کند. تاکنون رابطهای برنامه نویسی تنها روی تصاویر متمرکز بودند و میتوانستند شبیهترین تصویر را شناسایی کنند.
با مجله فناوریهای توان افزا و پوشیدنی همراه باشید
گوگل در کنفرانس Cloud Next این شرکت در سان فرانسیسکو اعلام کرد رابط برنامهنویسی (API) جدیدی به کمک یادگیری ماشین راهاندازی کرده که میتواند به طور خودکار اجزای درون فیلمها را شناسایی و آنها را جستجو کند.
رابطهای برنامهنویسی هوشمند ویدئویی به توسعهدهندگان اجازه خواهد داد تا برای استخراج خودکار اجزا از ویدئوها برنامههای کاربردی ایجاد کنند. تاکنون، رابطهای برنامه نویسی روی انجام اینکار برای تصاویر متمرکز بودند و تنها مشابهترین تصویر را شناسایی میکردند اما با کمک این رابطهای برنامهنویسی جدید، توسعهدهندگان قادر به ساخت برنامههای کاربردی خواهند بود که به کاربران اجازه جستجو و کشف اطلاعات در فیلمها را میدهد. این بدان معناست که شما میتوانید برای نمونه، «سگ» و یا «گل» را در یک فیلم جستجو کنید. با رابطهای برنامهنویسی جدید افزون بر استخراج داده امکان برچسب گذاری (تگ) تغییرات صحنه در یک ویدیو نیز فراهم شده است.
این فیلمها در سرویس ذخیره سازی ابری گوگل ذخیره میشود. شما میتوانید یک نسخه نمایشی از چگونگی انجام این کار را اینجا ببینید. اگر شما توسعهدهنده هستید میتوانید برای نسخه خصوصی در اینجا ثبت نام کنید.
همانطور که Fei-Fei Li، دانشمند ارشد در هوش مصنوعی و یادگیری ماشین در Google Cloud، در مراسم افتتاحیه کنفرانس Cloud Next خاطر نشان کرد، جهان پیکسل فراتر از تصاویر میرود. فیلم به مدت طولانی چالشی برای پژوهشگران یادگیری ماشین بوده است. در حال حاضر این سرویس جدید همانند تصاویر، اطلاعات فیلمها را به آسانی استخراج میکند.
افزون بر این، مهندسی ابری یادگیری ماشین، ابزار شرکت گوگل برای ساخت مدلهای سفارشی یادگیری ماشین با استفاده از چارچوب TensorFlow (کتابخانه متن باز هوش ماشینی)، در حال حاضر در دسترس است. شرکت گوگل قصد دارد تا فناوری یادگیری ماشین که در این شرکت توسعه یافته را مردمی کند. رابط برنامهنویسی بینایی (Vision API) نمونهای از این فعالیتهای شرکت گوگل است.
منبع: techcrunch