مدل ChatGP یک مدل برای برهمکنش مکالمه محور است. این نوع برهمکنش امکان پرسش و پاسخ را فراهم میکند. همچنین ChatGP به این شکل میتواند اشتباهات را بپذیرد، فرضهای نادرست را به چالش بکشد و تقاضای نامناسب را رد کند. ChatGP را میتوان مدل برادر InstructGPT دانست که برای پیگیری دستورات و ارائه پاسخهای دقیق طراحی شده است. در ادامه این مقاله از مجله فناوریهای توان افزا و پوشیدنی به معرفی بیشتر ChatGPT میپردازیم.
ChatGPT یک مدل وسیع زبان است که توسط OpenAI توسعه یافته است. از این مدل برای انجام امور وابسته به زبان مانند تولید متن یا ترجمه کمک گرفته میشود. ChatGP برپایه مدل GPT-3.5( یا Generative Pretrained Transformer 3.5). این مدل یکی از پیشرفتهترین مدلهای موجود در حوزه زبان است. این سامانه میتواند متنهایی در پاسخ به سوال مطرح شده تولید کند. به همین دلیل این مدل برای چتباتهای خدمات مشتریان، نوشتن پاسخ در تالارهای گفتوگوی مجازی و حتی تولید محتوای شخصی در فضای مجازی بسیار کارآمد است.
مثال هایی از مکالمه با ChatGP
در این مکالمه که در وبلاگ OpenAI قرار داده شده است، از مدل خواسته میشود که طی مراحلی در یافتن ایراد کد برنامه نویسی مشارکت کند.
کاربر: این کد طبق انتظار کار نمیکند. چطور درستش کنم؟
ChatGP: بدون داشتن هیچگونه زمینه، یافتن ایراد دشوار است. اطلاعات بیشتری در مورد کارکرد مورد انتظار کد و آنچه که مطابق توقع کار نمیکند بدید. آیا این متن کل کد هست یا بخشی از آن؟
کاربر: فقط قسمتی از کد. error خودش را نمیدهد و من فکر میکنم مشکل مربوط به channel باشد
ChatGP: بدون داشتن زمینه یافتن ایراد دشوار است. آیا میتواند بیشتر در مورد کارکرد مورد انتظار کد و آنچه پس از اجرا رخ میدهد بگید؟ مشکل احتمالی میتواند این باشد که کانال resultWorkerErr
بسته نشده باشد، که در این صورت با نوشته نشدن اطلاعات در resultWorkerErr
کد هنگ میکند. در صورتیکه b.resultWorker
هرگز خطا ندهد یا در صورتیکه قبل از ارور دادن بسته شود، بروز مشکل امکان دارد.
برای حل این مشکل کدی که در ادامه آمده را کانال resultWorkerErr
را پس از ریختن اطلاعات در آن ببندید. را بعد از خطی که خطا را به کانال میفرستد استفاده کنید.
close(resultWorkerErr)
این کد از بسته بودن کانال resultWorkerErr
اطمینان حاصل میکند. حتی اگر b.resultWorker
هرگز خطایی تولید نکند. مجدد ذکر میشود که بدون اطلاعات کافی گفتن اینکه مشکل شما چی هست، دشوار است. آیا میتوانید اطلاعات بیشتری در مورد آنچه با اجرای کد رخ میدهد بنویسید.
روش ها
این مدل با استفاده از Reinforcement Learning از بازخورد انسانی (RLHF) و با استفاده از روشهای به کاررفته برای InstruxtGPT توسته یافته است. اما تفاوتهای اندکی در مقدمات جمعآوری داده در آن وجود دارد. مدل ابتدایی با استفاده از بهینه سازی نظارت شده توسط انسان ساخته شد. به این شکل که تعلیم دهندگان(trainer) هوش مصنوعی مکالمهای ارائه میدهند که هر دو نقش دستیار هوش مصنوعی و کاربر را در آن به عهده دارند. برای نوشتن پاسخهای این مکالمه به تعلیمدهندگان توصیههایی ارائه شده است. ترکیب دادههای مکالمات جدید با دادههای InstructGPT نهایتا به فرمتی برای مکالمه تبدیل میشود.
برای ایجاد تشویق در مدل یادگیری به دادههای مقایسهای نیز نیاز است. این دادهها شامل دو یا تعداد بیشتری مدل پاسخ است که بر اساس کیفیت طبقهبندی شده است. برای بدست آوردن این دادهها مکالمات چت بات با تعلیمدهندگان جمعآوری شد. سپس یک پاسخ ( که طبق مدل نوشته شده بود) به تصادف انتخاب شد، پاسخهای جایگزین نمونه تولید شد و تعلیمدهندگان هوش منصنوعی آنان را طبقهبندی کرند. این مدل تشویقگر برای بهینهسازی الگوریم Proxiaml Policy Optimization استفاده شد. این مراحل چندین بار تکرار شد.
Proximal Policy Optimizaition یا PPO نسل جدید الگوریتمهای OpenAI است که استفاده و بهینه سازی آن به مراتب سادهتر از الگوریتمهای روز است. PPO بازده بهتری نیز دارد.
ChatGPT بر اساس طیفی از مدلهای GPT-3.5 بهینهسازی میشود که در اسل ۲۰۲۲ تعلیم آنها به پایان رسیده بود. برای کسب اطلاعات بیشتر در مورد GPT-3.5 به این لینک مراجعه کنید. ChatGPT و GPT-3.5 روی ابررایانه Azure AI تعلیم داده شده اند.
چه میزان داده برای آموزش ChatGPT استفاده شده است؟
آموزش مدلهای زبان بر پایه حجم عظیم داده انجام میشود. این حجم از داده به مدل توانایی پیشبینی لغت بعدی در جمله را میآموزد. نشان داده شده است که با افزایش حجم دادههای لازم برای تعلیم مدلهای زبانی، مدل میتواند بهبود یابد.
بنا به ادعای دانشگاه Stanfrord مدل GPT-3 دارای ۱۵۷ میلیارد پارامتر مختلف است. این مدل با ۵۷۰ گیگابایت داده تعلیم داده شده است. برای مقایسه بهتر باید گفت که GPT-2 یا نسل قبلی مدل زبان، ۱۰۰ برابر کوچکتر بود و دارای ۱.۵ میلیارد پارامتر بود.
افزایش چشمگیر مقیاس مدل به طور موثر کارکرد مدل را بهبود میبخشد. به طور مثال این مدل پس از آموزش قادر بود کارهایی که برای انجام آن تعلیم نیافته بود را انجام دهد. مدل توانست انگلیسی را به فرانسوی ترجمه کند. اما برای این کار آموزش ندیده بود. همچنین GPT-3 میتواند مدلهای تخصصی را شکست دهد. این مدلها برای انجام کار خاصی ایجاد میشوند و در انجام سایر امور کارکرد خوبی ندارند.
برای مقایسه کاراریی مدل میتوان آن را با مدلهای تکمیل خودکار متن مقایسه کرد. مدلهای تکمیل خودکار میتوانند جمله شما را کامل کنند اما مدل حاضر میتواند یک پاراگراف یا یک متن کامل در ادامه جمله شما بنویسد.
آشنایی با توسعه دهندگان ChatGP
توسعهدهندگان GPT-3.5 کارمندان و وابستگاه OpenAI بودهاند. به طور خاص میتوان به نام پژوهشگران Alec Radford, Jeffrey Wu, Rewon Child, and David Luan در OpenAI اشاره کرد. آنان با سایر پژوهشگران OpenAI و مهندسین برای توسعه کار خود و استفاده از حجمی عظیم از داده همکاری داشتند. GPT-3 در سال ۲۰۲۰ در مقالهای برای تولید پاسخهای مشابه زبان انسانی توسط متن معرفی شد. پس از آن از این مدل برای پژوهشهای بسیاری استفاده شده است.
استفاده از CahtGP
برای استفاده از ChatGP و برهمکنش با آن باید به API ویژه OpenAI دسترسی داشته باشید. پس از دسترسی امکان ارسال متن و دریافت پاسخ فراهم میشود. به عبارتی میبایست:
- با ورود به openai.com اقدام به ثبت نام و دریافت حساب کاربردی نمایید.
- ChatGPT در قسمت چپ را انتخاب کنید.
- در chat.openai.com گزینه Try it nowرا انتخاب کنید.
- سوالی که به پاسخ آن نیاز دارید را در قسمت ارائه شده برای مکالمه تایپ نمایید.
در صورتیکه در ناحیه جغرافیایی تعریف شده و در دسترس این صفحات وب هستید، استفاده از ChatGPT را در حال حاضر رایگان خواهید یافت. در حال حاضر شلوغی شبکه و تعدد کاربران ممکن است سبب بروز خطای شبکه شود. با توجه به هزینههای بالای آموزش مدل GPT3.5 امکان تعیین هزینه در آینده برای استفاده از آن را در نظر داشته باشید.
متاورس انقلابی برای افراد دچار معلولیت
اسکلت های بیرونی IHMC
منبع: OpenAI Blog
«استفاده و بازنشر مطالب تنها با ذکر لینک منبع و نام (مجله فناوریهای توان افزا و پوشیدنی) مجاز است.»