مکالمه با هوش مصنوعی ChatGPT مدل کننده زبان

مدل ChatGP یک مدل برای برهم‌کنش مکالمه محور است. این نوع برهم‌کنش امکان پرسش و پاسخ را فراهم می‌کند. همچنین ChatGP به این شکل می‌تواند اشتباهات را بپذیرد، فرض‌های نادرست را به چالش بکشد و تقاضای نامناسب را رد کند. ChatGP را می‌توان مدل برادر InstructGPT دانست که برای پیگیری دستورات و ارائه پاسخ‌های دقیق طراحی شده است. در ادامه این مقاله از مجله فناوری‌های توان افزا و پوشیدنی به معرفی بیشتر ChatGPT می‌پردازیم.

هوش مصنوی

ChatGPT یک مدل وسیع زبان است که توسط OpenAI توسعه یافته است. از این مدل برای انجام امور وابسته به زبان مانند تولید متن یا ترجمه کمک گرفته می‌شود. ChatGP برپایه مدل GPT-3.5( یا Generative Pretrained Transformer 3.5). این مدل یکی از پیشرفته‌ترین مدل‌های موجود در حوزه زبان است. این سامانه می‌تواند متن‌هایی در پاسخ به سوال مطرح شده تولید کند. به همین دلیل این مدل برای چت‌بات‌های خدمات مشتریان، نوشتن پاسخ در تالارهای گفت‌وگوی مجازی و حتی تولید محتوای شخصی در فضای مجازی بسیار کارآمد است.

مثال هایی از مکالمه با ChatGP

در این مکالمه که در وبلاگ OpenAI قرار داده شده است، از مدل خواسته می‌شود که طی مراحلی در یافتن ایراد کد برنامه نویسی مشارکت کند.

کاربر: این کد طبق انتظار کار نمی‌کند. چطور درستش کنم؟

Coding with ChatGPT

ChatGP: بدون داشتن هیچ‌گونه زمینه، یافتن ایراد دشوار است. اطلاعات بیشتری در مورد کارکرد مورد انتظار کد و آن‌چه که مطابق توقع کار نمی‌کند بدید. آیا این متن کل کد هست یا بخشی از آن؟

کاربر: فقط قسمتی از کد. error خودش را نمی‌دهد و من فکر می‌کنم مشکل مربوط به channel باشد

ChatGP: بدون داشتن زمینه یافتن ایراد دشوار است. آیا می‌تواند بیشتر در مورد کارکرد مورد انتظار کد و آن‌چه پس از اجرا رخ می‌دهد بگید؟ مشکل احتمالی می‌تواند این باشد که کانال resultWorkerErr بسته نشده باشد، که در این صورت با نوشته نشدن اطلاعات در resultWorkerErr کد هنگ می‌کند. در صورتیکه b.resultWorker هرگز خطا ندهد یا در صورتیکه قبل از ارور دادن بسته شود، بروز مشکل امکان دارد.

برای حل این مشکل کدی که در ادامه آمده را کانال resultWorkerErr را پس از ریختن اطلاعات در آن ببندید. را بعد از خطی که خطا را به کانال می‌فرستد استفاده کنید.


close(resultWorkerErr)

این کد از بسته بودن کانال resultWorkerErr اطمینان حاصل می‌کند. حتی اگر b.resultWorker هرگز خطایی تولید نکند. مجدد ذکر می‌شود که بدون اطلاعات کافی گفتن اینکه مشکل شما چی هست، دشوار است. آیا می‌توانید اطلاعات بیشتری در مورد آن‌چه با اجرای کد رخ می‌دهد بنویسید.

نمونه متن تولید شده از مکالمه با ChatGPT

روش ها

این مدل با استفاده از Reinforcement Learning از بازخورد انسانی (RLHF) و با استفاده از روش‌های به کاررفته برای InstruxtGPT توسته یافته است. اما تفاوت‌های اندکی در مقدمات جمع‌آوری داده در آن وجود دارد. مدل ابتدایی با استفاده از بهینه سازی نظارت شده توسط انسان ساخته شد. به این شکل که تعلیم دهندگان(trainer) هوش مصنوعی مکالمه‌ای ارائه می‌دهند که هر دو نقش دستیار هوش مصنوعی و کاربر را در آن به عهده دارند. برای نوشتن پاسخ‌های این مکالمه به تعلیم‌دهندگان توصیه‌هایی ارائه شده است. ترکیب داده‌های مکالمات جدید با داده‌های InstructGPT نهایتا به فرمتی برای مکالمه تبدیل می‌شود.

برای ایجاد تشویق در مدل یادگیری به داده‌های مقایسه‌ای نیز نیاز است. این داده‌ها شامل دو یا تعداد بیشتری مدل پاسخ است که بر اساس کیفیت طبقه‌بندی شده است. برای بدست آوردن این داده‌ها مکالمات چت بات با تعلیم‌دهندگان جمع‌آوری شد. سپس یک پاسخ ( که طبق مدل نوشته شده بود) به تصادف انتخاب شد، پاسخ‌های جایگزین نمونه تولید شد و تعلیم‌دهندگان هوش منصنوعی آنان را طبقه‌بندی کرند. این مدل تشویق‌گر برای بهینه‌سازی الگوریم Proxiaml Policy Optimization استفاده شد. این مراحل چندین بار تکرار شد.

Proximal Policy Optimizaition یا PPO نسل جدید الگوریتم‌های OpenAI است که استفاده و بهینه سازی آن به مراتب ساده‌تر از الگوریتم‌های روز است. PPO بازده بهتری نیز دارد.

ChatGPT بر اساس طیفی از مدل‌های GPT-3.5 بهینه‌سازی می‌شود که در اسل ۲۰۲۲ تعلیم آن‌ها به پایان رسیده بود. برای کسب اطلاعات بیشتر در مورد GPT-3.5 به این لینک مراجعه کنید. ChatGPT و GPT-3.5 روی ابررایانه Azure AI تعلیم داده شده اند.

چه میزان داده برای آموزش ChatGPT استفاده شده است؟

آموزش مدل‌های زبان بر پایه حجم عظیم داده انجام می‌شود. این حجم از داده به مدل توانایی پیش‌بینی لغت بعدی در جمله را می‌آموزد. نشان داده شده است که با افزایش حجم داده‌های لازم برای تعلیم مدل‌های زبانی،‌ مدل می‌تواند بهبود یابد.

بنا به ادعای دانشگاه Stanfrord مدل GPT-3‌ دارای ۱۵۷ میلیارد پارامتر مختلف است. این مدل با ۵۷۰ گیگابایت داده تعلیم داده شده است. برای مقایسه بهتر باید گفت که GPT-2 یا نسل قبلی مدل زبان، ۱۰۰ برابر کوچک‌تر بود و دارای ۱.۵ میلیارد پارامتر بود.

افزایش چشمگیر مقیاس مدل به طور موثر کارکرد مدل را بهبود می‌بخشد. به طور مثال این مدل پس از آموزش قادر بود کارهایی که برای انجام آن تعلیم نیافته بود را انجام دهد. مدل توانست انگلیسی را به فرانسوی ترجمه کند. اما برای این کار آموزش ندیده بود. همچنین GPT-3‌ می‌تواند مدل‌های تخصصی را شکست دهد. این مدل‌ها برای انجام کار خاصی ایجاد می‌شوند و در انجام سایر امور کارکرد خوبی ندارند.

برای مقایسه کاراریی مدل می‌توان آن را با مدل‌های تکمیل خودکار متن مقایسه کرد. مدل‌های تکمیل خودکار می‌توانند جمله شما را کامل کنند اما مدل حاضر می‌تواند یک پاراگراف یا یک متن کامل در ادامه جمله شما بنویسد.

آشنایی با توسعه دهندگان ChatGP

توسعه‌دهندگان GPT-3.5 کارمندان و وابستگاه OpenAI بوده‌اند. به طور خاص می‌توان به نام پژوهش‌گران Alec Radford, Jeffrey Wu, Rewon Child, and David Luan در OpenAI اشاره کرد. آنان با سایر پژوهشگران OpenAI و مهندسین برای توسعه کار خود و استفاده از حجمی عظیم از داده همکاری داشتند. GPT-3 در سال ۲۰۲۰ در مقاله‌ای برای تولید پاسخ‌های مشابه زبان انسانی توسط متن معرفی شد. پس از آن از این مدل برای پژوهش‌های بسیاری استفاده شده است.

استفاده از CahtGP

برای استفاده از ChatGP‌ و برهم‌کنش با آن باید به API ویژه OpenAI دسترسی داشته باشید. پس از دسترسی امکان ارسال متن و دریافت پاسخ فراهم می‌شود. به عبارتی می‌بایست:

  • با ورود به openai.com اقدام به ثبت نام و دریافت حساب کاربردی نمایید.
  • ChatGPT در قسمت چپ را انتخاب کنید.
  • در chat.openai.com گزینه Try it now‌را انتخاب کنید.
  • سوالی که به پاسخ آن نیاز دارید را در قسمت ارائه شده برای مکالمه تایپ نمایید.

در صورتیکه در ناحیه جغرافیایی تعریف شده و در دسترس این صفحات وب هستید، استفاده از ChatGPT‌ را در حال حاضر رایگان خواهید یافت. در حال حاضر شلوغی شبکه و تعدد کاربران ممکن است سبب بروز خطای شبکه شود. با توجه به هزینه‌های بالای آموزش مدل GPT3.5‌ امکان تعیین هزینه در آینده برای استفاده از آن را در نظر داشته باشید.


متاورس انقلابی برای افراد دچار معلولیت
اسکلت های بیرونی IHMC


منبع: OpenAI Blog

«استفاده و بازنشر مطالب تنها با ذکر لینک منبع و نام (مجله فناوریهای توان افزا و پوشیدنی) مجاز است.»

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *