Stable Diffusion ، ابزار هوش مصنوعی تبدیل متن به عکس.

به وبلاگ روبو خوش آمدید، در این مقاله می خواهیم درباره ی هوش مصنوعی Stable Diffusion صحبت کنیم پس در ادامه مطلب همراهمان باشید.

اگر یه اخبار صفر تا صد هوش مصنوعی علاقه دارید وبلاگ روبو را دنبال کنید.

هوش مصنوعی استیبل دیفیوژن چیست ؟

Stable Diffusion چیست ؟

هوش مصنوعی استیبل دیفیوژن (Stable Diffusion) یکی از ابزار های محبوب و معروف برای تبدیل متن به عکس است که بیشتر به خلق تصاویر واقع گرایانه شهرت دارد. این ابزار توسط شرکت Stability AI توسعه و طراحی شده است.

این فناوری با استفاده از شبکه های عصبی عمیق و الگوریتم های پیچیده توانسته مزایای شگفت انگیزی را در اختیار کاربران قرار دهد.

این هوش مصنوعی نسخه های متفاوتی دارد، نسخه های جدید تر این ابزار مانند Stable Diffusion XL v 0.9 عکس های بهتر و با کیفیت تری تولید می کند.

استفاده از این هوش مصنوعی بسیار ساده و قابل دسترس برای کاربران است. کاربران با دادن چند کلمه یا جمله می توانند عکس های باورنکردنی را دریافت کنند. البته هرچه توصیف دقیق تر، کامل تر و با جزئیات تر باشد استیبل دیفیوژن نتایج خروجی بهتر و با کیفیت تری را تحویل می دهد.

عملکرد این ابزار هوش مصنوعی به گونه ای طراحی شده تا بتواند بخش عمده ای از کار ها را به جای کاربر انجام دهد و در هنگام حرف‌ زدن کاربران می توانند با زبان طبیعی تر و عامیانه تر با آن صحبت و ارتباط برقرار کنند.

این هوش مصنوعی نسبت به رقبایی مانند Dall-E به نحوه متفاوتی وارد این عرصه شده است چرا که کد منبع آن به شکل عمومی در اختیار همگان قرار دارد و به همین سبب به گزینه ای مطلوب برای علاقه مندان به دنیای نرم‌افزا های آزاد و متن باز (Open Source) تبدیل شده است.

وب سایت Dream Studio

چگونه از Stable Diffusion استفاده کنیم ؟

کاربران برای استفاده از استیبل دیفیوژن لازم است از سرویس تحت وب مثل Dream Studio استفاده کنند. این سرویس به کاربران امکان تبدیل متن به عکس با استفاده از این هوش مصنوعی را می دهد.

در ادامه نحوه استفاده از این سرویس را توضیح می دهیم : 

  1. در مرحله اول باید وارد وبسایت beta.draemstudio.ai شوید و در آن ثبت نام کنید. برای ثبت نام می توانید از حساب کاربری Google یا Discord خود استفاده کنید. پس از این که ثبت نام را تکمیل کردید به صفحه اصلی سایت Dream Studio متنقل می شوید.
  2. در بالای صفحه یکی از استایل های مورد نظر خود را انتخاب کنید.
  3. سپس در کادر prompt متن توضیفی در رابطه با عکسی که می خواهید را بنویسید. (هرچه متن دقیق تر و طولانی تر باشد نتیجه عکس نهایی به آن چه مورد نظر شماست نزدیک تر است.)
  4. در بالا و سمت راست کادر Prompt یک جفت تاس به شما نمایش داده شده. اگر ایده ای ندارید با کلیک کردن بر روی تاس ها خود این هوش مصنوعی به صورت رندوم یک متن به شما پیشنهاد می دهد.
  5. در پایین تر کادری به نام Negative Prompt وجود دارد. در این کادر می توانید چیز هایی که نمی خواهیم در عکستان وجود داشته باشد را بنویسید تا آن عناصر را در تصویر به کار  نبرد.
  6. در ادامه یک کادر دیگر وجود دارد که می توانید برای ایجاد تغییرات، یک تصویر آپلود کنید.
  7. در کادر Setting (تنظیمات) اول از همه می توانید ابعاد مورد نظر عکس خود را انتخاب کنید. (پیش فرض عکس ها ابعاد 1:1 می باشد.)
  8. گزینه بعدی که در کادر Setting وجود دارد انتخاب تعداد عکس هایی است که این هوش مصنوعی خلق می کند؛ که این هوش مصنوعی می تواند حداقل 1 تا حداکثر 10 عکس تولید کند. (برای مثال شما ممکن است بخواهید 5 عکس متفاوت از یک متن ورودی دریافت کنید.)
  9. همچنین علاوه بر قابلیت هایی که گفته شد گزینه ای به نام Advance (تنظیمات پیشرفته) وجود دارد که اگر بخواهید می توانید آن ها را تنظیم کنید. این تنظیمات عبارتند از پهنای عکس، طول عکس، قدرت سریع، مراحل ساخت عکس و …
  10. در ادامه این تنظیمات گزینه ای به نام Model وجود دارد که باید یک مدل را انتخاب کنید. البته توجه کنید که برای نمایش مدل های موجود ابتدا باید در سایت Log in کنید و سپس می توانید یک مدل را انتخاب کنید.
  11. برای Log in کردن در این سایت، بالا و سمت راست صفحه سایت یک گزینه بنفش رنگ با عنوان Log in قرار دارد که با کلیک کردن بر روی آن می توانید وارد شوید.
  12. پس از اتمام و تکمیل اطلاعات و جزئیات درباره عکسی که می خواهید توسط این ابزار بسازید روی گزینه Dream کلیک کنید و کمی صبر کنید تا عکستان ساخته شود. (بسته به عکسی که می خواهید و جزئیات آن در سمت راست گزینه Dream تایم مورد نیاز برای ساخت عکس نوشته شده.)

  13. پس از اینکه عکستان آماده شد در صورت رضایت از آن می توانید آن را دانلود و ذخیره کنید.  

سیستم مورد نیاز برای استفاده از Stable Diffusion

برای اجرای استیبل دیفیوژن بر روی کامپیوتر شخصی خود به سخت افزار و نرم افزار مناسبی نیاز دارید، چرا که برای ساخت عکس نیاز به کارت گرافیک قابل قبولی دارید. در ادامه پیش نیاز ها را برای استفاده از استیبل دیفیوژن را ذکر کرده ایم :

  • یک کارت گرافیک با حداقل 6 گیگابایت حافظه VRAM
  • 10 گیگابایت فضای ذخیره سازی روی هارد دیسک یا درایو حالت جامد
  • نصب کننده Miniconda3
  • فایل های Stable Diffusion از GitHub
  • آخرین چک پوینت ها از co
  • نصب کننده Git
  • سیستم عامل Windows 8، 10 یا 11

برای نصب و اجرای استیبل دیفیوژن در ابتدا باید Git و Miniconda3  را نصب کنید. سپس باید فایل های استیبل دیفیوژن را از GitHub دانلود و محیط پایتون مخصوص آن را ایجاد کنید. 
سپس باید چک پوینت های مورد نظر خود را از HuggingFace.co دانلود کرده و در پوشه مربوطه قرار دهید. در نهایت، شما می‌توانید با استفاده از خط فرمان، تصاویر را با استفاده از این ابزار تولید کنید.

مدل های Stable Diffusion

در حال حارض نسخه های متفاوتی از استیبل دیفیوژن وجود دارد که در ادامه به بررسی آن ها می پردازیم :

  1. Stable Diffusion XL (SDXL) :
    این نسخه در حال حاضر محبوب ترین نسخه استیبل دیفیوژن است. این نسخه در ژوئیه 2023 منتشر شد و تصاویری خارق العاده و واقعی با وضوح 1024×1024 ایجاد می کند، اگرچه می توانید به انتخاب خودتان از هر نسبت تصویری استفاده کنید.
  2. Stable Diffusion 1.5 (SD1.5) :
    این ورژن، نسخه قدیمی تری است که در آگوست 2022 منبع باز بود و بهترین تصاویر آن 512×512 است. علیرغم قدمت آن، به دلیل سرعت، اشغال فضای کم از حافظه و تعداد زیادی از مدل های تنظیم شده اجتماعی که از SD1.5 به عنوان پایه استفاده می کنند، همچنان محبوب است.
  3. Stable Diffusion 2.1 (SD2.1) :
    این نسخه در اکتبر 2022 منتشر شد. به گفته برخی این ورژن خوب اما متفاوت است.
    این نسخه پیشرفت هایی مانند OpenCLIP، Negative Prompt برای رمزگذار متن، خروجی های تصویر بزرگ تر را ارائه کرد، اما انتقال به OpenClip باعث تغییرات قابل توجهی در خروجی و ترکیب تصویر در مقایسه با نسخه‌های قبلی Stable Diffusion شد.
    برای بسیاری، یک “تغییر شکسته” به نظر می رسید.
  4. SDXL Turbo :
    SDXL Turbo نسخه ای از SDXL است که در نوامبر 2023 عرضه شد، این مدل غیر تجاری است که بسیار سریع است و می تواند در یک مرحله تصاویر قابل قبول و خوبی بسازد.
  5. SD Turbo :
    این ورژن نیز نسخه سریع و غیر تجاری دیگری است که در نوامبر 2023 منتشر شد.
دو عکس ساخته شده با دو مدل متفاوت از استیبل دیفیوژن

آیا استفاده از Stable Diffusion رایگان است ؟

هم اکنون استفاده از وبسایت Dream Studio برای تولید تصاویر با استفاده از هوش مصنوعی Stable Diffusion به صورت رایگان امکان پذیر است، اما محدودیت هایی هم دارد.

هنگامی که کاربران در این سرویس ثبت نام می کنند، 200 اعتبار رایگان به عنوان هدیه دریافت می کنند که با آن می توانند تعداد محدودی عکس بسازند؛ اگر کابران به تعداد عکس های بیشتری نیاز داشتند یا برای استفاده از خدمات بیشتر و کیفیت های بهتر می توانند طرح های این سرویس را بصورت ماهیانه خریداری کنند.

در تصویر زیر مبلغ پلان های پرمیوم این سرویس را مشاهده می کنید.

پلان های پرمیوم استیبل دیفیوژن

هوش مصنوعی های جایگزین Stable Diffusion

با گسترش هوش مصنوعی در عرصه ساخت عکس ابزار های دیگری هم ساخته شده اند که می توانند متن را به عکس تبدیل کنند. در ادامه به معرفی برخی از آنها می پردازیم :

  1. Midjourney : 
    به جرعت می توان گفت که ابزار میدجرنی یکی از سرسخت ترین رقبای هوش مصنوعی های ساخت عکس است، چرا که حرفی در کیفیت عکس هایی که خلق می کند نیست! 
    این ابزار بصورت پروژه ای مستقل کار می کند و در بستر اپلیکیشن Discord فعالیت دارد، البته برای استفاده از این ابزار هوش مصنوعی باید مبلغی را پرداخت کنیدچرا که استفاده از آن رایگان نیست.
    بیشتر بخوانید :  ساخت عکس با هوش مصنوعی Midhourney
  2. Dall-E : 
    ابزار Dall-E توسط شرکت OpenAI طراحی و توسعه یافته است و تا کنون سه نسخه متفاوت از این هوش مصنوعی در دسترس است. این ابزار نیز با قابلیت های ساخت عکس های واقع گرایانه یکی از رقبای استیبل دیفیوژن حساب می شود.
    بیشتر بخوانید :  هنر و طراحی با هوش مصنوعی Dall-E
  3. Leonardo AI : 
    لئوناردو ابزاری در انقلاب و تحول هوش مصنوعی های ساخت عکس به وجود آورده است. علاوه بر ساخت عکس و سرگرمی، طراحان گرافیک و بازی از این ابزار برای طراحی کاراکتر ها، آیکون ها و Asset های بازی استفاده می کنند که باعث شده محبوبیت زیادی پیدا کند.
    بیشتر بخوانید : تحول و انقلابی در ساخت عکس با لئوناردو 

ابزار های فراوانی در این زمینه برای تبدیل متن به عکس ساخته شده اند که دراینجا فقط به معرفی برخی از آن ها پرداخیتم. البته باید به این نکته توجه کنید که استفاده از این جایگزین ها بسته به نیاز ها و کاربرد های مختلف کاربر دارد و با توجه به آنچه کاربر نیاز دارد باید کارآیی ابزار ها را بسنجد.  

سه عکس ساخته شده از شکوفه گیلاس توسط سه هوش مصنوعی ساخت عکس

سخن پایانی

با گسترش فناوری و تکنولوژی هوش مصنوعی به خصوص در زمینه ساخت و تولید عکس، ابزار استیبل دیفیوژن با مزیت Open Source بودن آن، تبدیل به یکی از ابزار های محبوبی شده است که کاربران می توانند بصورت رایگان و به سادگی از آن استفاده کنند.  

شما می توانید از تمامی قابلیت های هوش مصنوعی های ساخت عکس از جمله Stable Diffusion ، Dall-E ، Midjourney و … به راحت ترین شیوه ممکن در هوش مصنوعی روبو استفاده کنید!

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *