Midjourney ، شگفت انگیز ترین هوش مصنوعی برای ساخت عکس

به وبلاگ روبو خوش آمدید، در این مقاله میخواهیم درباره هوش مصنوعی Midjourney صحبت کنیم پس در ادامه مطلب همراهمان باشید.

اگر به اخبار صفر تا صد هوش مصنوعی علاقه دارید وبلاگ روبو را دنبال کنید.

میدجرنی

Midjourney چیست ؟

میدجرنی (Midjourney) یک ابزار هوش مصنوعی ساخت عکس و تصویر است که در دسترس عموم قرار دارد.

ساخت آثار هنری با استفاده از هوش های مصنوعی و تبدیل متن به عکس با ابزار های خودکار، یکی از داغ ترین جنبه های فناوری هوش مصنوعی تا به کنون بوده است.

یکی از رقبای میدجرنی، هوش مصنوعی Dall-E است که توسط شرکت OpenAI ساخته شده. Dall-E نیز یکی از بهترین نمونه های چنین ابزار هایی است که خروجی آن از دقت بالایی بهره می برد.

میدجرنی برخلاف رقبایش مانند Dall-E که توسط OpenAI پشتیبانی می شود، یک پروژه مستقل است و در وبسایت این پروژه نوشته شده که سرمایه ی توسعه ی آن تماما توسط توسعه دهنده هایش تامین شده و بودجه ای از منابع خارجی دریافت نکرده است.

این برنامه، توسط یک آزمایشگاه تحقیقاتی هوش مصنوعی در سانفرانسیسکو هدایت می‌شود.

ابزار Craiyon که در قبلا با نام DALL-E Mini شناخته می شد، رایگان است و استفاده از آن نسبت به دیگر هوش مصنوعی ها آسان تر است زیرا با مراجعه به سایت آن می توان حتی بدون ساخت حساب کاربری، اقدام به تبدیل متن به عکس کرد.

اما از طرفی عکس های ساخته شده توسط این هوش مصنوعی دقت چندان بالایی ندارد و همین مسئله موجب شده است تا کاربران بیشتری به‌ میدجرنی علاقه پیدا کنند.

نکته ای که درباره این ابزار وجود دارد این است که استفاده از آن رایگان نیست و طرح های اشتراکی دارد که کاربران برای استفاده از آن باید مبلغی را به صورت ماهانه پرداخت کنند.

تصاویر ساخته شده توسط هوش مصنوعی میدجرنی

عکس ساخته شده توسط Midjourney مقام اول را کسب کرد!

جالب است بدانید که تصویر ساخته شده با هوش مصنوعی میدجرنی توانست در یک جشنواره هنری مقام اول را به خود اختصاص دهد.

یک هنرمند به نام جیسون آلن (مدیر عامل شرکت سازنده بازی های رومیزی Incarnate Games)، یک عکس با عنوان Théåtre D’opéra Spatial که توسط میدجرنی ساخته شده بود، به بخش هنر های دیجیتال مسابقه هنر های زیبای ایالت کلرادو ارسال کرد و برنده مقام اول جشنواره هنری آمریکا شد.

برخلاف انتقاد هایی که نسبت به اقدام آلن شد، او از کار خود حمایت کرد. آلن در پست Discord خود ادعا کرده که 100% تصویر را خودش ایجاد کرده و هفته های زیادی را صرف ساخت آن کرده است تا به تصویر نهایی دست پیدا کند.

عکسی که آلن با این هوش مصنوعی ساخته است را در زیر برایتان قرار داده ایم. عکس علمی تخیلی او، شخصی در لباس سفید را نشان می‌دهد که در مقابل یک محفظه دایره ای بسیار بزرگ شبیه به پنجره ایستاده است.

عکس ساخته شده توسط میدجرنی که برنده چشنواره هنری آمریکا شد.

Midjourny چگونه کار می کند ؟

این ابزار نیز مانند بقیه فناوری های هوش مصنوعی براساس الگوریتم های یادگیری ماشین (Mechine Learning) کار می کند. هدف این الگوریتم ها، آموزش ماشین ها به نحوی است که در شرایط متفاوت در برخورد با موقعیت های گوناگون و سوالات بتوانند پاسخ هایی انسان گونه داشته باشند.

میدجرنی علاوه بر الگوریتم های یادگیری ماشین همچین از مدل های انتشار (Diffusion Models) استفاده می کند. هدف این مدل ها کشف و یادگیری ساختار های پنهان در مجموعه ای از داده هاست. درحقیقت، یک مدل انتشار نوعی یادگیری ماشینی است که فرآیند یادگیری اش را از طریق مدل سازی پیش می‌برد.
کاربرد این مدل ها تولید تصاویر با کیفیت بدون محوشدگی، نویز و سوختگی می باشد. 

میدجرنی همانند ChatGPT از مدل زبانی بزرگ (Large Language Model) یا به اختصار (LLM) استفاده می کند، که به آن کمک می کند تا آنچه کاربر نوشته است را درک کند. سپس متون را به یک نسخه ی عددی از متن نوشته شده تبدیل کرده و پس از فرآیند پیچیده‌ Diffusion، آن را به تصویر می کشد.

همه چیز درباره هوش مصنوعی میدجرنی را در وبلاگ روبو بخوانید.

چگونه از Midjourney استفاده کنیم ؟

میدجرنی بر بستر پلتفرم Discord فعالیت دارد و نرم افزار یا وب سایت جداگانه ای برای بهره مندی از قابلیت های آن در نظر گرفته نشده است. به گفته ی سازندگان میدجرنی دلیل این امر اجتماعی محور بودن آن است.

به این صورت کاربران می توانند تصاویر ساخته شده توسط دیگر افراد را مشاهده کنند و از توضیحات آن ها برای ساخت خروجی های دیگر الهام بگیرند.

برای استفاده از آن ابتدا وارد سایت midjourney.com شوید و یک اکانت Discord بسازید. 

صفحه لاگین میدجرنی برای ورود به دیسکورد

پس از آن با Accept‌ کردن قسمت Join to Midjourney در حساب Discord، وارد سرور میدجرنی می شوید.
در مرحله بعد در حساب خود در Discord کانال هایی با نام Newbies را انتخاب کنید. این کانال‌ها، مخصوص دریافت دستور از کاربران تازه هستند.

 دستور متنی خود را در کانال Newbies خود پس از نوشتن عبارت”imagine” تایپ کرده و منتظر اتمام فرآیند بمانید.

 این هوش مصنوعی 4 نسخه‌ از عکس های ساخته شده را به شما نشان می دهد که می توانید از بین آنها یکی را انتخاب کنید.

همچین می توانید با استفاده از دکمه ها و گزینه های موجود، تصویر انتخابی خود را ادیت کنید.

و در آخر برای ذخیره ی تصویر ابتدا باید آن را با استفاده از یک مرورگر وب مانند Google Chrome  باز کرده و سپس آن را دخیره کنید.

ساخت تصاویر توسط میدجرنی در دیسکورد

دستورات کاربری Midjourney

هنگام استفاده از میدجرنی دستور ها و پارامتر هایی وجود دارد که با استفاده از آن ها می توانید نتیجه نهایی تصویر خود را بهبود دهید. در ادامه این پارامتر ها را به شما معرفی خواهیم کرد :

  • imagine/ : مهم ترین دستور در Midjourney است که پس از آن توضیحات مربوطه برای ساخت تصویر نوشته می شود.
  • help/ : برای نمایش اطلاعات و نکات کاربردی درباره بات Midjourney کاربرد دارد.
  • info/ : برای نمایش پروفایل، طرح کاربری، اعتبار باقی‌مانده و… استفاده می شود.
  • subscribe/ : یک لینک اختصاصی برای حساب کاربری دیسکورد فعلی شما ایجاد می کند و نیاز به ورود جداگانه از طریق وبسایت را از بین می برد.
  • relax/ : اگر حساب کاربری پولی داشته باشید، با فعال‌کردن این حالت می توانید بدون کم‌شدن از اعتبار، خروجی دریافت کنید؛ اما زمان موردنیاز برای ساختن تصاویر طولانی تر خواهد شد.
  • private/ : در این حالت شما فقط می توانید خروجی تصاویر خود را مشاهده کنید؛ اما بهره‌مندی از آن ماهانه ۲۰ دلار هزینه در پی خواهد داشت.

همانطور که گفتیم، توضیحات مورد نظر پس از دستور imagine/ وارد می شوند. بنابراین با تعیین کردن پارامتر هایی، می توان نتیجه دقیق تری را دریافت نمود. در ادامه درباره برخی از این پارامتر ها توضیح داده ایم :

  • beta–  : پارامتری برای استفاده از یک الگوریتم آزمایشی جدید است. این الگوریتم به زمان بیشتری برای ارائه خروجی نیاز خواهد داشت و تنها ۲ تصویر ایجاد خواهد کرد. همچنین برخی دیگر از پارامترها به‌صورت هم‌زمان با آن قابل‌استفاده نخواهند بود.
  • hd– : برای استفاده از یک الگوریتم متفاوت و قدیمی‌تر کاربرد است که گزینه بهتری برای تصاویر بزرگ با موضوعات انتزاعی یا منظره به‌ شمار می‌رود. این الگوریتم به‌صورت خودکار تصاویری با رزولوشن بالاتر بدون نیاز به Upscale ایجاد می‌کند.
  • aspect– یا ar– : برای ایجاد خروجی با نسبت تصویر مشخص به‌کار می‌رود. برای مثال –ar 16:9 اقدام به ارائه تصویری با نسبت ۱۶ به ۹ می‌کند.
  • w– و h– : برای تعیین رزولوشن دقیق خروجی مورد استفاده قرار می‌گیرد. برای مثال –w 256 موجب می‌شود تا عرض تصویر برابر با ۲۵۶ پیکسل باشد. مقادیر وارد‌شده هم باید در بازه ۲۵۶ الی ۲۰۳۴ پیکسل قرار بگیرند.
  • stylize– یا s- : برای تعیین مقدار هنری بودن خروجی کاربرد دارد. پس از آن باید مقدار عددی مورد‌نظر که بین بازه ۶۲۵ الی ۶۰۰۰۰ است، ذکر شود. کمترین مقدار ممکن s– 625 است و هرچه مقدار وارد‌شده کمتر باشد، خروجی نزدیک‌تری به توضیحات کاربر ارائه می‌کند.
  • quality– یا q– : برای تنظیم سرعت ساخت تصاویر استفاده می‌شود و مقدار آن بین 0.25 تا 5 است. بیشترین سرعت با –q 0.25 و کمترین سرعت با –q 5 تنظیم می‌شود. 
تصویر از یک شوالیه Starwar که توسط میدجرنی ساخته شده

هزینه استفاده از Midjourney چقدر است ؟

همانطور که در قبل تر اشاره کردیم، استفاده از Midjourney برخلاف چت بات های ChatGPT 3.5 و Bing رایگان نیست؛ بلکه کاربران برای استفاده از آن باید یکی از طرح ها یا پلان های آن را خریداری کنند.

دلیل اصلی این موضوع، منابع نرم افزاری و سخت افزاری بسیاری است که سرور های این ابزار از آن ها استفاده می کنند.

آن ها به کارت های گرافیک (GPU)، منابع ذخیره سازی و CPU ‌های قدرتمندی برای ارائه ی خدمات خود نیاز دارند که مستلزم صرف هزینه است. بدون طرح های پولی، امکان دریافت تصاویر را نخواهید داشت. 

اما با این وجود، بسیاری از رقبای میدجرنی، حداقل یک نسخه ی رایگان با محدودیت در حجم استفاده یا امکانات را برای تست به کاربران خود ارائه می دهند.

طرح های پولی آن را در تصویر زیر می توانید مشاهده کنید. 

هزینه طرح های اشتراکی هوش مصنوعی میدجرنی

طرح های گران تر این ابزار امکان کاهش سرعت تولید تصویر را به کاربر می دهند که سبب افزایش کیفیت می شود. برخی از آن ها محدودیت تعداد تصویر یا ساعت استفاده نیز ندارند. با صرف ۱۰ دقیقه وقت می توانید مطمئن باشید که بهترین کیفیت ممکن را با توجه به پتانسیل های میدجرنی دریافت کرده اید.

مزایای استفاده از Midjourney چیست ؟

میدجرنی مزایای زیادی نسبت به رقبای خود دارد که در ادامه به بررسی آن ها می پردازیم :

  • کیفیت بسیار بالا
    یکی از مهم ترین ویژگی های هوش مصنوعی میدجرنی، کیفیت فوقولاده تصاویرش است.
    این تصاویر تا حدامکان، واقعی و ساختارمند بوده و ازنظر رابطه ی بین عناصر منطقی به نظر می رسند.
    رزولوشن آنها نیز حداکثر ۱۰۲۴ در ۱۷۹۲ پیکسل است. البته برای دریافت تصاویر با این کیفیت، باید طرح های گران تر آن را خریداری کنید.
  • رابط کاربری ساده
    استفاده از میدجرنی بسیار ساده بوده و تنها به دستورات متنی نیاز دارد. در حقیقت از دید کاربر، تفاوت چندانی بین این برنامه و محصولات دیگر هوش مصنوعی وجود ندارد.
  • امکانات ویرایشی
    کابران در حین استفاده از میدجرنی می توانند تصویر ساخته شده را به دفعات متعدد ویرایش کنند.
    پس از ساخته شدن تصویر، کاربران می توانند عکس را به شیوه های مختلفی مانند چرخش، کراپ، تغییرات رنگی و غیره ویرایش کنند.
    همین قابلیت، نیاز به نرم افزار های دیگر مانند فتوشاپ و غیره را تا حد زیادی کاهش می دهد.
  • جامعه بزرگ و فعال
    میدجرنی از طریق شبکه ی اجتماعی میزبان خود یعنی Disord یک جامعه ی فعال دارد که در آن کاربران می توانند نظرات خود را با یکدیگر به اشتراک بگذارند.
    این جامعه باعث شده تا برای کاربران تازه کاری که با نحوه کار، ظرفیت ها و محدودیت های میدجرنی آشنایی ندارند مفید باشد؛ چراکه می‌توانند سوالات خود را در آنجا مطرح کنند. 
4 نسخه از یک تصویر گربه، ساخته شده توسط میدجرنی

نقطه ضعف اصلی Midjourney چیست ؟

مهم ترین نقطه ضعف میدجرنی، مسئله کپی رایت آن است. تصاویری که کاربران در میدجرنی می سازند میتواند توسط دیگران استفاده شوند. البته باید تغییراتی در عکس ایجاد کنند و به نحوی آن را ادیت کنند. 

اگر کاربران قصد استفاده تجاری از تصویری که ساخته اند را دارند ( مانند فروش آن ها به صورت آثار NFT ) این مسئله می تواند مشکل ساز و چالش بر انگیز باشد.

مقایسه هوش مصنوعی های ساخت عکس

رقبای Midjourney

با گسترش فناوری و تکنولوژی روز به روز به تعداد هوش مصنوعی های ساخت عکس نظیر میدجرنی اضافه می شود.

اما در حال حاضر برخی از قوی ترین رقبای شامل Dall-E و Stability AI می باشند. به رای اکثریت، کاربران تجربه بهتر و با کیفیت تری هنگام استفاده از میدجرنی داشته اند و تصاویر ساخته شده توسط آن کیفیت بالاتر داشته و به واقعیت نزدیک تر بوده.

در ادامه مقایسه 2 تصویر ساخته شده توسط این سه هوش مصنوعی را مشاهده می کنید.
قضاوت با خودتان …

سه عکس ساخته شده از شکوفه گیلاس توسط سه هوش مصنوعی ساخت عکس
عنوان تصویر : شکوفه گیلاس نزدیک یک دریاچه برفی
سه عکس ساخته شده از فضانورد تنها روی سطح مریخ توسط سه هوش مصنوعی میدجرنی ، دال ای و استیبل دیفیوژن
عنوان تصویر : فضانورد تنها روی مریخ، رازآلود، رنگی، واقع بینانه

سخن نهایی

به گفته مدیران این پروژه و مطابق برنامه های اعلام شده، چندین فاز توسعه ای دیگر نیز تا سال های آینده پیش روی میدجرنی است. همچنین گفته می‌شود قرار است این تکنولوژی با شبکه های اجتماعی دیگری، مانند X و Reddit نیز ادغام شود.
بسیاری از کارشناسان عرصه ی هن های دیجیتال نیز نقش میدجرنی و تکنولوژی های مشابه آن را در آینده بسیار چشم گیر می دانند، در حالی که هنور بسیاری از افراد بر اصالت هنر دست و ذهن انسان تاکید دارند.
اگر تجربه استفاده از میدجرنی را دارید، تجربه خود را با ما به اشتراگ بگذارید.

اگر شما هم دوست دارید از قابلیت های میدجرنی و بقیه هوش مصنوعی های ساخت عکس استفاده کنید، هوش مصنوعی فارسی روبو مخصوص شماست!

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *