هوش مصنوعی Imagen 3 با امکان تغییر شکل و اندازه تصاویر

به وبلاگ روبو خوش آمدید، در این مقاله می خواهیم درباره قابلیت تغییر شکل و اندازه تصاویر با هوش مصنوعی Imagen 3 صحبت کنیم، پس در ادامه مطلب همراهمان باشید. 

اگر به اخبار صفر تا صد هوش مصنوعی علاقه دارید وبلاگ روبو را دنبال کنید.  

Gemini

هوش مصنوعی Imagen 3

نسخه بتای اپلیکیشن گوگل نشان می دهد کاربران در آینده راحت تر تصاویر خود را با مدل Imagen 3 در جمینای ویرایش خواهند کرد.

گوگل همچنان روی توسعه قابلیت های چت‌بات خود کار می کند و به‌ نظر می رسد با «Imagen 3» دست کاربران برای ویرایش تصاویر تولید شده جمینای بازتر خواهد شد.

درحال حاضر، جمینای در Imagen 3 تصاویری با ابعاد مربعی (1:1) می سازد؛ درست مثل سایر ابزار های تولید تصویر مبتنی‌بر AI با وجود کیفیت مناسب تصاویر، پیشتر گزینه ای جز ابعاد مربعی وجود نداشت و کاربران نمی توانستند تصاویری با ابعاد مختلف بسازند.

به‌ گزارش وب سایت «Android Authority»، نسخه بتا 15.41.34.29.arm64 گوگل نشان می دهد این ویژگی به زودی به جمینای اضافه می شود و گزینه های دیگر مانند نسبت تصویر 16:9 در تنظیمات تولید عکس ها در دسترس قرار خواهند گرفت.

همه کاربران Google Gemini می توانند با استفاده از آخرین حالت تصویر هوش مصنوعی Google، Imagen 3، تصاویر بسازند. این شامل کسانی است که از آن در وب، در برنامه یا ادغام شده با Android استفاده می کنند. قبلا فقط برای مشترکین Gemini Advanced با استفاده از نسخه وب هوش مصنوعی در دسترس بود. 

جمینای به‌زودی امکان تغییر شکل و اندازه تصاویر با هوش مصنوعی را فراهم می‌کند

Imagen 3 توسط گوگل در جریان رویداد I/O در اوایل سال جاری رونمایی شد. ساخته شده توسط آزمایشگاه تحقیقاتی این شرکت، DeepMind، می تواند تصاویری با فرمت مربعی با سطح واقع گرایی مشابه تصاویر Midjourney یا Flux ایجاد کند.

برخی از محدودیت ها، به خصوص برای کاربران رایگان Gemini وجود دارد. در حال حاضر، نمی توانید از آن برای تولید تصاویر افراد استفاده کنید، مگر اینکه 19 دلار در ماه برای Gemini Advanced بپردازید، و حتی در آن صورت، تصاویری از افراد واقعی نمی سازد.

قدرت واقعی Gemini از نظر تولید تصویر ناشی از توانایی آن در تطبیق آسان یا حتی تغییر کامل تصویر از یک توضیح متنی ساده است. برای دریافت توانایی های ایجاد تصویر، ممکن است لازم باشد برنامه را به روز کنید.

Imagen 3 یک ارتقای بصری در Imagen 2 قبلی است. تصاویر غنی تر و دقیق تر هستند و مدل بهتر است دستورالعمل هایی را که Gemini به آن داده است دنبال کند.

گوگل قابلیت های تولید تصویر را از Gemini برای مدتی به دلیل نگرانی بیش از حد محتاطانه هنگام ارائه تصاویر افراد حذف کرد. مدل قبلی همچنین تمایل داشت که همه چیز را پلاستیکی جلوه دهد.

مدل جدید قابلیت های تولید تصویر گوگل را با DALL-E 3 از OpenAI مطابقت می دهد، اگرچه هنوز فقط تصاویر مربعی تولید می کند، در حالی که ChatGPT می تواند از DALL-E 3 برای ساخت تصاویر با هر جهت و اندازه استفاده کند.

در آزمایش هایم، متوجه شدم که هنوز بیشتر از آنچه که بخواهم تصویری بسازم، امتناع می کند، به خصوص اگر چیز پیچیده تری باشد، مانند نشان دادن فردی که در کافه ای روی قمر نشسته است. اما برای تصاویر روزمره عالی است.

برای تغییر این متن بر روی دکمه ویرایش کلیک کنید. لورم ایپسوم متن ساختگی با تولید سادگی نامفهوم از صنعت چاپ و با استفاده از طراحان گرافیک است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *