گوگل جمینی Google Gemini، هوش مصنوعی گوگل در 2024

به وبلاگ روبو خوش آمدید، در این مقاله میخواهیم Gemini ، جدید ترین هوش مصنوعی کمپانی Google را که در سال 2023 رونمایی شد  به شما معرفی کنیم و راجب کاربرد های آن صحبت کنیم؛ پس در ادامه مطلب همراهمان باشید. 

گوگل جمینی

Google Gemini چیست؟

بالاخره کمپانی بزرگ گوگل (Google) از بزرگ‌ترین حرکت خود در راستای تکنولوژی رونمایی کرد و مدعی است با معرفی گوگل جمینی (Google Gemini) آخرین مدل زبانی بزرگ (LLM) دنیا را دگرگون خواهد کرد.

این پروژه پیشگامانه هوش مصنوعی قرار است رقیب سرسخت ChatGPT باشد. پروژه بلندپروازانه هوش مصنوعی گوگل جمینی، از تکنیک‌های حل مسئله AlphaGo الهام گرفته و هدف خود را تعریف مجدد قابلیت‌های هوش مصنوعی مولد و پیشی گرفتن از مدل‌هایی مانند ChatGPT گذاشته است. 

گوگل جمینی اولین بار در کنفرانس توسعه دهندگان Google I/O در ماه مه 2023 معرفی شد و نشان دهنده گامی مهم در نقشه راه هوش مصنوعی گوگل به شمار می‌آید. این فناوری توسط Google DeepMind توسعه یافته است. گوگل جمینی قابلیت‌های پردازش زبان طبیعی را ادغام می‌کند و توانایی درک و پردازش زبان را فراهم می‌کند که برای درک پرس‌و‌جوهای ورودی و همچنین داده‌ها استفاده می‌شود.

گوگل جمینی یک خانواده از مدل‌های زبان بزرگ هوش مصنوعی چندوجهی (AI) است که دارای قابلیت‌هایی در درک زبان، صدا، کد و ویدیو است. علاوه بر این، گوگل جمینی قادر به تکمیل مسائل پیچیده در ریاضی، فیزیک، زبان‌های برنامه نویسی مختلف و سایر زمینه‌های تخصصی است.

به گفته دمیس حسابیس، مدیرعامل و یکی از بنیانگذاران گوگل جمینی، Google Deep Mind،  “تواناترین” مدلی است که تا به حال ساخته شده است. در ادامه به معرفی مدل های گوگل جمینی که عبارتند از : Gemini Nano ،Gemini Pro و Gemini Ultra می پردازیم و راجب هر کدام به صورت جدا توضیح می دهیم.

گوگل جمینی

مدل های Google Gemini

گوگل، هوش مصنوعی جمینی را به عنوان یک مدل انعطاف‌پذیر معرفی کرده است که می‌تواند بر روی همه چیز از مراکز داده گوگل گرفته تا دستگاه‌های تلفن همراه اجرا شود. برای دستیابی به این میزان از مقیاس پذیری، گوگل جمینی در سه مدل Gemini Nano ،Gemini Pro و Gemini Ultra عرضه می‌شود.

Gemini Nano

نسخه Google Gemini Nano برای اجرا بر روی تلفن های همراه طراحی شده است و به زودی در برنامه AI Core گوگل از طریق اندروید 14 در Pixel 8 Pro به نمایش گذاشته می‌شود. این مدل برای انجام کارهایی که بر روی دستگاه نیاز به پردازش هوش مصنوعی کارآمد بدون اتصال به سرورهای خارجی دارند، مانند پیشنهاد پاسخ‌ها در برنامه‌های چت یا خلاصه کردن متن ساخته شده است.

Gemini Pro

Google Gemini Pro بر روی مراکز داده گوگل اجرا می‌شود و مواردی مانند Google Bard، ربات چت مشابه راه حل Copilot مایکروسافت را تقویت می‌کند. به زودی این فناوری در سایر ابزارهای گوگل مانند Duet AI ،Google Chrome و Google Ads نیز عرضه خواهد شد.
به گفته گوگل، Gemini Pro در مواردی مانند طوفان فکری، نوشتن و خلاصه کردن محتوا موثرتر از موارد دیگر است. Gemini Pro عملکرد بهتری از OpenAI GPT-3.5 در معیارهای اصلی دارد.

Gemini Ultra

Gemini Ultra بهترین و تواناترین نسخه در این مجموعه شناخته می‌شود. Gemini Ultra می‌تواند اطلاعات ظریف متنی، کد و صداها را کاملاً درک کند و حتی به سوالات پیچیده پاسخ دهد.

کاربرد های Google Gemini

  • مدل‌های گوگل جمینی می‌توانند محتوا را از انواع مختلف داده‌ها خلاصه کنند.
  • می‌تواند بر اساس درخواست کاربران به تولید محتوا بپردازد. 
  • هر سه مدل گوگل جمینی دارای قابلیت‌های چندزبانه گسترده‌ای هستند که ترجمه و درک بیش از ۱۰۰ زبان را ممکن می‌سازد.
  • گوگل جمینی می‌تواند تصاویر پیچیده مانند نمودارها و شکل‌ها را بدون ابزارهای OCR خارجی تجزیه کند. در واقع از این فناوری می‌توان برای شرح تصاویر و قابلیت‌های بصری پرسش و پاسخ استفاده کرد.
  • گوگل جمینی از تشخیص گفتار در بیش از 100 زبان و کارهای ترجمه صوتی پشتیبانی می کند.
  • یک نقطه قوت کلیدی گوگل جمینی استدلال چندوجهی است که در آن انواع مختلف داده‌ها را می‌توان برای ایجاد یک خروجی ترکیب کرد.
  • جمینی می‌تواند کدهای زبان‌های برنامه نویسی محبوب از جمله C++، Python، Java و… را درک کند، توضیح دهد و تولید کند.
گوگل جمینی

Google Gemini چطور کار می کند؟

گوگل جمینی ابتدا با آموزش روی مجموعه عظیمی از داده‌ها کار می کند. پس از آموزش، مدل از چندین تکنیک شبکه عصبی برای درک محتوا، پاسخ به سؤالات، تولید متن و تولید خروجی کمک می‌گیرد.
به طور خاص، LLM جمینی از معماری شبکه عصبی مبتنی بر مدل ترانسفورماتور استفاده می‌کنند. معماری گوگل جمینی برای پردازش توالی‌های متنی طولانی در انواع داده‌های مختلف، از جمله متن، صدا و ویدئو، بهبود یافته است.
مدل‌های گوگل جمینی بر روی مجموعه‌ داده‌های چندوجهی و چندزبانه متن، تصاویر، صدا و ویدئو با Google DeepMind با استفاده از فیلترینگ داده‌های پیشرفته برای بهینه‌سازی آموزش دیده‌اند.

گوگل جمینی

Google Gemini یا ChatGPT ؟

با رونمایی گوگل جمینی از کمپانی بزرگ گوگل رقیبی سرسخت برای مدل های ChatGPT ، ساخته شرکت OpenAI پیدا شد. در جدول زیر می توانید مقایسه بین این دو هوض مصنوعی را می توانید مشاهده کنید : 

گوگل جمینی

Google Gemini ، زیر مجموعه برنامه های دیگر

Gemini توسط گوگل به عنوان یک مدل پایه توسعه داده شد و به طور گسترده در سرویس های مختلف گوگل یکپارچه شده است. گوگل جمینی همچنین برای توسعه دهندگان برای استفاده و ساخت برنامه‌های خود در دسترس است. اما ابزارهای زیر از گوگل جمینی برای گسترش فعالیت خود استفاده می‌کنند :

Bard

سرویس هوش مصنوعی مکالمه گوگل از نسخه دقیق Gemini Pro برای استدلال پیشرفته و قابلیت‌های چت بات کمک می‌گیرد.

Google Pixel

گوشی‌های هوشمند Pixel 8 Pro که توسط گوگل ساخته شده‌اند، اولین دستگاه‌هایی هستند که Gemini Nano را بر روی دستگاه اجرا می‌کنند.

Alpha Code 2

ابزار تولید کد AlphaCode 2 Google DeepMind از یک نسخه سفارشی شده Gemini Pro استفاده می‌کند.

Google AI Studio

توسعه دهندگان می‌توانند از طریق ابزار مبتنی بر وب Google AI Studio برنامه‌ها را با گوگل جمینی بسازند.

Pixel 8 Pro

Android 14 اولین گوشی هوشمند اندرویدی است که از تکنولوژی گوگل جمینی استفاده می‌کند. در آینده نه چندان دور، توسعه دهندگان اندروید قادر به ساخت دستگاه‌هایی با Gemini Nano از طریق قابلیت سیستم AICore خواهند بود.

Search

گوگل در حال آزمایش استفاده از جمینی در جستجوی Generative Experience برای بهبود کیفیت و افزایش سرعت است.

گوگل جمینی

Ultra Gemini در آینده

بزرگترین دستاورد در آینده جمینای مدل Gemini Ultra است که همزمان با Gemini Pro و Gemini Nano به صورت کامل در دسترس قرار نگرفت. در زمان راه اندازی جمینی، گوگل اعلام کرد که Gemini Ultra به صورت محدود در دسترس مشتریان، توسعه دهندگان، شرکا و کارشناسان منتخب قرار می گیرد تا آزمایشات اولیه و بازخورد را پیش از عرضه کامل برای توسعه دهندگان و شرکت‌ها در اوایل سال ۲۰۲۴ انجام دهد.
جمنای قصد دارد در آینده، راه خود را به مرورگر Google Chrome پیدا کند تا به بهبود تجربه وب برای کاربران کمک کند. همچنین، گوگل در تلاش است که جمینی را در پلتفرم Google Ads ادغام کند تا راه‌های جدیدی را در اختیار تبلیغ کنندگان و کاربران قرار دهد.

 

اگر شما هم دوست دارید برای آسان تر شدن کار های خود از هوش مصنوعی کمک بگیرید، هوش مصنوعی فارسی روبو اینجاست تا در پیچیده ترین کار ها به شما کمک کند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *