هوش مصنوعی GPT-o1 شرکت OpenAI با قابلیت استدلال منتشر شد

به وبلاگ روبو خوش آمدید، در این مقاله می خواهیم درباره مدل هوش مصنوعی جدید OpenAI به نام o1 صحبت کنیم که دارای قابلیت استدلال می باشد، پس در ادامه مطلب همراهمان باشید. 

اگر به اخبار صفر تا صد هوش مصنوعی علاقه دارید وبلاگ روبو را دنبال کنید. 

OpenAI

هوش مصنوعی o1

OpenAI مدل جدیدی به نام o1 را منتشر کرده، که اولین مدل از سری مدل های برنامه ریزی شده استدلال است که برای پاسخ دادن به سوالات پیچیده تر و سریع تر از یک انسان آموزش دیده اند.

این نسخه در کنار o1-mini، یک نسخه کوچکتر و ارزان تر، منتشر می شود. این نسخه در واقع مدل فوق العاده‌ی Strawberry است.

هوش مصنوعی o1 در مقایسه با عملکرد در نوشتن کد و حل مسائل چند مرحله ای بهتر از مدل های قبلی کار می کند؛ اما همچنین گران تر و کند تر از GPT-4o می باشد. OpenAI این نسخه را یک پیش نمایش می نامد تا بر نوپا بودن آن تاکید کند.

کاربران ChatGPT Plus و Team به o1-preview و o1-mini دسترسی خواهند داشت، در حالی که کاربران Enterprise و Edu در اوایل هفته آینده دسترسی خواهند داشت. OpenAI می گوید که قصد دارد دسترسی o1-mini را برای همه کاربران رایگان ChatGPT بیاورد، اما هنوز تاریخ انتشار را تعیین نکرده است.

دسترسی توسعه دهندگان به o1 واقعا گران است. در API، o1-preview به ازای هر 1 میلیون توکن ورودی، یا تکه های متن تجزیه شده توسط مدل، 15 دلار و به ازای هر 1 میلیون توکن خروجی 60 دلار است. برای مقایسه، GPT-4o 5 دلار به ازای هر 1 میلیون توکن ورودی و 15 دلار به ازای هر 1 میلیون توکن خروجی هزینه دارد.

جری تورک، سرپرست تحقیقات OpenAI، گفته که آموزش پشت o1 اساساا با نسخه های قبلی خود متفاوت است، اگرچه شرکت در مورد جزئیات دقیق مبهم است. او می گوید o1 با استفاده از یک الگوریتم بهینه سازی کاملاا جدید و مجموعه داده های آموزشی جدیدی که به‌طور خاص برای آن طراحی شده، آموزش داده شده است. 

OpenAI به مدل های قبلی GPT آموزش داد تا الگو های داده های آموزشی خود را تقلید کنند. با o1، مدل را آموزش داد تا با استفاده از تکنیکی به نام یادگیری تقویتی، که از طریق پاداش و جریمه به سیستم می آموزد، مسائل را به تنهایی حل کند.

سپس از یک زنجیره فکر برای پردازش پرس و جو ها استفاده می کند، مشابه اینکه انسان چگونه مشکلات را با مرور مرحله به مرحله پردازش می کند.

OpenAI می گوید که در نتیجه این روش آموزشی جدید این مدل باید دقیق تر باشد. تورک می گوید :« ما متوجه شده ایم که این مدل کمتر توهم می زند. اما مشکل همچنان پابرجاست. ما نمی توانیم بگوییم که توهمات را حل کردیم.»

به گفته OpenAI، اصلی ترین چیزی که این مدل جدید را از GPT-4o متمایز می کند، توانایی آن در مقابله با مسائل پیچیده، مانند کد نویسی و ریاضی، بسیار بهتر از مدل های قبلی خود و همچنین توضیح استدلال آن است.

باب مک گرو، مدیر ارشد تحقیقات OpenAI، گفته است که :« این مدل قطعا در حل آزمون ریاضی AP بهتر از من است و من در کالج خردسال ریاضی بودم.»

او می‌گوید OpenAI همچنین o1 را در مقابل یک آزمون واجد شرایط برای المپیاد بین‌المللی ریاضی آزمایش کرد، و در حالی که GPT-4o تنها 13 درصد از مسائل را به درستی حل کرد، o1 امتیاز 83 درصد را کسب کرد.

در مسابقات برنامه‌نویسی آنلاین که به عنوان مسابقات Codeforces شناخته می شوند، این مدل جدید به صدک ۸۹ شرکت کنندگان رسید و OpenAI ادعا می کند که به روزرسانی بعدی این مدل به طور مشابه دانشجویان دکترا در وظایف چالش برانگیز در فیزیک، شیمی و زیست شناسی عمل می کند.

o1-mini

در عین حال، o1 در بسیاری از مناطق به اندازه GPT-4o توانایی ندارد. در دانش واقعی درباره جهان به خوبی عمل نمی کند. همچنین توانایی مرور وب یا پردازش فایل ها و تصاویر را ندارد. با این حال، این شرکت معتقد است که یک کلاس کاملا جدید از قابلیت ها را نشان می دهد. برای نشان دادن بازنشانی شمارنده به 1 به نام o1 نامگذاری شد.

مک گرو می‌گوید :« اگر بخواهم روراست باشم، فکر می کنم ما به‌طور سنتی در نام گذاری وحشتناک هستیم. بنابراین امیدوارم این اولین گام از نام های جدید تر و معقول تر باشد که آنچه را که ما انجام می دهیم بهتر به بقیه جهان منتقل می کند. »

به گفته تورک، OpenAI به یکسان سازی تفکر مدل هوش مصنوعی با تفکر انسان اعتقادی ندارد. اما او می گوید این رابط نشان می دهد که چگونه مدل زمان بیشتری را صرف پردازش و غواصی عمیق تر برای حل مشکلات می کند. راه هایی وجود دارد که در آن بیشتر از مدل های قبلی احساس انسانیت می کند.

مک گرو می گوید :« من فکر می کنم می بینید که راه های زیادی وجود دارد که در آن احساس غریبگی می کند، اما راه هایی نیز وجود دارد که به طور شگفت انگیزی احساس می کند انسان است. »

به مدل زمان محدودی برای پردازش پرس و‌ جو ها داده می شود، بنابراین ممکن است چیزی شبیه این بگوید :« اوه، زمان تمام شده است، اجازه دهید سریع به یک پاسخ برسم.»

در اوایل، در طول زنجیره فکری خود، ممکن است به نظر برسد که در حال طوفان فکری است و چیزی شبیه به “من می توانم این کار را انجام دهم یا آن را انجام دهم، چه باید بکنم؟”

سازندگی به سمت نمایندگان

مدل های زبان بزرگ دقیقا به اندازه امروز هوشمند نیستند. آنها اساسا فقط دنباله ای از کلمات را پیش‌بینی می کنند تا بر اساس الگو هایی که از حجم وسیعی از داده ها به دست می آیند، به شما پاسخ دهند.

ChatGPT را در نظر بگیرید، که به اشتباه ادعا می کند که کلمه “Strawberry” فقط دو Rs دارد زیرا کلمه را به درستی تجزیه نمی کند. با توجه به ارزش آن، مدل جدید o1 این پرس و جو را به درستی دریافت کرد.

همانطور که گزارش شده است که OpenAI به دنبال افزایش بودجه با ارزش چشمگیر 150 میلیارد دلاری است، شتاب آن به پیشرفت های تحقیقاتی بیشتر بستگی دارد. این شرکت قابلیت های استدلالی را برای LLM به ارمغان می آورد زیرا آینده ای را با سیستم ها یا عوامل مستقلی می بیند که قادر به تصمیم گیری و انجام اقدامات از جانب شما هستند.

برای محققان هوش مصنوعی، شکست استدلال گام بعدی مهم به سمت هوش در سطح انسانی است. تصور این است که، اگر یک مدل توانایی بیش از تشخیص الگو را داشته باشد، می تواند پیشرفت هایی را در زمینه هایی مانند پزشکی و مهندسی باز کند. با این حال، در حال حاضر، توانایی های استدلال o1 نسبتاا کند است، شبیه به عامل نیست و برای توسعه دهندگان گران است.

مک گرو می گوید :« ما ماه های زیادی را صرف کار روی استدلال کرده‌ایم، زیرا فکر می کنیم این در واقع یک پیشرفت حیاتی است. اساسا، این یک روش جدید برای مدل ها است تا بتوانند مشکلات واقعا سختی را که برای پیشرفت به سمت سطوح هوش مانند انسان لازم است، حل کنند. »

برای استفاده از امکانات هوش مصنوعی ChatGPT-4o میتوانید از روبو، هوش مصنوعی فارسی، به راحتی استفاده کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *