سری جدید از مدلهای استدلال با نام OpenAI o1 برای حل مسائل پیچیده؛ از ۱۲ سپتامبر 2024 در دسترس می باشد
OpenAI یک سری جدید از مدلهای هوش مصنوعی توسعه داده است که طراحی شدهاند تا قبل از پاسخ، زمان بیشتری را صرف تفکر کنند. این مدلها قادر به استدلال در مورد وظایف پیچیده و حل مشکلات دشوارتر از مدلهای قبلی در زمینههای علمی، کدنویسی و ریاضی هستند. این یک نسخه پیشنمایش است و OpenAI وعده داده که بهروزرسانیها و بهبودهای منظمی داشته باشد. همراه با این انتشار، ارزیابیهایی برای بهروزرسانی بعدی که در حال توسعه است نیز ارائه داده می شود.
نحوه عملکرد
OpenAI این مدلها را آموزش داده است تا قبل از پاسخ دادن به مسائل، زمان بیشتری را برای تفکر اختصاص دهند، درست مانند یک انسان. آنها از طریق آموزش، یاد میگیرند که فرآیند تفکر خود را بهبود بخشند، استراتژیهای مختلف را امتحان کرده و اشتباهات خود را تشخیص دهند.
بهروزرسانی بعدی این مدل ها که هم اکنون در دست توسعه است، در آزمایشهای انجام شده به اندازه دانشجویان دکترا در وظایف پیچیده فیزیک، شیمی و زیستشناسی، با هوش و دقت عمل کرده است. همچنین مشخص شده که در ریاضیات و کدنویسی نیز مهارت بالایی دارد. در یک آزمون مقدماتی برای المپیاد بینالمللی ریاضی (IMO)، GPT-4o تنها ۱۳ درصد از مسائل را بهدرستی حل کرد، در حالی که مدل استدلال ۸۳ درصد آن ها را درست حل کرد. تواناییهای کدنویسی آن در مسابقات نیز ارزیابی شده و به ۸۹ درصد از بهترینها در رقابتهای Codeforces دست یافته است.
اطلاعات بیشتر درباره این موضوع را می توانید در پست تحقیقات فنی OpenAI مطالعه کنید.
OpenAI o1 بهعنوان یک مدل اولیه، هنوز بسیاری از ویژگیهای مفید ChatGPT مانند مرور وب برای اطلاعات و بارگذاری فایل و تصویر را ندارد. در بسیاری از موارد رایج، GPT-4o در کوتاهمدت، قویتر خواهد بود.
اما برای وظایف استدلال پیچیده، این مدل یک پیشرفت قابل توجه است و نمایانگر سطح جدیدی از قابلیتهای هوش مصنوعی را به نمایش می گذارد. با توجه به این موضوع، OpenAI شمارش را از ۱ مجدداً شروع کرده و این سری را OpenAI o1 نامگذاری کرده است.
ایمنی
OpenAI در بخشی از توسعه این مدلهای جدید، رویکرد آموزشی جدیدی برای ایمنی طراحی کرده که از قابلیتهای استدلال آنها استفاده میکند تا آنها را به رعایت دستورالعملهای ایمنی و همترازی وادارد. مدل با توانایی استدلال در مورد قوانین ایمنی در زمینههای مختلف، میتواند آنها را بهطور مؤثرتری اعمال کند.
یکی از روشهای ارزیابی ایمنی در مدلهای زبانی بزرگ مانند GPT، بررسی توانایی این مدلها در مقاومت در برابر تلاشهای کاربران برای دور زدن قوانین ایمنی است. این فرآیند به “جیلبریکینگ” (Jailbreaking) معروف است. در آزمونهای سختگیرانهای که برای سنجش این مقاومت انجام شده، مدل GPT-4o عملکرد قابل قبولی با کسب امتیاز ۲۲ از ۱۰۰ را نشان داده است. در مقابل، مدل o1-preview با کسب امتیاز ۸۴ عملکرد بسیار بهتری داشته است.
OpenAI به منظور همسو شدن با تواناییهای پیشرفته مدلهای جدید o1-preview، اقدامات گستردهای در زمینه ایمنی، مدیریت داخلی و همکاری با دولت فدرال به انجام رسانده است. این اقدامات شامل ارزیابیهای دقیق و مستمر با بهرهگیری از چارچوبهای آمادگی، تیمهای متخصص ارزیابی ریسک و فرایندهای تصمیمگیری در سطح هیئت مدیره، به ویژه کمیته ایمنی و امنیت، میباشد.
علاوه بر این OpenAI در راستای پایبندی به اصول ایمنی در حوزه هوش مصنوعی، به تازگی توافقنامههای رسمی همکاری را با موسسات معتبر ایمنی هوش مصنوعی در ایالات متحده و بریتانیا منعقد نموده است. در اجرای مفاد این توافقنامهها، OpenAI اقدام به اعطای دسترسی به نسخه تحقیقاتی مدلهای جدید o1-preview خود به این موسسات نموده است. این گام، نخستین حرکت در جهت تعامل گسترده با این موسسات بوده و به منظور ایجاد چارچوبی جامع برای پژوهش، ارزیابی و آزمایش مدلهای آتی، چه پیش از انتشار عمومی و چه پس از آن، صورت گرفته است.
o1-preview برای چه کسانی مناسب است
قابلیتهای استدلال پیشرفته o1-preview برای کسانی که با مشکلات پیچیده در زمینههای علمی، کدنویسی، ریاضیات و رشتههای مشابه سروکار دارند، بسیار مفید می باشد. بهعنوان مثال، o1 میتواند توسط محققان حوزه سلامت برای توضیح دادههای توالییابی سلولها، توسط فیزیکدانان برای تولید فرمولهای ریاضی پیچیده مورد نیاز در اپتیک کوانتومی و توسط توسعهدهندگان در تمامی زمینهها برای ساخت و اجرای جریانهای کاری چند مرحلهای استفاده شود.
OpenAI o1-mini
سری o1 مهارت بالایی در تولید و رفع اشکال کدهای پیچیده بهطور دقیق دارد. OpenAI برای ارائه یک راهکار کارآمدتر برای توسعهدهندگان، OpenAI o1-mini را نیز منتشر کرده است، که یک مدل استدلال سریعتر و ارزانتر است و بهویژه در زمینه کدنویسی بسیار موثر عمل می کند. بهعنوان یک مدل کوچکتر، o1-mini حدود 80 درصد ارزانتر از o1-preview است و آن را به مدلی قدرتمند و مقرونبهصرفه برای کاربردهایی که نیاز به استدلال دارند اما دانش گسترده جهانی نمیخواهند، تبدیل میکند.
نحوه استفاده از OpenAI o1
کاربران ChatGPT Plus و Team میتوانند به مدلهای o1 در ChatGPT دسترسی داشته باشند. هر دو مدل o1-preview و o1-mini بهطور دستی در قسمت انتخاب مدل قابل انتخاب هستند و در آغاز، محدودیت پیام هفتگی ۳۰ پیام برای o1-preview و ۵۰ پیام برای o1-mini وجود خواهد داشت. OpenAI در حال تلاش برای افزایش این محدودیتها و فعال کردن ChatGPT است تا بهطور خودکار مدل مناسب را برای یک درخواست خاص انتخاب کند.
کاربران ChatGPT Enterprise و Edu نیز به فاصله اندکی از انتشار، به هر دو مدل دسترسی خواهند داشت.
توسعهدهندگانی که برای سطح ۵ استفاده از API واجد شرایط هستند، میتوانند با هر دو مدل در API، با محدودیت ۲۰ درخواست در دقیقه کار کنند. OpenAI در حال تلاش برای کاهش این محدودیتها می باشد. API این مدلها در حال حاضر شامل فراخوانی توابع، پخش، پشتیبانی از پیامهای سیستمی و سایر ویژگیها نیست.
خبر خوب دیگر اینکه OpenAI در حال برنامهریزی است تا دسترسی به o1-mini را برای تمامی کاربران ChatGPT Free فراهم کند.
گام بعدی
این یک پیشنمایش اولیه از این مدلهای استدلال در ChatGPT و API است. علاوه بر بهروزرسانی مدل، OpenAI انتظار دارد که مرور وب، بارگذاری فایلها و تصاویر و سایر ویژگیها را اضافه کند تا آنها را برای همه افراد مفیدتر سازد.
OpenAI همچنین قصد دارد به توسعه و انتشار مدلهای جدید در سری GPT، علاوه بر سری جدید OpenAI o1 ادامه دهد.
بیشتر بخوانید:
مدل زبان بزرگ یا LLM چیست؟
یادگیری ماشین چیست و چگونه کار می کند؟
کامپیوترها چگونه جهان را می بینند؟ همه چیز درباره Computer Vision
چت جی پی تی چیست و چه کاربردهایی دارد؟ همه چیز درباره ChatGPT
معرفی چت جی پی تی فارسی – ChatGPT Farsi؛ همراه با مثال های کاربردی