معرفی OpenAI o1-preview

سری جدید از مدل‌های استدلال با نام OpenAI o1-preview برای حل مسائل پیچیده؛ از ۱۲ سپتامبر 2024 در دسترس می باشد

OpenAI یک سری جدید از مدل‌های هوش مصنوعی توسعه داده است که طراحی شده‌اند تا قبل از پاسخ، زمان بیشتری را صرف تفکر کنند. این مدل‌ها قادر به استدلال در مورد وظایف پیچیده و حل مشکلات دشوارتر از مدل‌های قبلی در زمینه‌های علمی، کدنویسی و ریاضی هستند. این یک نسخه پیش‌نمایش است و OpenAI وعده داده که به‌روزرسانی‌ها و بهبودهای منظمی داشته باشد. همراه با این انتشار، ارزیابی‌هایی برای به‌روزرسانی بعدی که در حال توسعه است نیز ارائه داده می شود.

نحوه عملکرد

OpenAI این مدل‌ها را آموزش داده است تا قبل از پاسخ دادن به مسائل، زمان بیشتری را برای تفکر اختصاص دهند، درست مانند یک انسان. آن‌ها از طریق آموزش، یاد می‌گیرند که فرآیند تفکر خود را بهبود بخشند، استراتژی‌های مختلف را امتحان کرده و اشتباهات خود را تشخیص دهند.

به‌روزرسانی بعدی این مدل ها که هم اکنون در دست توسعه است، در آزمایش‌های انجام شده به اندازه دانشجویان دکترا در وظایف پیچیده فیزیک، شیمی و زیست‌شناسی، با هوش و دقت عمل کرده است. همچنین مشخص شده که در ریاضیات و کدنویسی نیز مهارت بالایی دارد. در یک آزمون مقدماتی برای المپیاد بین‌المللی ریاضی (IMO)، GPT-4o تنها ۱۳ درصد از مسائل را به‌درستی حل کرد، در حالی که مدل استدلال ۸۳ درصد آن ها را درست حل کرد. توانایی‌های کدنویسی آن در مسابقات نیز ارزیابی شده و به ۸۹ درصد از بهترین‌ها در رقابت‌های Codeforces دست یافته است.

اطلاعات بیشتر درباره این موضوع را می توانید در پست تحقیقات فنی OpenAI مطالعه کنید.

OpenAI o1 به‌عنوان یک مدل اولیه، هنوز بسیاری از ویژگی‌های مفید ChatGPT مانند مرور وب برای اطلاعات و بارگذاری فایل‌ و تصویر را ندارد. در بسیاری از موارد رایج، GPT-4o در کوتاه‌مدت، قوی‌تر خواهد بود.

اما برای وظایف استدلال پیچیده، این مدل یک پیشرفت قابل توجه است و نمایانگر سطح جدیدی از قابلیت‌های هوش مصنوعی را به نمایش می گذارد. با توجه به این موضوع، OpenAI شمارش را از ۱ مجدداً شروع کرده و این سری را OpenAI o1 نام‌گذاری کرده است.

ایمنی

OpenAI در بخشی از توسعه این مدل‌های جدید، رویکرد آموزشی جدیدی برای ایمنی طراحی کرده که از قابلیت‌های استدلال آن‌ها استفاده می‌کند تا آن‌ها را به رعایت دستورالعمل‌های ایمنی و هم‌ترازی وادارد. مدل با توانایی استدلال در مورد قوانین ایمنی در زمینه‌های مختلف، می‌تواند آن‌ها را به‌طور مؤثرتری اعمال کند.

یکی از روش‌های ارزیابی ایمنی در مدل‌های زبانی بزرگ مانند GPT، بررسی توانایی این مدل‌ها در مقاومت در برابر تلاش‌های کاربران برای دور زدن قوانین ایمنی است. این فرآیند به “جیل‌بریکینگ” (Jailbreaking) معروف است. در آزمون‌های سختگیرانه‌ای که برای سنجش این مقاومت انجام شده، مدل GPT-4o عملکرد قابل قبولی با کسب امتیاز ۲۲ از ۱۰۰ را نشان داده است. در مقابل، مدل o1-preview با کسب امتیاز ۸۴ عملکرد بسیار بهتری داشته است.

OpenAI به منظور همسو شدن با توانایی‌های پیشرفته مدل‌های جدید o1-preview، اقدامات گسترده‌ای در زمینه ایمنی، مدیریت داخلی و همکاری با دولت فدرال به انجام رسانده است. این اقدامات شامل ارزیابی‌های دقیق و مستمر با بهره‌گیری از چارچوب‌های آمادگی، تیم‌های متخصص ارزیابی ریسک و فرایندهای تصمیم‌گیری در سطح هیئت مدیره، به ویژه کمیته ایمنی و امنیت، می‌باشد.

علاوه بر این OpenAI در راستای پایبندی به اصول ایمنی در حوزه هوش مصنوعی، به تازگی توافق‌نامه‌های رسمی همکاری را با موسسات معتبر ایمنی هوش مصنوعی در ایالات متحده و بریتانیا منعقد نموده است. در اجرای مفاد این توافقنامه‌ها، OpenAI اقدام به اعطای دسترسی به نسخه تحقیقاتی مدل‌های جدید o1-preview خود به این موسسات نموده است. این گام، نخستین حرکت در جهت تعامل گسترده با این موسسات بوده و به منظور ایجاد چارچوبی جامع برای پژوهش، ارزیابی و آزمایش مدل‌های آتی، چه پیش از انتشار عمومی و چه پس از آن، صورت گرفته است.

o1-preview برای چه کسانی مناسب است

قابلیت‌های استدلال پیشرفته o1-preview برای کسانی که با مشکلات پیچیده در زمینه‌های علمی، کدنویسی، ریاضیات و رشته‌های مشابه سروکار دارند، بسیار مفید می باشد. به‌عنوان مثال، o1 می‌تواند توسط محققان حوزه سلامت برای توضیح داده‌های توالی‌یابی سلول‌ها، توسط فیزیکدانان برای تولید فرمول‌های ریاضی پیچیده مورد نیاز در اپتیک کوانتومی و توسط توسعه‌دهندگان در تمامی زمینه‌ها برای ساخت و اجرای جریان‌های کاری چند مرحله‌ای استفاده شود.

OpenAI o1-mini

سری o1 مهارت بالایی در تولید و رفع اشکال کدهای پیچیده به‌طور دقیق دارد. OpenAI برای ارائه یک راهکار کارآمدتر برای توسعه‌دهندگان، OpenAI o1-mini را نیز منتشر کرده است، که یک مدل استدلال سریع‌تر و ارزان‌تر است و به‌ویژه در زمینه کدنویسی بسیار موثر عمل می کند. به‌عنوان یک مدل کوچک‌تر، o1-mini حدود 80 درصد ارزان‌تر از o1-preview است و آن را به مدلی قدرتمند و مقرون‌به‌صرفه برای کاربردهایی که نیاز به استدلال دارند اما دانش گسترده جهانی نمی‌خواهند، تبدیل می‌کند.

نحوه استفاده از OpenAI o1

کاربران ChatGPT Plus و Team می‌توانند به مدل‌های o1 در ChatGPT دسترسی داشته باشند. هر دو مدل o1-preview و o1-mini به‌طور دستی در قسمت انتخاب مدل قابل انتخاب هستند و در آغاز، محدودیت پیام هفتگی ۳۰ پیام برای o1-preview و ۵۰ پیام برای o1-mini وجود خواهد داشت. OpenAI در حال تلاش برای افزایش این محدودیت‌ها و فعال کردن ChatGPT است تا به‌طور خودکار مدل مناسب را برای یک درخواست خاص انتخاب کند.

OpenAI o1-preview

کاربران ChatGPT Enterprise و Edu نیز به فاصله اندکی از انتشار، به هر دو مدل دسترسی خواهند داشت.

توسعه‌دهندگانی که برای سطح ۵ استفاده از API واجد شرایط هستند، می‌توانند با هر دو مدل در API، با محدودیت ۲۰ درخواست در دقیقه کار کنند. OpenAI در حال تلاش برای کاهش این محدودیت‌ها می باشد. API این مدل‌ها در حال حاضر شامل فراخوانی توابع، پخش، پشتیبانی از پیام‌های سیستمی و سایر ویژگی‌ها نیست.

خبر خوب دیگر اینکه OpenAI در حال برنامه‌ریزی است تا دسترسی به o1-mini را برای تمامی کاربران ChatGPT Free فراهم کند.

گام بعدی

این یک پیش‌نمایش اولیه از این مدل‌های استدلال در ChatGPT و API است. علاوه بر به‌روزرسانی مدل، OpenAI انتظار دارد که مرور وب، بارگذاری فایل‌ها و تصاویر و سایر ویژگی‌ها را اضافه کند تا آن‌ها را برای همه افراد مفیدتر سازد.

OpenAI همچنین قصد دارد به توسعه و انتشار مدل‌های جدید در سری GPT، علاوه بر سری جدید OpenAI o1 ادامه دهد.

بیشتر بخوانید:

مدل زبان بزرگ یا LLM چیست؟
یادگیری ماشین چیست و چگونه کار می کند؟
کامپیوترها چگونه جهان را می بینند؟ همه چیز درباره Computer Vision
چت جی پی تی چیست و چه کاربردهایی دارد؟ همه چیز درباره ChatGPT
معرفی چت جی پی تی فارسی – ChatGPT Farsi؛ همراه با مثال های کاربردی

نقطه
Logo