هوش مصنوعی تولیدی چیست؟ همه چیز درباره Generative AI

در عصری که تکنولوژی به سرعت در حال پیشرفت است، هوش مصنوعی (AI) به یکی از بنیادی‌ترین عناصر تحول دیجیتال تبدیل شده است و در این میان هوش مصنوعی مولد (Generative AI) به عنوان یکی از جذاب‌ترین و تأثیرگذارترین تکنولوژی‌ها در سال‌های اخیر مطرح شده و نقش کلیدی در به ارمغان آوردن پیشرفت‌های بی‌سابقه در فناوری‌های روزمره ایفا می‌کند که نه تنها قادر است محتواهای جدیدی را بر اساس داده‌های آموخته شده خلق کند، بلکه پتانسیل آن در تغییر چشم‌انداز صنایع مختلف نیز بی‌بدیل است. هم‌اکنون ابزارهای رایگان متعددی در دسترس هستند که می‌توانند در تولید تصاویر، متون، موسیقی، ویدیو و بسیاری موارد دیگر در عرض چند ثانیه به ما کمک کنند. قابلیت‌های شگفت‌انگیز AI Generative Fill در فتوشاپ و Midjourney حقیقتاً ما را متعجب ساخته‌اند. اما، هوش مصنوعی تولیدی دقیقاً چیست و چگونه باعث این همه نوآوری سریع شده است؟

در این مقاله، ما به بررسی مفهوم هوش مصنوعی تولیدی خواهیم پرداخت و اینکه چگونه این تکنولوژی در حال بازنویسی قواعد بازی در صنایع مختلف، از تولید محتوا گرفته تا طراحی محصول، پزشکی، و … است. همچنین، اهمیت استفاده از این فناوری در دنیای امروز را مورد کاوش قرار خواهیم داد. از آنجایی که هوش مصنوعی تولیدی نقش عمده‌ای در شکل‌دهی آینده‌ی ما دارد، درک عمیق‌تر این فناوری و کاربردهای آن اهمیتی حیاتی دارد. برای آگاهی بیشتر، تا انتها با ما همراه باشید

هوش مصنوعی تولیدی چیست؟

هوش مصنوعی تولیدی همانطور که از نامش پیداست، نوعی از فناوری AI است که می‌تواند بر اساس داده‌هایی که روی آن‌ها آموزش دیده است، محتوای جدیدی تولید کند. این فناوری قادر است متون، تصاویر، صداها، ویدئوها و داده‌های مصنوعی را تولید کند. هوش مصنوعی تولیدی می‌تواند طیف وسیعی از خروجی‌ها را بر اساس ورودی‌های کاربر یا آنچه که ما دستورالعمل‌ یا Prompt می‌نامیم، تولید کند. اساساً، هوش مصنوعی تولیدی یک زیرشاخه از یادگیری ماشین است که می‌تواند داده‌های جدیدی را از یک مجموعه داده موجود ایجاد کند.

کاربرد هوش مصنوعی تولیدی در تولید متن

اگر مدل AI روی حجم زیادی از متون آموزش دیده باشد، می‌تواند ترکیب‌های جدیدی از متون، که بسیار طبیعی به نظر می‌رسند را تولید کند. هرچه داده‌ها بیشتر باشند، خروجی بهتر خواهد بود. اگر مجموعه داده قبل از آموزش پاک‌سازی شده باشد، احتمالاً پاسخ‌های دقیق‌تری دریافت خواهید کرد. همچنین، اگر مدلی را با مجموعه بزرگی از تصاویر همراه با برچسب‌گذاری تصاویر، عنوان‌ها و نمونه‌های بصری فراوان آموزش داده باشید، مدل هوش مصنوعی می‌تواند از این نمونه‌ها یاد بگیرد و در زمینه طبقه‌بندی و تولید تصاویر عمل کند. این سیستم پیچیده از هوش مصنوعی که برای یادگیری از نمونه‌ها برنامه‌ریزی شده است، شبکه عصبی (neural network) نامیده می‌شود.

با این حال، انواع مختلفی از مدل‌های هوش مصنوعی تولیدی وجود دارد، شامل شبکه‌های مقابله‌ای تولیدی یا Generative Adversarial Networks (GAN)، خودرمزنگار تغییری یا Variational Autoencoder (VAE) ، ترانسفورمرهای پیش‌آموزش‌دیده تولیدی Generative Pretrained Transformers (GPT), مدل‌های Autoregressive و بسیاری دیگر می‌شوند. در ادامه به طور مختصر به بررسی این مدل‌های تولیدی خواهیم پرداخت.

در حال حاضر، مدل‌های GPT پس از انتشار GPT-4/3.5 (ChatGPT)، PaLM 2 (Google Bard)، GPT-3 (DALL – E)، LLaMA (Meta)، Stable Diffusion و … ، به شهرت رسیده‌اند. تمام این رابط‌های کاربرپسند هوش مصنوعی بر معماری ترانسفورمر بنا شده‌اند. بنابراین، در این مطلب عمدتاً بر روی هوش مصنوعی تولیدی و GPT (ترانسفورمر پیش‌آموزش‌دیده تولیدی) تمرکز خواهیم کرد.

انواع مختلف مدل‌های هوش مصنوعی تولیدی

در میان تمام مدل‌های هوش مصنوعی تولیدی، GPT از محبوبیت زیادی برخوردار است، اما بیایید با GAN (Generative Adversarial Network) شروع کنیم. در این معماری، دو شبکه موازی آموزش داده می‌شوند، که یکی برای تولید محتوا (به نام تولیدکننده یا generator) و دیگری برای ارزیابی محتوای تولید شده (به نام تمیزدهنده یا discriminator) استفاده می‌شود.
به طور اساسی، هدف این است که دو شبکه عصبی را در مقابل یکدیگر قرار دهیم تا نتایجی را تولید کنند که منعکس‌کننده داده‌های واقعی باشند. مدل‌های مبتنی بر GAN بیشتر برای تولید تصویر استفاده شده‌اند.

در ادامه، به سراغ مدل Variational Autoencoder (VAE) می‌رویم که فرایند رمزگذاری، یادگیری، رمزگشایی و تولید محتوا را شامل می‌شود. به عنوان مثال، اگر شما تصویری از یک سگ داشته باشید، این مدل صحنه‌ای مانند رنگ، اندازه، گوش‌ها و موارد دیگر را توصیف می‌کند و سپس یاد می‌گیرد که یک سگ چه ویژگی‌هایی دارد. پس از آن، با استفاده از نقاط کلیدی، تصویری تقریبی ایجاد می‌کند که نسخه‌ای ساده‌ شده است. در نهایت، پس از افزودن تنوع و ظرایف بیشتر، تصویر نهایی را تولید می‌کند.

مدل‌های Autoregressive به مدل Transformer نزدیک هستند اما فاقد ویژگی self-attention می‌باشد. این مدل‌ها عمدتاً برای تولید متن به کار می‌روند، با این روش که یک دنباله را تولید کرده و سپس بخش بعدی را بر اساس دنباله‌هایی که تاکنون تولید کرده است، پیش‌بینی می‌کند. در ادامه، ما به Normalizing Flows و Energy-based Models نیز خواهیم پرداخت. اما در نهایت، قصد داریم به طور مفصل درباره مدل‌های مبتنی بر Transformer صحبت کنیم.

مدل Generative Pretrained Transformer (GPT) چیست؟

پیش از ظهور معماری Transformer، شبکه‌های عصبی بازگشتی (RNNs) و شبکه‌های عصبی کانولوشنی (CNNs) مانند GANها و VAEها به طور گسترده‌ای برای هوش مصنوعی تولیدی استفاده می‌شدند. در سال ۲۰۱۷، محققان شاغل در گوگل مقاله بنیادین « “Attention is all you need» (واسوانی، اوسکورایت و همکاران، ۲۰۱۷) را منتشر کردند تا زمینه‌ی ساخت هوش مصنوعی تولیدی را پیش ببرند و چیزی شبیه به یک مدل زبانی بزرگ (LLM) را ایجاد کنند.
در ادامه، گوگل در سال ۲۰۱۸ مدل BERT (نمایش‌های دوجهتی رمزگذار از Transformerها) را که بر پایه معماری Transformer پیاده‌سازی شده بود، منتشر کرد. همزمان، OpenAI اولین مدل GPT-1 خود را بر اساس معماری Transformer منتشر کرد. پس چه عنصر کلیدی در معماری ترانسفورمر وجود داشت که آن را به یکی از محبوب‌ترین‌ها در هوش تولیدی تبدیل کرد؟ همانطور که در عنوان مقاله به درستی آمده است، این فناوری خاصیت خودآگاهی (self-attention) است که در معماری‌های قبلی شبکه‌های عصبی وجود نداشت. این به این معناست که اساساً این سیستم با استفاده از روشی به نام ترانسفورمر، کلمه بعدی در جمله را پیش‌بینی می‌کند. این فناوری به کلمات مجاور توجه دقیقی می‌کند تا بافت و ارتباط بین کلمات را درک کند.

از طریق این فرآیند، ترانسفورمر درک مناسبی از زبان پیدا می‌کند و از این دانش برای پیش‌بینی قابل اعتماد کلمه بعدی استفاده می‌کند. کل این فرآیند به مکانیزم توجه معروف است. با این حال، به خاطر داشته باشید که مدل‌های زبان بزرگ (LLMs) به طور کنایه آمیز به « Stochastic Parrots» یا طوطی های تصادفی نامیده می‌شوند، زیرا مدل تنها کلمات را بر اساس تصمیمات احتمالی و الگوهایی که آموخته است، تقلید می‌کند. این مدل کلمه بعدی را بر اساس منطق تعیین نمی‌کند و هیچ درک واقعی از متن ندارد.

اصطلاح «pretrained یا پیش‌آموزی» در GPT، به این معناست که مدل پیش از به کارگیری مکانیزم توجه، بر روی حجم عظیمی از داده‌های متنی آموزش دیده است. با پیش‌آموزی داده‌ها، مدل یاد می‌گیرد که ساختار جمله، الگوها، حقایق، عبارات و غیره چگونه هستند. این امر به مدل کمک می‌کند تا درک خوبی از نحوه کارکرد دستور زبان پیدا کند.

Google و OpenAI چگونه به هوش مصنوعی تولیدی دست یافتند؟

Google و OpenAI هر دو از مدل‌های مبتنی بر Transformer به ترتیب در Google Bard و ChatGPT استفاده می‌کنند. با این حال، تفاوت‌های کلیدی در رویکرد آن‌ها وجود دارد. آخرین مدل PaLM 2 شرکت Google از یک رمزگذار دوجهتی (مکانیزم توجه خودی و یک شبکه عصبی پیش‌رو) استفاده می‌کند، که به این معناست که تمام کلمات اطراف را در نظر می‌گیرد. این مدل اساساً سعی می‌کند متن را درک کرده و سپس همه کلمات را به طور همزمان تولید کند. رویکرد کلی Google ، پیش‌بینی کلمات گمشده در یک زمینه داده‌شده است.

33 jpg -
44 1 jpg -

در مقابل، ChatGPT توسعه یافته توسط OpenAI از معماری Transformer برای پیش‌بینی کلمه بعدی در یک دنباله از چپ به راست، استفاده می‌کند . این مدل یک‌سویه طراحی شده است تا جملات منسجمی تولید کند. پیش‌بینی را ادامه می‌دهد تا زمانی که یک جمله کامل یا یک پاراگراف تولید کند. شاید به همین دلیل است که Google Bard متون را بسیار سریع‌تر از ChatGPT تولید می‌کند. با این حال، هر دو مدل در اصل بر معماری Transformer تکیه دارند تا رابط‌های کاربری AI تولیدی را ارائه دهند.

کاربردهای هوش مصنوعی تولیدی

همه می‌دانیم که AI تولیدی کاربردهای گسترده‌ای نه تنها برای تولید متن، بلکه برای خلق تصاویر، ویدئوها، صدا و بسیاری موارد دیگر دارد. چت‌بات‌های AI مانند ChatGPT، Google Bard، Bing Chat و غیره از AI تولیدی استفاده می‌برند. همچنین می‌توان از آن برای تکمیل خودکار، خلاصه‌سازی متن، دستیار مجازی، ترجمه و غیره استفاده کرد. برای تولید موسیقی، نمونه‌هایی مانند Google MusicLM را دیده‌ایم و اخیراً Meta هم MusicGen را برای تولید موسیقی منتشر کرده است. علاوه بر این، از DALL-E 2 تا Stable Diffusion، همگی از هوش مصنوعی تولیدی برای خلق تصاویر واقع‌گرایانه از دستورات متنی استفاده می‌کنند.

کاربردهای هوش مصنوعی تولیدی

در زمینه تولید ویدئو نیز، مدل‌های Gen-1 از Runway، StyleGAN 2، و BigGAN بر پایه شبکه‌های مقابله‌ای تولیدی (Generative Adversarial Networks) برای تولید ویدئوهای شبیه به واقعیت تکیه دارند. علاوه بر این، هوش مصنوعی تولیدی در تولید مدل‌های سه‌بعدی کاربردهایی دارد و برخی از مدل‌های محبوب در این زمینه DeepFashion و ShapeNet هستند.

هوش مصنوعی تولیدی تنها به این موارد محدود نمی‌شود، بلکه می‌تواند در کشف دارو نیز به شدت مفید باشد. این فناوری قادر است داروهای جدیدی را برای درمان بیماری‌های خاص طراحی کند. ما قبلاً شاهد مدل‌های کشف دارو مانند AlphaFold بوده‌ایم که توسط Google DeepMind توسعه یافته است. در نهایت، هوش مصنوعی تولیدی می‌تواند برای مدل‌ پیش‌بینی‌کننده به منظور پیش‌بینی رویدادهای مالی و هواشناسی به کار رود.

محدودیت‌های هوش مصنوعی تولیدی

در حالی که هوش مصنوعی تولیدی (Generative AI) توانایی‌های بسیار زیادی دارد، اما عاری از نقص نیست. ابتدا باید گفت که برای آموزش یک مدل، نیاز به مجموعه داده‌های بزرگی است. برای بسیاری از استارتاپ‌های کوچک، دسترسی به داده‌های باکیفیت بالا ممکن نیست به آسانی فراهم باشد. ما قبلاً شاهد بوده‌ایم که شرکت‌هایی مانند Reddit، Stack Overflow و Twitter دسترسی به داده‌های خود را محدود یا هزینه‌های بالایی برای دسترسی دریافت کرده‌اند. اخیراً، آرشیو اینترنت گزارش داد که وب‌سایت آن به مدت یک ساعت قابل دسترسی نبوده است زیرا یک استارتاپ هوش مصنوعی شروع به بمباران وب‌سایت آنها برای جمع‌آوری داده‌های آموزشی کرده بود. علاوه بر این، مدل‌های هوش مصنوعی تولیدی به دلیل نبود کنترل و وجود تعصب شدیداً مورد انتقاد قرار گرفته‌اند. مدل‌های AI که با داده‌های نامتوازن از اینترنت آموزش دیده‌اند، ممکن است بیشتر تحت تاثیر بخش خاصی از جامعه باشند. ما دیده‌ایم که چگونه مولدهای عکس AI عمدتاً تصاویر افرادی با پوست روشن‌تر را تولید می‌کنند. مشکل بزرگی هم در زمینه تولید ویدئو و تصویر deepfake با استفاده از مدل‌های هوش مصنوعی تولیدی وجود دارد. همانطور که پیشتر گفته شد، مدل‌های هوش مصنوعی تولیدی معنا یا تأثیر کلمات خود را درک نمی‌کنند و معمولاً خروجی‌ها را بر اساس داده‌هایی که بر آن‌ها آموزش دیده‌اند، تقلید می‌کنند.

پرسش‌های متداول

هوش مصنوعی تولیدی چیست؟

هوش مصنوعی تولیدی به زیرمجموعه‌ای از فناوری‌های هوش مصنوعی اطلاق می‌شود که قادر است بر اساس الگوها و داده‌هایی که از داده‌های آموزشی خود یاد گرفته است، محتوای جدیدی مانند متن، تصویر، صوت و ویدیو تولید کند.

هوش مصنوعی تولیدی چگونه کار می‌کند؟

مدل‌های هوش مصنوعی تولیدی معمولاً با استفاده از الگوریتم‌های یادگیری ماشینی روی مجموعه‌های داده‌های بزرگ آموزش می‌بینند. آن‌ها یاد می‌گیرند تا الگوها، ساختارها، و ویژگی‌های داده‌ها را درک و تکرار کنند. رویکردهای متداول شامل شبکه‌های تخاصمی تولیدی (GANs) و اتوانکودرهای وریشنی (VAEs) است.

برخی از کاربردهای معمول هوش مصنوعی تولیدی چیست؟

کاربردها شامل تولید محتوا (مانند نویسندگی، هنر، و موسیقی)، کشف دارو، متن پیش‌بینی‌کننده، چت‌بات‌ها، توصیه‌های محتوای شخصی‌سازی شده، و موارد دیگر است.


آیا هوش مصنوعی تولیدی همان یادگیری عمیق است؟

هرچند هوش مصنوعی تولیدی اغلب از مدل‌ها و تکنیک‌های یادگیری عمیق استفاده می‌کند، یادگیری عمیق دسته‌ای گسترده‌تر از یادگیری ماشین است که شامل هر شبکه عصبی با سه لایه یا بیشتر (شبکه‌های عمیق) می‌شود. هوش مصنوعی تولیدی به طور خاص درباره تولید خروجی‌های جدید است.

آیا هوش مصنوعی تولیدی قادر به خلق محتوای اصیل است؟

بله، هوش مصنوعی تولیدی می‌تواند محتوایی را ایجاد کند که به نظر می‌رسد اصیل است، اما این محتوا بر اساس الگوها و داده‌هایی است که آن را آموزش دیده است. “اصالت” در ترکیب‌های جدید و تفسیرهای این داده‌های آموزشی است.

چه ریسک‌هایی با هوش مصنوعی تولیدی همراه است؟

ریسک‌ها شامل احتمال تولید محتوای گمراه‌کننده یا مضر، مسائل نقض حق تکثیر، انتشار تعصبات موجود در داده‌های آموزشی، و نگرانی‌های امنیتی مانند دیپ‌فیک‌ها می‌شود.

تأثیر هوش مصنوعی تولیدی بر نیروی کار چگونه است؟

در حالی که این فناوری برخی از وظایف را خودکار می‌کند و ممکن است منجر به حذف شغل‌های خاصی شود، همچنین فرصت‌هایی برای نقش‌ها و صنایع جدید ایجاد می‌کند، به ویژه در نظارت بر AI، اخلاق، و حرفه‌های خلاقیت افزوده.

نقش اخلاق در هوش مصنوعی تولیدی چیست؟

ملاحظات اخلاقی برای راهنمایی توسعه و استقرار هوش مصنوعی تولیدی برای تضمین انصاف، شفافیت، پاسخگویی، و کاهش آسیب ضروری است. این شامل رسیدگی به تعصبات در داده‌های آموزشی و استفاده اخلاقی از محتوای تولیدی می‌شود.

چگونه می‌توان کیفیت خروجی‌های هوش مصنوعی تولیدی را تضمین کرد؟

تضمین کیفیت خروجی‌های هوش مصنوعی تولیدی شامل آزمایش و اعتبارسنجی دقیق، نظارت مداوم، و به‌روزرسانی مدل‌ها برای اصلاح خطاها و تعصبات است. بازخورد کاربران نیز برای بهبود عملکرد ضروری است.

آینده هوش مصنوعی تولیدی چگونه خواهد بود؟

آینده هوش مصنوعی تولیدی احتمالاً شاهد پذیرش گسترده‌تر در بخش‌های بیشتری خواهد بود، فناوری‌های بهبود یافته برای خروجی‌های واقع‌گرایانه‌تر و دقیق‌تر، و چارچوب‌های قوی‌تر برای استفاده اخلاقی و امن. ادغام با سایر فناوری‌های AI می‌تواند منجر به سیستم‌های پیچیده‌تر و خودکارتر شود.

نظر شما چیست؟

شما چی فکر می‌کنید؟

نقطه
Logo