هوش مصنوعی چگونه کار می‌کند؟

هوش مصنوعی می‌تواند مانند یک حقه جادویی به نظر برسد که همه در حالی که آرام فکر می‌کنند، آن را انجام می‌دهند... صبر کنید، این واقعاً کار می‌کند؟ خبر خوب. ما آن را بدون اغراق رمزگشایی خواهیم کرد، عملگرا خواهیم ماند و چند قیاس ناقص را که هنوز هم جذاب هستند، در آن قرار خواهیم داد. اگر فقط اصل مطلب را می‌خواهید، به پاسخ یک دقیقه‌ای زیر بروید. اما صادقانه بگویم، جزئیات جایی هستند که چراغ روشن می‌شود 💡.

مقالاتی که شاید بعد از این مطلب دوست داشته باشید بخوانید:

🔗 GPT مخفف چیست؟
توضیح سریعی در مورد مخفف GPT و معنای آن.

🔗 هوش مصنوعی اطلاعات خود را از کجا می‌آورد؟
منابعی که هوش مصنوعی برای یادگیری، آموزش و پاسخ به سوالات استفاده می‌کند.

🔗 چگونه هوش مصنوعی را در کسب و کار خود بگنجانید
مراحل عملی، ابزارها و گردش‌های کاری برای ادغام مؤثر هوش مصنوعی.

🔗 چگونه یک شرکت هوش مصنوعی راه اندازی کنیم
از ایده تا راه‌اندازی: اعتبارسنجی، تأمین مالی، تیم و اجرا.

هوش مصنوعی چگونه کار می‌کند؟ پاسخ یک دقیقه‌ای ⏱️

هوش مصنوعی الگوها را از داده‌ها یاد می‌گیرد تا پیش‌بینی کند یا محتوا تولید کند - نیازی به قوانین دست‌نویس نیست. یک سیستم مثال‌ها را دریافت می‌کند، میزان اشتباه خود را از طریق یک تابع زیان اندازه‌گیری می‌کند و دکمه‌های داخلی خود - پارامترها - را طوری تنظیم می‌کند که هر بار کمی کمتر اشتباه کند. شستشو، تکرار، بهبود. با چرخه‌های کافی، مفید می‌شود. چه در حال طبقه‌بندی ایمیل‌ها، تشخیص تومورها، انجام بازی‌های تخته‌ای یا نوشتن هایکو باشید، داستان یکسان است. برای یک پایه ساده در «یادگیری ماشین»، نمای کلی IBM قابل اعتماد است [1].

بیشتر هوش مصنوعی مدرن، یادگیری ماشینی است. نسخه ساده آن: داده‌ها را وارد کنید، یک نگاشت از ورودی‌ها به خروجی‌ها را یاد بگیرید، سپس آن را به موارد جدید تعمیم دهید. نه جادوی ریاضی، محاسبه، و اگر صادق باشیم، کمی هنر.

«هوش مصنوعی چگونه کار می‌کند؟» ✅

وقتی مردم در گوگل عبارت «هوش مصنوعی چگونه کار می‌کند؟» ، معمولاً می‌خواهند:

یک مدل ذهنی قابل استفاده مجدد که بتوانند به آن اعتماد کنند
نقشه‌ای از انواع اصلی یادگیری، تا اصطلاحات تخصصی دیگر ترسناک نباشند
نگاهی اجمالی به درون شبکه‌های عصبی بدون گم شدن
چرا به نظر می‌رسد که اکنون ترانسفورماتورها دنیا را اداره می‌کنند؟
مسیر عملی از داده تا استقرار
یک جدول مقایسه سریع که می‌توانید از آن اسکرین‌شات بگیرید و نگه دارید
حفاظ‌هایی در مورد اخلاق، تعصب و قابلیت اطمینان که متزلزل نیستند

اینجا همین نصیبت میشه. اگه من اینجا پرسه بزنم، عمدی هست، انگار دارم مسیر خوش‌منظره رو انتخاب می‌کنم و یه جوری دفعه‌ی بعد خیابون‌ها رو بهتر به خاطر می‌سپارم. 🗺️

اجزای اصلی اکثر سیستم‌های هوش مصنوعی 🧪

یک سیستم هوش مصنوعی را مانند یک آشپزخانه در نظر بگیرید. چهار ماده تشکیل دهنده بارها و بارها ظاهر می‌شوند:

داده‌ها - مثال‌هایی با برچسب یا بدون برچسب.
مدل - یک تابع ریاضی با پارامترهای قابل تنظیم.
هدف - یک تابع زیان که میزان بد بودن حدس‌ها را اندازه‌گیری می‌کند.
بهینه‌سازی - الگوریتمی که پارامترها را برای کاهش تلفات تغییر می‌دهد.

در یادگیری عمیق، این تلنگر معمولاً از نوع گرادیان نزولی با پس‌انتشار - روشی کارآمد برای فهمیدن اینکه کدام دکمه روی یک صفحه صدای غول‌پیکر جیرجیر کرده و سپس آن را کمی پایین‌تر بیاورید [2].

مورد کوچک: ما یک فیلتر اسپم مبتنی بر قانون شکننده را با یک مدل نظارت‌شده کوچک جایگزین کردیم. پس از یک هفته حلقه‌های برچسب → اندازه‌گیری → به‌روزرسانی، موارد مثبت کاذب کاهش یافت و درخواست‌های پشتیبانی نیز کاهش یافت. چیز خاصی نبود - فقط اهداف تمیزتر (دقت در ایمیل‌های «بی‌کیفیت») و بهینه‌سازی بهتر.

الگوهای یادگیری در یک نگاه 🎓

یادگیری نظارت‌شده
شما جفت‌های ورودی-خروجی (عکس‌هایی با برچسب، ایمیل‌هایی که به عنوان هرزنامه/غیر هرزنامه علامت‌گذاری شده‌اند) را ارائه می‌دهید. مدل ورودی → خروجی را یاد می‌گیرد. ستون فقرات بسیاری از سیستم‌های عملی [1].
یادگیری بدون نظارت
بدون برچسب. یافتن ساختار-خوشه‌ها، فشرده‌سازی‌ها، عوامل پنهان. عالی برای کاوش یا پیش‌آموزش.
یادگیری خودنظارتی
این مدل برچسب‌های خود را می‌سازد (کلمه بعدی، تکه تصویر گمشده را پیش‌بینی می‌کند). داده‌های خام را در مقیاس بزرگ به یک سیگنال آموزشی تبدیل می‌کند؛ زیربنای مدل‌های مدرن زبان و بینایی است.
یادگیری تقویتی
یک عامل عمل می‌کند، پاداش‌ها را و سیاستی را یاد می‌گیرد که پاداش تجمعی را به حداکثر می‌رساند. اگر «توابع مقداری»، «سیاست‌ها» و «یادگیری تفاضل زمانی» آشنا باشند، اینجا خانه آنهاست [5].

بله، دسته‌بندی‌ها در عمل مبهم می‌شوند. روش‌های ترکیبی طبیعی هستند. زندگی واقعی آشفته است؛ مهندسی خوب در جای خود به آن می‌رسد.

درون یک شبکه عصبی بدون سردرد 🧠

یک شبکه عصبی لایه‌هایی از واحدهای ریاضی کوچک (نورون‌ها) را روی هم قرار می‌دهد. هر لایه ورودی‌ها را با وزن‌ها، بایاس‌ها و یک غیرخطی نرم مانند ReLU یا GELU تبدیل می‌کند. لایه‌های اولیه ویژگی‌های ساده را یاد می‌گیرند؛ لایه‌های عمیق‌تر انتزاعات را رمزگذاری می‌کنند. «جادو» - اگر بتوانیم آن را جادو بنامیم - ترکیب : توابع کوچک را زنجیره‌ای کنید و می‌توانید پدیده‌های بسیار پیچیده را مدل‌سازی کنید.

حلقه تمرینی، فقط ارتعاشات:

حدس → اندازه‌گیری خطا → نسبت دادن تقصیر از طریق پس‌پراکنش → وزن‌های ضربه‌ای → تکرار.

این کار را به صورت دسته‌ای انجام دهید و مانند یک رقصنده دست و پا چلفتی که هر آهنگ را بهبود می‌بخشد، مدل دیگر پا روی پای شما نمی‌گذارد. برای یک فصل دوستانه و دقیق در مورد backprop، به [2] مراجعه کنید.

چرا ترنسفورمرها (ترانسفورمرها) غالب شدند - و «توجه» در واقع به چه معناست 🧲

ترانسفورماتورها از خود-توجهی برای سنجش اینکه کدام بخش‌های ورودی برای یکدیگر مهم هستند، به طور همزمان استفاده می‌کنند. به جای خواندن یک جمله صرفاً از چپ به راست مانند مدل‌های قدیمی، یک ترانسفورماتور می‌تواند همه جا را نگاه کند و روابط را به صورت پویا ارزیابی کند، مانند بررسی یک اتاق شلوغ برای دیدن اینکه چه کسی با چه کسی صحبت می‌کند.

این طراحی، تکرار و پیچیدگی را برای مدل‌سازی توالی حذف کرد و امکان موازی‌سازی گسترده و مقیاس‌بندی عالی را فراهم نمود. مقاله‌ای که این طرح را آغاز کرد - توجه، تمام چیزی است که نیاز دارید - معماری و نتایج را شرح می‌دهد [3].

توجه به خود در یک خط: پرس‌وجو ، کلید و مقدار ؛ شباهت‌ها را برای بدست آوردن وزن‌های توجه محاسبه کنید؛ مقادیر را بر این اساس با هم ترکیب کنید. در جزئیات دقیق، در روح زیبا.

هشدار: ترانسفورماتورها غالب هستند، نه انحصارطلب. CNNها، RNNها و مجموعه‌های درختی هنوز در انواع داده‌های خاص و محدودیت‌های تأخیر/هزینه برنده هستند. معماری را برای کار انتخاب کنید، نه تبلیغات اغراق‌آمیز.

هوش مصنوعی چگونه کار می‌کند؟ مراحل عملی که واقعاً از آنها استفاده خواهید کرد 🛠️

چارچوب‌بندی مسئله
چه چیزی را پیش‌بینی یا ایجاد می‌کنید و موفقیت چگونه سنجیده خواهد شد؟
داده‌ها
را جمع‌آوری کنید، در صورت نیاز برچسب‌گذاری کنید، تمیز کنید و تقسیم کنید. انتظار مقادیر از دست رفته و موارد حاشیه‌ای را داشته باشید.
مدل‌سازی
از ساده شروع کنید. خطوط پایه (رگرسیون لجستیک، تقویت گرادیان یا یک ترانسفورماتور کوچک) اغلب بر پیچیدگی‌های قهرمانانه غلبه می‌کنند.
آموزش:
یک هدف انتخاب کنید، یک بهینه‌ساز انتخاب کنید، ابرپارامترها را تنظیم کنید. تکرار کنید.
ارزیابی:
از وقفه‌ها، اعتبارسنجی متقابل و معیارهای مرتبط با هدف واقعی خود (دقت، F1، AUROC، BLEU، سرگشتگی، تأخیر) استفاده کنید.
استقرار:
پشت یک API قرار دهید یا در یک برنامه جاسازی کنید. تأخیر، هزینه و توان عملیاتی را پیگیری کنید.
نظارت و حاکمیت:
نظارت بر رانش، انصاف، استحکام و امنیت. چارچوب مدیریت ریسک هوش مصنوعی NIST (حاکمیت، نقشه، اندازه‌گیری، مدیریت) یک چک لیست عملی برای سیستم‌های قابل اعتماد از ابتدا تا انتها است [4].

مورد کوچک: یک مدل بینایی در آزمایشگاه عالی عمل کرد، سپس در میدان دید با تغییر نور، دچار مشکل شد. پایش، انحراف را در هیستوگرام‌های ورودی نشان داد؛ یک تقویت سریع + تنظیم دقیق، عملکرد را بازیابی کرد. خسته‌کننده بود؟ بله. مؤثر بود؟ باز هم بله.

جدول مقایسه - رویکردها، مناسب برای چه کسانی، هزینه تقریبی، دلیل کارایی آنها 📊

عمداً ناقص است: کمی جمله‌بندی ناهموار به حس انسانی آن کمک می‌کند.

رویکرد	مخاطب ایده‌آل	قیمت مناسب	چرا کار می‌کند / یادداشت‌ها
یادگیری تحت نظارت	تحلیلگران، تیم‌های محصول	کم-متوسط	نگاشت مستقیم ورودی→برچسب. وقتی برچسب‌ها وجود داشته باشند عالی است؛ ستون فقرات بسیاری از سیستم‌های مستقر را تشکیل می‌دهد [1].
بدون نظارت	کاوشگران داده، تحقیق و توسعه	کم	خوشه‌ها/فشرده‌سازی‌ها/فاکتورهای پنهان را پیدا می‌کند - برای کشف و پیش‌آموزش مناسب است.
خود-نظارتی	تیم‌های پلتفرم	متوسط	برچسب‌های خودش را از داده‌های خام می‌سازد - مقیاس‌ها با محاسبه و داده‌ها.
یادگیری تقویتی	رباتیک، تحقیقات عملیاتی	متوسط-زیاد	سیاست‌ها را از سیگنال‌های پاداش یاد می‌گیرد؛ برای مطالعه‌ی اصل مطلب، ساتون و بارتو [5] را مطالعه کنید.
ترانسفورماتورها	NLP، بینایی، چندوجهی	متوسط-زیاد	خود-توجهی، دِپ‌های دوربرد را در بر می‌گیرد و به خوبی موازی‌سازی می‌کند؛ به مقاله اصلی [3] مراجعه کنید.
یادگیری ماشین کلاسیک (درختان)	اپلیکیشن‌های کسب و کار جدولی	کم	خطوط مبنای ارزان، سریع و اغلب به طرز شگفت‌آوری قوی روی داده‌های ساختاریافته.
مبتنی بر قانون/نمادین	انطباق، قطعی	بسیار پایین	منطق شفاف؛ در سیستم‌های هیبریدی، زمانی که به قابلیت حسابرسی نیاز دارید، مفید است.
ارزیابی و ریسک	همه	متغیر است	برای ایمن و مفید نگه داشتن آن از GOVERN-MAP-MEASURE-MANAGE متعلق به NIST استفاده کنید [4].

قیمت مناسب = برچسب‌گذاری داده‌ها + محاسبه + افراد + خدمت‌رسانی.

بررسی عمیق ۱ - توابع زیان، گرادیان‌ها و گام‌های کوچکی که همه چیز را تغییر می‌دهند 📉

تصور کنید که می‌خواهید خطی را برای پیش‌بینی قیمت خانه از روی اندازه آن برازش دهید. شما پارامترهای (w) و (b) را انتخاب می‌کنید، (y = wx + b) را پیش‌بینی می‌کنید و خطا را با میانگین مربعات زیان اندازه‌گیری می‌کنید. گرادیان به شما می‌گوید که برای کاهش سریع زیان، (w) و (b) را به کدام جهت حرکت دهید - مانند راه رفتن در سرازیری در مه با حس کردن شیب زمین. بعد از هر دسته به‌روزرسانی کنید و خط شما به واقعیت نزدیک‌تر می‌شود.

در شبکه‌های عمیق، همان آهنگ با یک نوار بزرگتر است. الگوریتم پس‌پراپ محاسبه می‌کند که چگونه پارامترهای هر لایه بر خطای نهایی تأثیر می‌گذارند - به طور کارآمد - بنابراین می‌توانید میلیون‌ها (یا میلیاردها) دکمه را در جهت درست هدایت کنید [2].

شهودهای کلیدی:

فقدان، چشم‌انداز را شکل می‌دهد.
گرادیان‌ها قطب‌نمای شما هستند.
سرعت یادگیری به اندازه گام بستگی دارد - اگر خیلی بزرگ باشد، تلوتلو می‌خورید، و اگر خیلی کوچک باشد، چرت می‌زنید.
منظم‌سازی مانع از آن می‌شود که شما مجموعه آموزشی را مانند طوطی با یادآوری کامل اما بدون درک، حفظ کنید.

بررسی عمیق ۲ - جاسازی‌ها، راهنمایی و بازیابی 🧭

جاسازی‌ها کلمات، تصاویر یا موارد را در فضاهای برداری نگاشت می‌کنند که در آن‌ها موارد مشابه در نزدیکی یکدیگر قرار می‌گیرند. این به شما امکان می‌دهد:

یافتن متون مشابه از نظر معنایی
جستجوی قدرتمندی که معنا را می‌فهمد
نسل بازیابی-افزوده (RAG) را فعال کنید تا یک مدل زبانی بتواند قبل از نوشتن، حقایق را جستجو کند.

راهنمایی کردن ، نحوه هدایت مدل‌های تولیدی است - وظیفه را شرح دهید، مثال بزنید، محدودیت‌ها را تعیین کنید. آن را مانند نوشتن یک مشخصات بسیار دقیق برای یک کارآموز بسیار سریع در نظر بگیرید: مشتاق، گاهی اوقات بیش از حد مطمئن.

نکته کاربردی: اگر مدل شما دچار توهم می‌شود، بازیابی را اضافه کنید، دستورالعمل را محدودتر کنید، یا به جای «احساسات» با معیارهای منطقی ارزیابی کنید.

بررسی عمیق ۳ - ارزیابی بدون توهم 🧪

ارزیابی خوب کسل‌کننده به نظر می‌رسد - که دقیقاً نکته همین است.

از یک مجموعه تست قفل شده استفاده کنید.
معیاری را انتخاب کنید که منعکس کننده درد کاربر باشد.
ابلیشن انجام دهید تا بدانید چه چیزی واقعاً کمک کرده است.
خرابی‌ها را با مثال‌های واقعی و به‌هم‌ریخته ثبت کنید.

در تولید، نظارت، ارزیابی‌ای است که هرگز متوقف نمی‌شود. انحراف اتفاق می‌افتد. اصطلاحات جدید ظاهر می‌شوند، حسگرها دوباره کالیبره می‌شوند و مدل دیروز کمی تغییر می‌کند. چارچوب NIST یک مرجع عملی برای مدیریت ریسک و حاکمیت شرکتی مداوم است - نه یک سند سیاستی برای کنار گذاشتن [4].

یادداشتی در مورد اخلاق، تعصب و قابلیت اطمینان ⚖️

سیستم‌های هوش مصنوعی، داده‌ها و زمینه استقرار خود را منعکس می‌کنند. این امر خطراتی را به همراه دارد: سوگیری، خطاهای ناهموار در بین گروه‌ها، شکنندگی در هنگام تغییر توزیع. استفاده اخلاقی اختیاری نیست - بلکه شرط‌بندی است. NIST به شیوه‌های مشخص اشاره می‌کند: مستندسازی خطرات و تأثیرات، اندازه‌گیری سوگیری‌های مضر، ایجاد جایگزین‌ها و نگه داشتن انسان‌ها در حلقه زمانی که ریسک‌ها بالا هستند [4].

حرکات مشخص و مفید:

جمع‌آوری داده‌های متنوع و نماینده
اندازه‌گیری عملکرد در زیرگروه‌های جمعیتی
کارت‌های مدل سند و برگه‌های اطلاعات
نظارت انسانی را در جاهایی که ریسک بالاست، اضافه کنید
طراحی سیستم‌های ایمن در مواقع عدم قطعیت سیستم

هوش مصنوعی چگونه کار می‌کند؟ به عنوان یک مدل ذهنی می‌توانید از آن دوباره استفاده کنید 🧩

یک چک لیست جمع و جور که می‌توانید تقریباً برای هر سیستم هوش مصنوعی اعمال کنید:

هدف چیست؟ پیش‌بینی، رتبه‌بندی، تولید، کنترل؟
سیگنال یادگیری از کجا می‌آید؟ برچسب‌ها، وظایف خودنظارتی، پاداش‌ها؟
از چه معماری استفاده شده است؟ مدل خطی، گروه درختی، CNN، RNN، ترانسفورماتور [3]؟
چگونه بهینه شده است؟ تغییرات گرادیان نزولی/پس‌پراکنش [2]؟
چه رژیم داده‌ای؟ مجموعه کوچک برچسب‌گذاری‌شده، اقیانوسی از متن بدون برچسب، محیط شبیه‌سازی‌شده؟
حالت‌های خرابی و اقدامات حفاظتی کدامند؟ سوگیری، رانش، توهم، تأخیر، هزینه - نگاشت شده به GOVERN-MAP-MEASURE-MANAGE [4] از NIST.

اگر بتوانید به این سوالات پاسخ دهید، اساساً سیستم را درک کرده‌اید - بقیه جزئیات پیاده‌سازی و دانش دامنه است.

منابع سریع که ارزش نشانه‌گذاری دارند 🔖

مقدمه‌ای ساده بر مفاهیم یادگیری ماشین (IBM) [1]
پس‌انتشار با نمودارها و ریاضیات ملایم [2]
مقاله ترانسفورماتور که مدل‌سازی توالی را تغییر داد [3]
چارچوب مدیریت ریسک هوش مصنوعی NIST (مدیریت عملی) [4]
کتاب درسی یادگیری تقویتی متعارف (رایگان) [5]

سوالات متداول دور رعد و برق ⚡

آیا هوش مصنوعی فقط آمار است؟
هوش مصنوعی ترکیبی از آمار به علاوه‌ی بهینه‌سازی، محاسبات، مهندسی داده و طراحی محصول است. آمار اسکلت آن است؛ بقیه‌ی اجزای آن عضله هستند.

آیا مدل‌های بزرگ‌تر همیشه برنده هستند؟
مقیاس‌پذیری کمک می‌کند، اما کیفیت داده‌ها، ارزیابی و محدودیت‌های استقرار اغلب اهمیت بیشتری دارند. کوچکترین مدلی که به هدف شما می‌رسد، معمولاً برای کاربران و کیف پول‌ها بهترین است.

آیا هوش مصنوعی می‌تواند بفهمد؟
فهمیدن را تعریف کنید . مدل‌ها ساختار داده‌ها را ثبت می‌کنند و به طور چشمگیری تعمیم می‌دهند؛ اما نقاط کوری دارند و می‌توانند با اطمینان اشتباه کنند. با آنها مانند ابزارهای قدرتمند رفتار کنید - نه مانند خردمندان.

آیا دوران ترانسفورماتورها ابدی است؟
احتمالاً نه برای همیشه. این دوران اکنون غالب است زیرا توجه به خوبی موازی و مقیاس‌پذیر است، همانطور که مقاله اصلی نشان داد [3]. اما تحقیقات همچنان در حال پیشرفت است.

هوش مصنوعی چگونه کار می‌کند؟ خیلی طولانی بود، نخوندم 🧵

هوش مصنوعی الگوها را از داده‌ها یاد می‌گیرد، تلفات را به حداقل می‌رساند و به ورودی‌های جدید تعمیم می‌دهد [1،2].
یادگیری تحت نظارت، بدون نظارت، خودنظارتی و تقویتی، تنظیمات اصلی آموزش هستند؛ یادگیری تقویتی از طریق پاداش‌ها یاد می‌گیرد [5].
شبکه‌های عصبی از الگوریتم‌های پس‌انتشار و گرادیان نزولی برای تنظیم مؤثر میلیون‌ها پارامتر استفاده می‌کنند [2].
ترانسفورماتورها بر بسیاری از وظایف توالی تسلط دارند زیرا خود-توجهی، روابط را به صورت موازی در مقیاس [3] ثبت می‌کند.
هوش مصنوعی در دنیای واقعی یک مسیر است - از چارچوب‌بندی مسئله تا استقرار و مدیریت - و چارچوب NIST شما را در مورد ریسک صادق نگه می‌دارد [4].

اگر کسی دوباره بپرسد هوش مصنوعی چگونه کار می‌کند؟، می‌توانید لبخند بزنید، قهوه‌تان را جرعه جرعه بنوشید و بگویید: از داده‌ها یاد می‌گیرد، یک اتلاف را بهینه می‌کند و بسته به مشکل از معماری‌هایی مانند ترانسفورماتورها یا مجموعه‌های درختی استفاده می‌کند. سپس یک چشمک هم اضافه کنید، چون این هم ساده است و هم به طرز نامحسوسی کامل. 😉

منابع

[1] IBM - یادگیری ماشینی چیست؟
ادامه مطلب

[2] مایکل نیلسن - نحوه عملکرد الگوریتم پس انتشار
ادامه مطلب

[3] واسوانی و همکاران - توجه تنها چیزی است که نیاز دارید (arXiv)
ادامه مطلب

[4] NIST - چارچوب مدیریت ریسک هوش مصنوعی (AI RMF 1.0)
ادامه مطلب

[5] ساتون و بارتو - یادگیری تقویتی: مقدمه‌ای (ویرایش دوم)
ادامه مطلب

جدیدترین هوش مصنوعی را در فروشگاه رسمی دستیار هوش مصنوعی پیدا کنید

درباره ما

بازگشت به وبلاگ

کشور/منطقه