GPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXINGGPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXING
مسیر سه‌گامیگام ۱ از ۳۱۵ دقیقه خواندن

هوش مصنوعی چیست و چطور کار می‌کند

مفاهیم لازم — بدون ریاضیات، بدون اصطلاحات سنگین.

وقتی به Claude یا ChatGPT پیامی می‌فرستید و جواب می‌گیرید، چه اتفاقی پشت پرده می‌افتد؟ این فصل آن جواب را در پانزده دقیقه می‌دهد — به‌قدری که گام بعدی روشن باشد، نه آن‌قدر که گیج شوید.

دستاورد این فصل

۰ از ۶

پس از این فصل می‌دانید مدل زبانی چیست، چرا گاهی اشتباه می‌کند، و چطور با آن باهوشانه‌تر کار کنید.

  1. ۱. یک تصویر ساده: ماشین پیش‌بینی متن
  2. ۲. دو واژه‌ای که بقیه چیزها از آن می‌آید
  3. ۳. آموزش در مقابل استفاده
  4. ۴. چرا گاهی اشتباه می‌کند
  5. ۵. چه چیزی نیست
  6. ۶. این یعنی چه برای شما

#یک تصویر ساده: ماشین پیش‌بینی متن

هوش مصنوعی مولد امروزی — مدل‌هایی مثل Claude، GPT و Gemini — در عمیق‌ترین لایه فقط یک کار می‌کند: «بعدش چه می‌آید؟». می‌خواهیم پاسخ‌اش هوشمندانه باشد، اما خود مکانیزم به همین سادگی است.

به این فکر کنید که شما هم همین کار را می‌کنید؛ وقتی کسی می‌گوید «سلام صبح…»، مغزتان خودبه‌خود «بخیر» را آماده می‌کند. مدل زبانی همین کار را در مقیاسی غول‌پیکر و در ده‌ها زبان انجام می‌دهد، یک توکن در هر لحظه.

سلامصبحتوکن‌های ورودیمدل~۷۰B paramsبخیرتوکن بعدیخروجی به ورودی برمی‌گردد، توکن بعدی ساخته می‌شود — یک‌به‌یک
مدل، یک تابع است: متن می‌گیرد، بخش بعدی متن را پیش‌بینی می‌کند.
برای تعریف بزنید:

#دو واژه‌ای که بقیه چیزها از آن می‌آید

برای فهم بقیه‌ی چیزها فقط باید دو واژه را بدانید: توکن و پارامتر. اگر این دو روشن باشد، اکثر اخبار حوزه‌ی هوش مصنوعی برایتان معنی پیدا می‌کند.

۱) جمله به توکن شکسته می‌شودهوشمصنوعیچیست؟مدل۲) برای توکن بعدی، یک توزیع احتمال می‌سازدمدل62%برنامه18%علم11%
هر جمله به دنباله‌ای از توکن‌ها شکسته می‌شود؛ مدل احتمال هر توکن بعدی را می‌سازد و یکی را برمی‌گزیند.
برای تعریف بزنید:

#آموزش در مقابل استفاده

دو مرحله‌ی متفاوت وجود دارد و این تمایز را اشتباه نگیرید: آموزش (Training) و استفاده (Inference).

  • آموزش: یک‌بار، با حجم عظیمی از متن (ویکی، کتاب، کد، گفت‌وگو) و میلیون‌ها دلار محاسبه. مدل پارامترهایش را به‌تدریج تنظیم می‌کند. این مرحله ماه‌ها طول می‌کشد و فقط شرکت سازنده انجامش می‌دهد.
  • استفاده: هر بار که شما پیامی می‌فرستید. پارامترها ثابت‌اند؛ مدل فقط متن شما را می‌خواند و توکن‌های بعدی را می‌سازد. این مرحله در چند ثانیه اتفاق می‌افتد.

#چرا گاهی اشتباه می‌کند

مدل ذاتاً یک ماشین احتمال است. هر توکنی که می‌سازد، محتمل‌ترین گزینه است — نه لزوماً صحیح‌ترین. وقتی پاسخ واقعی نمی‌داند، چیزی می‌سازد که آماری شبیه پاسخ درست به نظر می‌رسد. به این می‌گویند «توهم» (Hallucination) و سه راه ساده دارد:

  1. اطلاعات لازم را داخل پیام بگذارید. هرچه مدل کمتر مجبور به حدس باشد، کمتر می‌سازد.
  2. برای ادعاهای مهم بخواهید منبع بدهد. اگر منبع نتوانست بدهد، احتمالاً ساخته است.
  3. خروجی را قبل از انتشار بازخوانی کنید. مدل تخصص نهایی شما نیست؛ پیش‌نویس اول است.

#چه چیزی نیست

سه باور رایج که حالا کنار بگذاریم:

  • «فکر می‌کند»: نه. تابعی است که الگو را بازتولید می‌کند. هیچ تجربه‌ی ذهنی، اراده، یا قصد ندارد.
  • «اطلاعات تازه دارد»: نه به‌صورت پیش‌فرض. اطلاعاتش تا تاریخ پایان آموزش است؛ اخبار جدید را فقط از طریق ابزارهای اضافی (وب‌جستجو، اسناد ضمیمه) می‌بیند.
  • «همیشه راست می‌گوید»: نه. اعتمادبه‌نفس مدل با درستی پاسخش رابطه‌ی تضمینی ندارد — حتی وقتی با لحن قاطع جواب می‌دهد.

#این یعنی چه برای شما

حالا می‌توانید با مدل به‌جای «جعبه‌ی جادویی»، مثل یک «دستیار خبره ولی فراموشکار» رفتار کنید: درخواست‌تان را روشن بگویید، اطلاعات لازم را داخل پیام بدهید، و خروجی را بازخوانی کنید. در گام بعدی، دقیقاً یاد می‌گیرید چطور این درخواست را بنویسید.