
این روزها کمتر کسی پیدا میشود که اسم هوش مصنوعی را نشنیده یا حداقل یکبار از آن استفاده نکرده باشد. با وجود اینکه ممکن است هر روز از هوش مصنوعی استفاده کنیم، اما خیلی با نحوه کار آن آشنا نیستم. هوش مصنوعی شبیه یک دوست باهوش است که میتواند با ما صحبت کند و به سوالات ما پاسخ دهد. در این مقاله میخواهیم به زبانی ساده بفهمیم که چت باتهای هوش مصنوعی چطور کار میکنند.
مغز متفکر چت باتهای هوش مصنوعی از چه چیزی تشکیل شده است؟
فردی را تصور کنید که تمامی کتاب های موجود در دنیا به زبان های مختلف و همه مطالب منتشر شده در بستر اینترنت را به طور کامل و جامع یاد گرفته است. به تمامی دانش و مطالب آن تسلط دارد و هرگز چیزهایی که یاد گرفته است را فراموش نمیکند.
چت باتها دقیقاً همین کار را میکنند. مانند یک دانش آموز تمامی درسهایی که به آنها دادهاند را یاد گرفته و تسلط کامل دارند. به همین دلیل است که میتوانند به تمامی سوالات شما در زمینههای مختلف پاسخ دهند.
توجه داشته باشید که چت باتها میلیونها متن، مقاله، کتاب و مطلب را یاد گرفتهاند. توانمندی که هیچ انسانی قادر به انجام آن نیست.
به طور خلاصه:
- چت باتها میلیونها متن و مقاله را مطالعه کردهاند تا بتوانند مانند انسانها صحبت کنند
- آنها یاد گرفتهاند که کلمات چه معنایی دارند و چطور باید آنها را کنار هم قرار دهند
- وقتی سوالی میپرسیم، آنها در “حافظه” خود جستجو میکنند تا بهترین پاسخ را پیدا کنند
- مثل یک معلم مهربان، سعی میکنند پاسخها را به زبانی ساده توضیح دهند
چت باتها چطور زبان ما را میفهمند؟
تصور کنید یک کودک نوزاد چطور زبان را یاد میگیرد. ابتدا صداهای مختلف را میشنود، کمکم کلمات ساده مثل “مامان” و “بابا” را تکرار میکند، و به مرور یاد میگیرد جملههای کامل بسازد. چت باتها هم مسیری مشابه را طی میکنند، اما خیلی سریعتر!
فرآیند یادگیری چت باتها مراحل مختلفی دارد که در این بخش به سادهترین شکل ممکن بیان شده است.
مرحله اول) یادگیری به کمک پردازش زبان طبیعی (مثل مغز یک کودک)
تصور کنید وقتی مادری به کودکش میگوید “سیب قرمز را بردار”، در مغز کودک این اتفاقات میافتد:
- اول یاد گرفته که “سیب” یک میوه است
- میداند “قرمز” یک رنگ است
- فهمیده “برداشتن” یعنی با دست چیزی را گرفتن
چت باتها هم دقیقاً همین کار را میکنند. وقتی به آنها میگوییم “یک داستان درباره سیب قرمز بنویس”:
- کلمه “سیب” را میشناسند و میدانند یک میوه است
- میدانند “قرمز” رنگ است و سیب میتواند قرمز باشد
- میفهمند “داستان نوشتن” یعنی باید یک متن جذاب با شروع و پایان بسازند
مجموع یادگیری که در این مرحله اتفاق میافتد، براساس متنها، مطالب و مقالاتی است که در دوره آموزش به چت بات ارائه میشود. این مطالب آموزشی به صورت مرحله به مرحله و در بازههای زمانی مختلف به چت بات هوش مصنوعی منتقل میشود.
مرحله دوم) یادگیری عصبی (مثل مغز در حال رشد)
فکر کنید چطور شما کلمه جدید یاد میگیرید:
- اول آن را چند بار میشنوید
- در موقعیتهای مختلف میبینید چطور استفاده میشود
- کمکم یاد میگیرید خودتان هم آن را درست استفاده کنید
چت باتها هم سیستم عصبی مصنوعی دارند که شبیه مغز ما کار میکند:
- میلیونها متن را میخوانند
- یاد میگیرند هر کلمه در چه موقعیتهایی استفاده میشود
- میفهمند کلمات چه ارتباطی با هم دارند
و در این مرحله چت بات یاد میگیرد که چه کلماتی با یکدیگر ارتباط دارند و باید از هر کلمه در چه موقعیتی استفاده کند.
مرحله سوم) درک احساسات (مثل همدلی انسانها)
وقتی دوستتان با صدای بلند و خنده میگوید “چقدر خوشحالم!”، شما میفهمید او واقعاً خوشحال است. یا اگر با صدای لرزان و بغض آلود صحبت کند، متوجه میشوید که اتفاقی افتاده و او از چیزی ناراحت است. چت باتها هم یاد گرفتهاند:
- از کلمات مثبت مثل “خوشحال”، “عالی”، “دوست دارم” احساسات خوب را تشخیص دهند
- از کلمات منفی مثل “ناراحت”، “عصبانی”، “متأسفم” احساسات منفی را بفهمند
- از علامتهای نگارشی مثل “!” یا “:)” معنی احساسی جمله را درک کنند
در این مرحله چت باتهای آنلاین به درک عمیقتری از کلمات و عبارات میرسند؛ از این رو میتوانند پاسخهایی ارائه دهند که به مکالمات انسانی بسیار شبیهتر است.
مرحله چهارم) یادگیری مداوم (مثل یک دانش آموز کنجکاو)
درست مثل دانشآموزی که هر روز چیزهای جدید یاد میگیرد، چت باتهای هوش مصنوعی نیز؛
- با هر گفتگو، الگوهای جدید زبانی را میشناسند
- یاد میگیرند در موقعیتهای مختلف چطور پاسخ مناسب بدهند
- اگر اشتباه کنند، سعی میکنند دفعه بعد بهتر عمل کنند
به این ترتیب، چت باتها مثل یک دوست باهوش میتوانند با ما صحبت کنند، احساسات ما را بفهمند و به ما کمک کنند. آنها مثل یک کودک که کمکم بزرگ میشود، هر روز باهوشتر و بهتر میشوند!
حالا به سراغ مدلهای زبانی بزرگ میرویم.

مدلهای زبانی بزرگ چه هستند؟
همانطور که در بخشهای قبلی گفته شد، چت باتهای آنلاین میلیونها مقاله، کتاب و متن را خوانده و پس از مدتی یاد میگیرند که از هر کلمه و عبارت در چه موقعیتی استفاده کنند. درواقع، چت باتها مغزی دارند که تمامی این اطلاعات در آن ذخیره شده است. مغز چت باتهای هوش مصنوعی همان مدلهای زبانی بزرگ یا LLMها هستند.
مدلهای زبانی بزرگ در واقع یک کتابخانه عظیم دانش هستند که:
- همه کتابهای دنیا در آن هست
- تمام مقالههای علمی را دارد
- پر از داستانهای جذاب است
- میلیونها گفتگوی مختلف در آن ثبت شده است
مهم ترین ویژگیهای مدلهای زبانی بزرگ میتوان به موارد زیر اشاره کرد:
- قدرت چند زبانه
- حافظه قوی
- خلاقیت و تخیل
- یادگیری از اشتباهات
ساختار مدلهای زبانی بزرگ به چه شکل است؟
بیایید با یک مثال ساده شروع کنیم. تصور کنید شما جمله “من امروز صبح یک سیب …………… خوردم” را میخوانید. مغز شما فوراً حدس میزند که کلمهی جای خالی احتمالاً “قرمز” یا “شیرین” است. مدلهای زبانی هم دقیقاً همین کار را میکنند!
مدلهای زبانی بزرگ (LLM) از اجزایی تشکیل شدهاند که به نام “پارامتر” شناخته میشوند. این پارامترها مثل قطعات یک پازل عمل میکنند. تصور کنید یک پازل خیلی بزرگ دارید:
- هر قطعه پازل یک “پارامتر” است
- مدلهای بزرگ مثل GPT میلیاردها پارامتر دارند
- هر پارامتر یک تکه کوچک از دانش را نگه میدارد
- همه این پارامترها با هم کار میکنند تا معنی را بفهمند
مدلهای زبانی بزرگ چگونه کلمات را پیشبینی میکنند؟
پیشبینی کلمات به کمک مدلهای زبانی بزرگ در واقع شبیه بازی حدس کلمات است.
- اول به کلمات قبلی نگاه میکنند
- الگوهای آشنا را پیدا میکنند
- احتمال هر کلمه را محاسبه میکنند
- محتملترین کلمه را انتخاب میکنند
برای مثال در جمله “من یک لیوان آب ……………..
- میدانند بعد از “آب” معمولاً “خوردم”، “نوشیدم” یا “ریختم” میآید
- احتمال هر کلمه را حساب میکنند
- کلمهای که بیشترین احتمال را دارد انتخاب میکنند
نکته: کلیه ساختار هوش مصنوعی و مدلهای زبانی بزرگ برپایه علوم ریاضی بنا شده است.
نحوه محاسبه احتمالات در مدلهای زبانی بزرگ
فکر کنید میخواهید جمله “هوا امروز ……………. است” را کامل کنید. کاری که LLMها انجام میدهند به شرح زیر است:
- مدل به تجربیات قبلی نگاه میکند
- میبیند معمولاً بعد از “هوا امروز” چه کلماتی میآیند
- به همه احتمالات امتیاز میدهد:
- “آفتابی” – ۸۰% احتمال
- “ابری” – ۷۰% احتمال
- “سرد” – ۶۰% احتمال
- کلمه با بیشترین احتمال را انتخاب میکند
مدلهای زبانی بزرگ از بخشهای متعددی تشکیل شده است:
لایههای یادگیری
مثل مغز انسان که لایههای مختلف دارد:
- لایه اول: حروف و کلمات ساده را میشناسد
- لایه دوم: ارتباط بین کلمات را میفهمد
- لایه سوم: معنی جمله را درک میکند
- لایههای بالاتر: مفاهیم پیچیدهتر را میفهمند
مکانیسم توجه
درست مثل وقتی که شما یک متن را میخوانید:
- به کلمات مهم بیشتر توجه میکنید
- ارتباط بین کلمات دور و نزدیک را میبینید
- به زمینه و موضوع متن توجه میکنید
- اطلاعات مهم را به خاطر میسپارید
یادگیری زمینه
مثل وقتی که شما موضوع یک مکالمه را میفهمید:
- به موضوع کلی گفتگو توجه میکنند
- تاریخچه مکالمه را به خاطر میسپارند
- میفهمند در چه زمینهای صحبت میکنیم
- پاسخهای مرتبط با موضوع میدهند
به این ترتیب، مدلهای زبانی مثل یک دانشآموز باهوش هستند که:
- از تک تک کلمات و تجربیات یاد میگیرند
- الگوها را کشف میکنند
- احتمالات را محاسبه میکنند
- و بهترین پاسخ را انتخاب میکنند
جالب است بدانید همه این کارها در کسری از ثانیه انجام میشود تا بتوانند مثل یک انسان با ما صحبت کنند!
چرا چت باتها گاهی اشتباه میکنند؟
درست مثل انسانها که گاهی اشتباه میکنند، چت باتها هم ممکن است اشتباه کنند.
- آنها فقط چیزهایی را میدانند که به آنها آموزش داده شده است
- گاهی ممکن است سوال ما را درست متوجه نشوند
- نمیتوانند مثل انسانها احساس کنند یا تجربه واقعی داشته باشند
- باید همیشه پاسخهای آنها را با دقت بررسی کنیم
این مقاله به شما کمک کرد تا بفهمید چت باتهای هوش مصنوعی چطور کار میکنند. آنها مثل یک دوست باهوش هستند که میتوانند به ما کمک کنند، اما باید یادمان باشد که آنها هم محدودیتهایی دارند و نمیتوانند همه کارها را انجام دهند.
چت باتهای فارسی چگونه عمل میکنند؟
فرآیند آموزش چت باتهای هوش مصنوعی تفاوت زیادی ندارد. اما گاهی اوقات براساس اهداف توسعهدهندگان، مطالب و متون یک زبان خاص با تمرکز بیشتری به چت بات آموزش داده میشود. تصور کنید معلمی که به یک زبان خاص مثل فارسی تسلط کامل دارد. این معلم تمام ظرافتها، ضربالمثلها و فرهنگ آن زبان را میشناسد. مدلهای زبانی تخصصی هم همینطور هستند!
روش آموزش زبان تخصصی به چت باتهای هوش مصنوعی دقیقاً مثل فرآیندی است که در بخشهای قبلی توضیح دادیم. درست مثل غرق شدن در یک زبان جدید:
- از متون اصیل آن زبان استفاده میکنند
- با دادههای بیشتری از آن زبان آموزش میبینند
- روی قواعد دستوری خاص آن زبان تمرکز میکنند
- با لهجهها و گویشهای مختلف آشنا میشوند
مدلهای زبانی فارسی کاربردهای ویژهای مثل:
- ترجمه متون تخصصی
- نوشتن متون ادبی
- درک متون قدیمی و تاریخی
- پاسخگویی به سوالات فرهنگی و بومی
دارند که میتوانند برای مخاطبان فارسی زبان یک گزینه ایدهآل هوش مصنوعی باشند.
با مدل زبانی بزرگ مقیاس یارا با ۷۰ میلیارد پارامتر که بر روی زبان فارسی توسعه داده شده است آشنا شوید.
با یارابات پلتفرم ساخت چت باتهای اختصاصی با تسلط کامل بر زبان فارسی آشنا شوید.
بیشتر بخوانید: یارابات چیست؟
دیدگاهتان را بنویسید