رفتن به محتوای اصلی

کاربرد هوش نظارت‌نشده در کشف الگوی زبانی در اشتقاق کبیر

{00:48:17}

در جلسه قبل ظاهراً اجوف واوی را گفتم که آن آقا اجوف واوی را از او سؤال کرده و مطالبی را گفته است. با این توضیحی که عرض کردم، مدل‌های زبانی بزرگ که الآن این همه هوش مولد مبتنی بر آن است، این مدل‌های زبانی بزرگ، خودشان نظارت شده‌اند یا نظارت ناشده‌اند؟ الآن با این توضیحاتی که عرض کردم یک مدل زبانی بزرگ که میلیون‌ها امر را دخالت می‌دهد تا فهم زبان طبیعی کند؛ شما که با زبان فارسی با آن حرف می‌زنید، مقصود شما را بفهمد. این‌هایی که می‌گویم، یعنی پایه‌محور؛ مقصود شما را بفهمد و جواب شما را بدهد. این مدل زبان با این تعریفی که الآن فهمیدیم یک مدل نظارت شده است؟

شاگرد۱: برچسب‌زنی‌ها را که دارد.

استاد: بله، یعنی وقتی شما شروع می‌کنید، ریخت مدل زبانی، برچسب‌زنی دارد. حالا اگر بعداً بخواهد بهنح و دیگری ادامه بدهد، ممکن است تفاوت داشته باشد؛ مثلاً اگر در اشتقاق کبیر از همه زبان‌ها یا از خصوص زبان عربی ببینید وقتی واو در هر کلمه‌ای می‌آید آیا یک معنایی را افاده می‌کند یا نه؟ همان اجوف واوی؛ مثلاً اگر وسط بیاید چه معنایی را افاده می‌کند؟ در اشتقاق کبیر این بحث‌ها هست. من به گمانم این از آن شعبه‌هایی است که شما به آن برچسب نمی‌دهید، بلکه یک اطلاعاتی به او می‌دهید و او خودش کشف الگو می‌کند. همان دسته‌بندی‌ای است که عرض کردم. داده‌کاوی که امروزه خیلی مهم است، اساس همین داده‌کاوی همین است، یعنی اطلاعات زیادی دارد، الگوهایی را از اطلاعات و دیتای خودش کشف می‌کند که ممکن است شما اصلاً آن‌ها را ندانید. مثلاً از نحوه تراکنش‌های بانکی یک نفر، می‌فهمد که او پول‌شویی دارد یا دزد است. الگویی هم که او دارد را چه بسا شما نمی‌دانید. یعنی خودش دارد داده‌کاوی می‌کند و از مجموع چیزهایی که می‌داند، الگو کشف کرده است. شما به او نگفته‌اید کسی که اینجور می‌کند، ممکن است دزد باشد، بلکه خودش با داده‌کاوی به این‌ها می‌رسد.

همین دو-سه روز پیش دیدم؛ یک کلیپ مختصری هم بود. شاید یک معلم ریاضی خارجی است که دارد صحبت می‌کند و به شاگردانش می‌گوید بروید خیلی شکرگزار خوارزمی باشید. همین الگوریتم (الخوریزم) از او است. اگر یادتان باشد قبلاً هم عرض کرده بودم و مطلب خیلی مهمی است. می‌گویند اگر نمادهای جهان غرب -همان نمادهای اعداد رومی- مانده بود، امروز ممکن نبود این پیشرفت‌ها و ماشین‌ها باشد. خوارزمی با الگریتم‌هایی که در ضرب و جمع آورد، باعث این‌ها شد. به‌خصوص در نمادهای موضعی هندی، آن‌ها را او حاکم کرد. این آقای معلم، این را می‌گوید. این را پخش کرده‌اند از این باب که خوارزمی چکار کرده است.

این نکته خیلی مهم است؛ آنچه که نظارت‌ناشده است، ربط را برقرار نمی‌کند، بلکه کشف می‌کند. روی این حتماً تأمل کنید.

شاگرد۱۰: نظارت‌نشده بیشتر شبیه مغز ما است؟

استاد: یک بخش مهمی از مغز هم با نمادها کار می‌کند. مشکلی نیست. اما نه، کسی هم که حتی زبان بلد نیست و با نمادهای زبانی سر و کار ندارد - مثلاً کر باشد - مغز او دارد کار می‌کند و دسته‌بندی‌ها از بچگی شروع می‌شود.

در نظارت‌شده چون شما نام و برچسب را به آن می‌دهید، او بین ورودی و خروجی رابطه برقرار می‌کند و به شما می‌دهد. اما در نظارت‌ناشده، خودش کشف الگو می‌کند. یعنی کشف کردن رابطه‌ها خیلی متفاوت از این است که یک رابطه‌ای را که به او داده‌اید و برقرار شده را اجرا کند. اینجا است که عرض کردم برای اشتقاق کبیر، یعنی برای کشف روابط مخفی‌ای که در لغت هست، کشف ارتباط بدنه یک زبان با حروف آن زبان. بحث بسیار مهمی است. اینجا این نوع از یادگیری خیلی به کار می‌آید. چون خیلی وقت‌ها است که از بس زبان گسترده است، آن قدرتی که بتوانیم الگوهای فعال در یک زبانی را کشف کنیم، نداریم. چون سرعت این ماشین و کارش و گستردگیش بیشتر است، این الگوها را کشف می‌کند. لذا در قواعد فقه اللغه و اشتقاق کبیر و اکبر و کبّار، الگوهایی را می‌آورد که می‌بینیم بعضی از شواهدش روشن است و برخی از خروجی‌هایی که داد، راست است.

این سؤال من باشد؛ ببینیم آیا این درست است که اگر برای اشتقاق کبیر بخواهیم هوش مصنوعی را فعال کنیم و جلو ببریم، از نظارت‌ناشده محض باید استفاده کنیم یا از تلفیق آن‌ها؟

 

والحمد لله رب العالمین