رفتن به محتوای اصلی

نسل سوم هوش مصنوعی و روش داده‌محوری

{00:28:54}

شاگرد۲: این مرحله سوم است؟

استاد: مرحله سوم جور دیگری است که الآن می‌خواهم عرض کنم.

شاگرد۲: قبل از مرحله سوم چکار می‌کند؟ فرمودید که نمی‌توانند بفهمند چکار می‌کند، اما آن را بخش بخش می‌کنند؟

استاد: نسل سوم که خیلی مهم است، این است که اصلاً ریخت درک منطقی…؛ یادتان هست که عرض کردم دو تا «LLM» داریم؟  یکی ماشین یادگیری منطقی بود، اما دیگری، مدل زبانی بزرگ بود. اولی که یادگیری ماشین منطقی باشد، نسل اول است که الآن صحبت شد. نسل سوم که آمد، داده‌محور شد.

شاگرد۲: ریخت درک منطقی را فرمودید نسل سوم چکار کرد؟

استاد: عوض کرد. به جای این‌که منطقی فکر کند، آماری جلو می‌رود. خیلی تفاوت می‌کند که در یک فضایی، مبنای کار شما بر آمار باشد تا مبنای کار شما بر معانی و منطق و استنتاج باشد. این جهت، الآن خیلی اهمیت دارد. این‌ها را که دیدم، مثال‌های قدیمی طلبگی به ذهنم آمد؛ اگر زیج را با هیئت مقایسه کنید؛ مثلاً تشریح الافلاک، سی فصل قوشچی را با مجسطی مقایسه کنید. بشر در رصدخانه چکار کرده؟ یادتان هست که عرض می‌کردم استاد فرمودند من به رصدخانه مراغه رفتم، آقا جان یک حال خوشی به من دست داد که این بنده‌های خدا در دل کوه چه کارها کرده‌اند! رصدخانه مراغه بالای کوه است. خب رصدخانه‌هایی که بوده و امروز هم هست؛ کار رصدخانه چیست؟ کاررصدخانه، نه فلسفه است و حتی نه مستقیماً کار ریاضیاتی است و نه منطقی است. رصدخانه فقط جمع‌آوری اطلاعات است. با ابزاری که دارد، می‌گوید این لحظه طلوع کرد و غروب کرد و این اندازه رفت. زیج، همین است. زیج، آن دیتاهای نجومی را پیاده می‌کند. بعد بشر چکار می‌کند؟ این اندازه‌ای که نگاهش به آسمان است و زیجاتی را آورده، مبنای زیج، بر آمار بوده است. او بعد شروع به الگوسازی می‌کند. الگوسازی قدیم بطلیموسی چه بود؟ می‌گفت زمین، وسط است. از چیزهایی که از دیتاهای زیج کشف کردیم، این بود که نزدیک‌ترین کره به ما، ماه است. بعد، تیر است. بعد ناهید و بعد خورشید و بعد مریخ و بعد مشتری است و بعد زحل است. تا زحل هم که تمام می‌شد و اورانوس و نپتون هم که نداشته‌اند. بعد هم ثوابت است و بعد فلک اطلس که در تشریح الافلاک بود.

شاگرد۲: پردازش اطلاعات را می‌فرمودید.

استاد: بله، کشف الگو. یعنی می‌گوید این داده‌های آماری زیج، به این صورت است و مبتنی بر چنین الگو و مدلی است.

نکته مهم در نسل سوم این است: الآن وقتی نسل سوم آمد، دیگر از راه اطلاعات وسیع که به او دادند، شروع کند به کشف الگو کردن. و لذا مدل زبانی بزرگ چرا بزرگ است؟ چون پارامترهای بسیار زیادی در آن دخالت می‌کند. اما نکته‌ی مهم در بزرگ بودنش، این است که شما اصلاً طبق یک ضابطه منطقی و قواعدی که از پیش تعیین کرده‌اید، جلو نمی‌روید، بلکه شما با یک اطلاعات خام مواجه هستید که مثل یک خزینه در آن می‌ریزید. فقط بر پایه لارج (Big Data/کلان‌داده)، یک اطلاعات وسیع می‌دهید و او شروع می‌کند، اما طبق یک معنا و طبق یک قاعده و ضابطه جلو نمی‌رود، بلکه صرفاً با ضوابط آمار شروع می‌کند و توکن‌گیری می‌کند و بر مبنای آمار جلو می‌رود. هر چه هم جلوتر رفت، بعداً با بردار پیش می‌رود. مبنای توکن (token) بر آمار است. هر متنی را به آن بدهید، به توکن‌ها تجزیه می‌کند و آمارگیری می‌کند. اصلاً کاری با معنا ندارد. بعد هم شروع می‌کند به حدس زدن. بخشی از کار ذهن ما هم همین‌طور است. حالا مدام پیشرفت کرده که بعداً عرض می‌کنم. من وقتی جمله‌ای را عرض می‌کنم، ذهن شما فوری در محور همنشینی تحلیل می‌کند و همنشین‌های آن را حدس می‌زند. مثلاً تا ماشین می‌گویم، شما فوری راننده را حدس می‌زنید، چون می‌بینید راننده به ماشین مربوط است.

شاگرد۱: این به معنایی نزدیک‌تر است تا آماری.

استاد: جالب این است که وقتی آماری کار می‌کند، در ذهن شما نمی‌آید…؛ زبان‌شناس می‌گوید شما که به بچه کلی اطلاعات گوگل را یاد نمی‌دهید! این‌طور ایراد گرفته است. ولی این‌ها الآن انجام داده‌اند. آن‌ها با مختصر یادگیری و پیش‌یادگیری، اطلاعات را به او داده‌اند و بعد او با آمار کار می‌کند. در کل زبان بشر، هر چه به او داده‌اند، نگاه می‌کند تا ببیند در این سندها و جاهایی که ماشین آمده، چند چیز دیگر با آن آمده است. در این همه دیتای وسیع، آمارگیری می‌کند و کلماتی که بیشتر با هم از نظر درصد کاربرد با هم هستند را پیدا می‌کند. خب در اینجا بعداً از صِرف آمار متوجه می‌شود. او اصلاً نمی‌داند ماشین به چه معنا است. او فقط می‌بیند ماشین با راننده در مجموع این همه داده‌ای که به او داده‌اند، خیلی زیاد در سندها آمده است. بدون این‌که بفهمد معنای آن چیست. اینجا از طریق آمار جلو رفته است؛ «LLM»  مدل زبان است. صوریت زبان را هم به آن ضمیمه کنید؛ الآن مدت زمان زیادی نیست که «LCM: Large Concept Models»  را هم اعلام کرده‌اند؛ یعنی مدل مفهومی؛ الآن شروع شده است.

شاگرد۲: وقتی فهمید در کنار ماشین چه کلماتی زیاد استعمال شده، بعد چکار می‌کند؟

استاد: مهم‌ترین چیزی که در اینجا اساس مطلب است تا فهم آن برایتان واضح شود، این است که از مفهوم بردار شروع کنید. بردار یک مفهوم ریاضی است و همه در کلاس‌ها شنیده‌اید، ولی برای درک این فضا که این زبان‌ها چکار می‌کنند، شما باید جبر خطی را بدانید. جبر صفر و یکی را آن آقا آورد و شروع شد. الآن این جبر تنسورها است. به جای جبر صفر و یک، جبر تنسورها است. جبری است که سر و کارش با تنسورها است. وقتی به‌دنبال این بروید، می‌فهمید که دارد چکار می‌کند. بردار به چه صورت است؟ شما الآن دستگاه مختصات در ذهنتان هست؛ محور x و محور y. برای این‌که یک نقطه را در یک صفحه معین کنید، به چند چیز نیاز بود؟ دو چیز نیاز داشتید تا بگویید در محور x، چهارتا جلو برو و در محور y شش تا برو، بعد آن نقطه می‌شود. با دو شناسه و دو چیزی که معرفی می‌کرد، در صفحه، یک نقطه‌ای را تعیین می‌کرد. خب در تک محور اعداد، فقط یک نقطه بود که با یک عدد تعیین می‌شد که می‌گویند تنسور رتبه صفر؛ یک عدد است که نقطه تعیین می‌شود.

اما بردار چیست؟ خیلی مفهوم مهمی است. شروعش هم ساده بوده است. در علم فیزیک، فرمول‌هایی که در جاذبیت و نیرو و مکانیک کلاسیک و حرف‌هایی که نیوتن آورده بود را می‌خواستند جلو ببرند، این بردار آمد و بعد هم خیلی ریاضیاتی و قوی شد. آن وقت یک بردار یک بُعدی و دو بُعدی بود، الآن دیگر در این زبان، با بردارهایی با ابعاد بسیار بالا کار می‌کنند. یعنی شما اول باید تصور ساده بردار را بکنید و بعد با ابعاد بالاتر تصور کنید که اصلاً به شکل ریاضی نمی‌توانید دربیاورید و فقط باید تصور عقلانی کنید. بعد از این‌که بردار معلوم شد، بعد هم ماتریس و بعد از ماتریس هم تنسور آمد. تا جلسه دیگر اگر زنده بودیم مبادی این‌ها را مطالعه کنید. من هم اندازه‌ای که مطالعه کرده‌ام، عرض کردم. بینی و بین الله دیگر سن من اقتضاء این حرف‌ها را ندارد، ولی می‌توانم بهانه شوم و هندل بزنم. طبق اقتضای سن، شما ان شاء الله به دنبالش می‌روید و ملاحظه می‌کنید.

ببینید؛ خصوصیت بردار این است که یک نقطه نیست. نقطه، فقط پایه بردار است. وقتی گفتید در طول محور x شش تا جلو برو و شش تا بالا برو، وقتی به آن نقطه رسیدیم، تازه یک پایه‌ای با عرض از مبدأ و طول از مبدأ پیدا کرده‌اید. هر بردار، دو چیز مقوم دارد: جهت و عدد؛ یعنی مقدار یک بردار و جهت بردار. پایه [یا مبدأ] هم که شروع کارش است. بعد می‌گویید از این پایه با فاصله عدد پنج در جهت خاصی. هر چه شما تعیین کنید؛ مختصات سه بعدی، دو بعدی، یا اگر زمان را در کارش بیاورید چهاربعدی می‌شود، با انواع و اقسام آن. مثال‌های آن را چندین جور یادداشت کرده‌ام.

بنابراین مهم‌ترین کاری که در این نسل جدید انجام شده و لذا مشکل جعبه سیاه پیش آمده؛ مشکل جعبه سیاه این است که او در پردازش‌های خودش و در این‌که شما به آن ورودی می‌دهید و بعد هم می‌بینید جواب‌های خوبی می‌دهد، اما توهم هم دارد. هوش مصنوعی می‌تواند تخیل کند؟ تخیل، می‌تواند قاعده‌مند باشد. مهندسین نرم‌افزار برای تخیل هوش مصنوعی مشکلی ندارند و اصلاً به آن برنامه می‌دهند. اما وقتی به اصطلاح خودشان توهم می‌زند، در توهم، دست مهندس بسته است و هیچ کاری نمی‌تواند بکند؛ به محکمی می‌گوید مطلب این است. اما از کجا در آورده است؟ نمی‌دانند. بعداً وقتی خیلی کار کنید، قدم به قدم نه این‌که مکانیسم کار آن را بفهمید، بلکه قدم به قدم کار آن را کنترل می‌کنید و توضیح‌پذیرش می‌کنید. با زحماتی که کشیده‌اند.

شاگرد۲: در این نسل جدید، مهم‌ترین کاری که شده، توضیح‌پذیر بودن است؟

استاد: در نسل جدید، بر مبنای آمار، الگوهایی کشف می‌شود که چه بسا اصلاً بشر هم کشف نکرده‌. ولذا من برای لغت و اشتقاق گفتم که خیلی پرفایده است. یعنی شما الف و باء و کاربرد و آمارش را به این مدل زبانی می‌دهید و همه اطلاعات اشتقاق کبیر را به آن می‌دهید، خودش فقط با آمار شروع می‌کند و کشف الگو می‌کند. الگوهایی که چه بسا بعداً می‌بینید درست هم هست؛ الگوهای زبانی خیلی عالی. این نسل سوم است. یعنی «based statistical»؛ بر پایه و محور آمار جلو می‌رود و کاری به معانی ندارد. فقط با عدد، آمارگیری می‌کند؛ تعداد آمارها و بعد با بردار، «embedding» (تعبیه برداری) می‌کند. مهم‌ترین فنی که الآن خیلی کارساز بوده، همین است که کلمات را توکن‌بندی می‌کنند و در بردارهایی با بُعد زیاد، جهت‌دهی معنایی می‌کنند؛ جهت‌دهی معنایی اما بر مبنای آمار. این نسل سوم است. یعنی بردارهایی است که تعیین می‌کند این کلمات نزدیک هم هستند-درست هم می‌گوید- اما نه این‌که معنا را درک کرده باشد و صرفاً با آمار جلو می‌رود.