نسل سوم هوش مصنوعی و روش دادهمحوری
{00:28:54}
شاگرد۲: این مرحله سوم است؟
استاد: مرحله سوم جور دیگری است که الآن میخواهم عرض کنم.
شاگرد۲: قبل از مرحله سوم چکار میکند؟ فرمودید که نمیتوانند بفهمند چکار میکند، اما آن را بخش بخش میکنند؟
استاد: نسل سوم که خیلی مهم است، این است که اصلاً ریخت درک منطقی…؛ یادتان هست که عرض کردم دو تا «LLM» داریم؟ یکی ماشین یادگیری منطقی بود، اما دیگری، مدل زبانی بزرگ بود. اولی که یادگیری ماشین منطقی باشد، نسل اول است که الآن صحبت شد. نسل سوم که آمد، دادهمحور شد.
شاگرد۲: ریخت درک منطقی را فرمودید نسل سوم چکار کرد؟
استاد: عوض کرد. به جای اینکه منطقی فکر کند، آماری جلو میرود. خیلی تفاوت میکند که در یک فضایی، مبنای کار شما بر آمار باشد تا مبنای کار شما بر معانی و منطق و استنتاج باشد. این جهت، الآن خیلی اهمیت دارد. اینها را که دیدم، مثالهای قدیمی طلبگی به ذهنم آمد؛ اگر زیج را با هیئت مقایسه کنید؛ مثلاً تشریح الافلاک، سی فصل قوشچی را با مجسطی مقایسه کنید. بشر در رصدخانه چکار کرده؟ یادتان هست که عرض میکردم استاد فرمودند من به رصدخانه مراغه رفتم، آقا جان یک حال خوشی به من دست داد که این بندههای خدا در دل کوه چه کارها کردهاند! رصدخانه مراغه بالای کوه است. خب رصدخانههایی که بوده و امروز هم هست؛ کار رصدخانه چیست؟ کاررصدخانه، نه فلسفه است و حتی نه مستقیماً کار ریاضیاتی است و نه منطقی است. رصدخانه فقط جمعآوری اطلاعات است. با ابزاری که دارد، میگوید این لحظه طلوع کرد و غروب کرد و این اندازه رفت. زیج، همین است. زیج، آن دیتاهای نجومی را پیاده میکند. بعد بشر چکار میکند؟ این اندازهای که نگاهش به آسمان است و زیجاتی را آورده، مبنای زیج، بر آمار بوده است. او بعد شروع به الگوسازی میکند. الگوسازی قدیم بطلیموسی چه بود؟ میگفت زمین، وسط است. از چیزهایی که از دیتاهای زیج کشف کردیم، این بود که نزدیکترین کره به ما، ماه است. بعد، تیر است. بعد ناهید و بعد خورشید و بعد مریخ و بعد مشتری است و بعد زحل است. تا زحل هم که تمام میشد و اورانوس و نپتون هم که نداشتهاند. بعد هم ثوابت است و بعد فلک اطلس که در تشریح الافلاک بود.
شاگرد۲: پردازش اطلاعات را میفرمودید.
استاد: بله، کشف الگو. یعنی میگوید این دادههای آماری زیج، به این صورت است و مبتنی بر چنین الگو و مدلی است.
نکته مهم در نسل سوم این است: الآن وقتی نسل سوم آمد، دیگر از راه اطلاعات وسیع که به او دادند، شروع کند به کشف الگو کردن. و لذا مدل زبانی بزرگ چرا بزرگ است؟ چون پارامترهای بسیار زیادی در آن دخالت میکند. اما نکتهی مهم در بزرگ بودنش، این است که شما اصلاً طبق یک ضابطه منطقی و قواعدی که از پیش تعیین کردهاید، جلو نمیروید، بلکه شما با یک اطلاعات خام مواجه هستید که مثل یک خزینه در آن میریزید. فقط بر پایه لارج (Big Data/کلانداده)، یک اطلاعات وسیع میدهید و او شروع میکند، اما طبق یک معنا و طبق یک قاعده و ضابطه جلو نمیرود، بلکه صرفاً با ضوابط آمار شروع میکند و توکنگیری میکند و بر مبنای آمار جلو میرود. هر چه هم جلوتر رفت، بعداً با بردار پیش میرود. مبنای توکن (token) بر آمار است. هر متنی را به آن بدهید، به توکنها تجزیه میکند و آمارگیری میکند. اصلاً کاری با معنا ندارد. بعد هم شروع میکند به حدس زدن. بخشی از کار ذهن ما هم همینطور است. حالا مدام پیشرفت کرده که بعداً عرض میکنم. من وقتی جملهای را عرض میکنم، ذهن شما فوری در محور همنشینی تحلیل میکند و همنشینهای آن را حدس میزند. مثلاً تا ماشین میگویم، شما فوری راننده را حدس میزنید، چون میبینید راننده به ماشین مربوط است.
شاگرد۱: این به معنایی نزدیکتر است تا آماری.
استاد: جالب این است که وقتی آماری کار میکند، در ذهن شما نمیآید…؛ زبانشناس میگوید شما که به بچه کلی اطلاعات گوگل را یاد نمیدهید! اینطور ایراد گرفته است. ولی اینها الآن انجام دادهاند. آنها با مختصر یادگیری و پیشیادگیری، اطلاعات را به او دادهاند و بعد او با آمار کار میکند. در کل زبان بشر، هر چه به او دادهاند، نگاه میکند تا ببیند در این سندها و جاهایی که ماشین آمده، چند چیز دیگر با آن آمده است. در این همه دیتای وسیع، آمارگیری میکند و کلماتی که بیشتر با هم از نظر درصد کاربرد با هم هستند را پیدا میکند. خب در اینجا بعداً از صِرف آمار متوجه میشود. او اصلاً نمیداند ماشین به چه معنا است. او فقط میبیند ماشین با راننده در مجموع این همه دادهای که به او دادهاند، خیلی زیاد در سندها آمده است. بدون اینکه بفهمد معنای آن چیست. اینجا از طریق آمار جلو رفته است؛ «LLM» مدل زبان است. صوریت زبان را هم به آن ضمیمه کنید؛ الآن مدت زمان زیادی نیست که «LCM: Large Concept Models» را هم اعلام کردهاند؛ یعنی مدل مفهومی؛ الآن شروع شده است.
شاگرد۲: وقتی فهمید در کنار ماشین چه کلماتی زیاد استعمال شده، بعد چکار میکند؟
استاد: مهمترین چیزی که در اینجا اساس مطلب است تا فهم آن برایتان واضح شود، این است که از مفهوم بردار شروع کنید. بردار یک مفهوم ریاضی است و همه در کلاسها شنیدهاید، ولی برای درک این فضا که این زبانها چکار میکنند، شما باید جبر خطی را بدانید. جبر صفر و یکی را آن آقا آورد و شروع شد. الآن این جبر تنسورها است. به جای جبر صفر و یک، جبر تنسورها است. جبری است که سر و کارش با تنسورها است. وقتی بهدنبال این بروید، میفهمید که دارد چکار میکند. بردار به چه صورت است؟ شما الآن دستگاه مختصات در ذهنتان هست؛ محور x و محور y. برای اینکه یک نقطه را در یک صفحه معین کنید، به چند چیز نیاز بود؟ دو چیز نیاز داشتید تا بگویید در محور x، چهارتا جلو برو و در محور y شش تا برو، بعد آن نقطه میشود. با دو شناسه و دو چیزی که معرفی میکرد، در صفحه، یک نقطهای را تعیین میکرد. خب در تک محور اعداد، فقط یک نقطه بود که با یک عدد تعیین میشد که میگویند تنسور رتبه صفر؛ یک عدد است که نقطه تعیین میشود.
اما بردار چیست؟ خیلی مفهوم مهمی است. شروعش هم ساده بوده است. در علم فیزیک، فرمولهایی که در جاذبیت و نیرو و مکانیک کلاسیک و حرفهایی که نیوتن آورده بود را میخواستند جلو ببرند، این بردار آمد و بعد هم خیلی ریاضیاتی و قوی شد. آن وقت یک بردار یک بُعدی و دو بُعدی بود، الآن دیگر در این زبان، با بردارهایی با ابعاد بسیار بالا کار میکنند. یعنی شما اول باید تصور ساده بردار را بکنید و بعد با ابعاد بالاتر تصور کنید که اصلاً به شکل ریاضی نمیتوانید دربیاورید و فقط باید تصور عقلانی کنید. بعد از اینکه بردار معلوم شد، بعد هم ماتریس و بعد از ماتریس هم تنسور آمد. تا جلسه دیگر اگر زنده بودیم مبادی اینها را مطالعه کنید. من هم اندازهای که مطالعه کردهام، عرض کردم. بینی و بین الله دیگر سن من اقتضاء این حرفها را ندارد، ولی میتوانم بهانه شوم و هندل بزنم. طبق اقتضای سن، شما ان شاء الله به دنبالش میروید و ملاحظه میکنید.
ببینید؛ خصوصیت بردار این است که یک نقطه نیست. نقطه، فقط پایه بردار است. وقتی گفتید در طول محور x شش تا جلو برو و شش تا بالا برو، وقتی به آن نقطه رسیدیم، تازه یک پایهای با عرض از مبدأ و طول از مبدأ پیدا کردهاید. هر بردار، دو چیز مقوم دارد: جهت و عدد؛ یعنی مقدار یک بردار و جهت بردار. پایه [یا مبدأ] هم که شروع کارش است. بعد میگویید از این پایه با فاصله عدد پنج در جهت خاصی. هر چه شما تعیین کنید؛ مختصات سه بعدی، دو بعدی، یا اگر زمان را در کارش بیاورید چهاربعدی میشود، با انواع و اقسام آن. مثالهای آن را چندین جور یادداشت کردهام.
بنابراین مهمترین کاری که در این نسل جدید انجام شده و لذا مشکل جعبه سیاه پیش آمده؛ مشکل جعبه سیاه این است که او در پردازشهای خودش و در اینکه شما به آن ورودی میدهید و بعد هم میبینید جوابهای خوبی میدهد، اما توهم هم دارد. هوش مصنوعی میتواند تخیل کند؟ تخیل، میتواند قاعدهمند باشد. مهندسین نرمافزار برای تخیل هوش مصنوعی مشکلی ندارند و اصلاً به آن برنامه میدهند. اما وقتی به اصطلاح خودشان توهم میزند، در توهم، دست مهندس بسته است و هیچ کاری نمیتواند بکند؛ به محکمی میگوید مطلب این است. اما از کجا در آورده است؟ نمیدانند. بعداً وقتی خیلی کار کنید، قدم به قدم نه اینکه مکانیسم کار آن را بفهمید، بلکه قدم به قدم کار آن را کنترل میکنید و توضیحپذیرش میکنید. با زحماتی که کشیدهاند.
شاگرد۲: در این نسل جدید، مهمترین کاری که شده، توضیحپذیر بودن است؟
استاد: در نسل جدید، بر مبنای آمار، الگوهایی کشف میشود که چه بسا اصلاً بشر هم کشف نکرده. ولذا من برای لغت و اشتقاق گفتم که خیلی پرفایده است. یعنی شما الف و باء و کاربرد و آمارش را به این مدل زبانی میدهید و همه اطلاعات اشتقاق کبیر را به آن میدهید، خودش فقط با آمار شروع میکند و کشف الگو میکند. الگوهایی که چه بسا بعداً میبینید درست هم هست؛ الگوهای زبانی خیلی عالی. این نسل سوم است. یعنی «based statistical»؛ بر پایه و محور آمار جلو میرود و کاری به معانی ندارد. فقط با عدد، آمارگیری میکند؛ تعداد آمارها و بعد با بردار، «embedding» (تعبیه برداری) میکند. مهمترین فنی که الآن خیلی کارساز بوده، همین است که کلمات را توکنبندی میکنند و در بردارهایی با بُعد زیاد، جهتدهی معنایی میکنند؛ جهتدهی معنایی اما بر مبنای آمار. این نسل سوم است. یعنی بردارهایی است که تعیین میکند این کلمات نزدیک هم هستند-درست هم میگوید- اما نه اینکه معنا را درک کرده باشد و صرفاً با آمار جلو میرود.
بدون نظر