۲۲. فقه هوش مصنوعی (۱۴۰۴/۰۱/۲۱)
سال تحصیلی (۱۴۰۴-۱۴۰۳) - پنجشنبه، ۲۱ فروردین ماه ۱۴۰۴
- پیشـگفتار(چـکیده)
- تمایز بین هوش اشراقمحور و پایهمحور
- سیر تحلیل هوش پایهمحور با شروع از سختافزار به سمت مبنای باینری
- رد تبعیت تمام تکنیکهای امروزی از ایده فلسفی
- شروع نسل اول هوش مصنوعی با جبر صفر و یکی
- نسل دوم هوش مصنوعی با جبر خطی
- یادگیری عمیق و مشکل جعبه سیاه در هوش مصنوعی
- نسل سوم هوش مصنوعی و روش دادهمحوری
- تنظیر توضیحناپذیری هوش مصنوعی به پرنده هدهد
پیشـگفتار(چـکیده)
موضوعات مطروحه در جلسه:
مروری بر سیر تحلیل هوش پایهمحور و معرفی نسلهای مختلف هوش مصنوعی،
تبیین مشکل جعبه سیاه در هوش مصنوعی، هوش مصنوعی دادهمحور،
روش آماری در هوش مصنوعی، یادگیری عمیق و توضیح ناپذیری در هوش مصنوعی
تمایز بین هوش اشراقمحور و پایهمحور
قرار شد مباحثه را سه بخش کنیم. بخش اول مسأله مهم تمایز بین هوش اشراقمحور با پایهمحور است. با تلاشهایی که در آینده صورت میگیرد، برای نوع انسان واضح میشود که امتیاز انسان، دارا بودن روح و نفس مجرده است؛ نفسی که از عالم دیگر آمده است؛ این برای نوع بشر واضح میشود. الآن به گمانم هنوز آنچنان در محافل جمعی و عقل جمعی بشر واضح نیست، ولی مبادی آن فراهم است؛ یعنی زحمت کشیده بشود که این جاهای خاص را نشان بدهند و تفاوتهای آن را به نحو خیلی منحاز نشان بدهد. این بخش اول بود. هر چه هم ممکن بود، از آن صحبت کردیم. در ادامه هم هر چه شما به نکتهای در توضیحش برخورد کردید، حتماً بفرمایید. پرونده بخش اول همینطور مفتوح است. عرض کردم رویکرد و روشی که میخواهیم اعمال کنیم، بیشتر روشی است که نمیخواهیم حالت تفلسف و اثبات کردن داشته باشد، بلکه میخواهیم بیشتر حالت ارائه شهودات وجدانی داشته باشد و همانطور که عرض کردم طوری باشد که چشمِ ذهن ببیند، نه اینکه ذهن، با استدلال قانع شود. خیلی تفاوت است بین جایی که چشم ذهن چیزی را میبیند با اینکه ذهن با اثبات برهانی قانع شود. مقصود ما در بخش اول، بیشتر آن است.
سیر تحلیل هوش پایهمحور با شروع از سختافزار به سمت مبنای باینری
بخش دوم این بود: بعد از فراغ از اینکه ما بین اشراقمحور و پایهمحور تفاوت گذاشتیم، حالا بیاییم هوش پایهمحور را دقیق تحلیل کنیم و به آن آگاهی کامل پیدا کنیم به نحوی که وقتی میخواهیم برای آن حکم فقهی بیاوریم، بدانیم که موضوع چیست و نسبتاً یک دید روشنی از پایهمحور بودنش داشته باشیم.
بخش سوم هم که بیان حکم شرعی بود.
در بخش دوم برای مباحثه ما یک مسیری طی شد. اگر نظرتان باشد، برای اینکه توضیح بدهم که این هوش پایهمحور چیست، از همان دل سختافزار شروع کردیم و مسیری را جلو آمدیم. دیدم بعضی از اساتید تذکری داده بودند که به گمانم در مباحثه ما انجام شده است. فرمایشات اساتید در مباحثههای هوش مصنوعی را ارسال کرده بودند؛ دیدم تذکر داده بودند که رئالیستی رفتار کنید، یعنی روی فروض و قضایای شرطیه جلو نروید و به این شکل که اگر آگاهی داشت، اگر قصد داشت حکمش چیست و … جلو نروید. بگویید این کارهایی که انجام میشود، جایز هست یا جایز نیست؟ احکامش چیست؟ این کارها بشود یا نشود؟ یکی هم این است که آنچه که هست را بگویید. در این فاصله که مباحثه کردیم، هیچ وقت دنبال این نرفتیم که بگوییم اگر هوش داشت و اگر قصد داشت.
از روزهای اول عرض کردم، قصد و آگاهیهای با روش فلسفه ذهن و هوش قوی و ... اصلاً مورد بحث ما نبود. مکرر عرض کردم که من روی پایهمحور تأکید میکنم به این جهت که متمحض و متبلور در رئالیستی است. یعنی در چنین فضایی که جلو میرویم، آنچه که الآن هست و واضح است و دارد انجام میشود و مهندسهای نرمافزار با آن سر و کار دارند، داریم حکم همین را میگوییم، نه اینکه اگر فلان طور شد، بعداً بگوییم حکم فقهیاش چیست. همه تلاش ما در این بخش دوم همین است که آنچه که دارد میگذرد و آنچه که الآن هست را ببینیم حکمش چیست و اگر ما میگوییم قصد پایهمحور، یک امر مبهم انیاب اغوال بهصورت قضیه شرطیه نباشد و بدانیم داریم چه میگوییم و بدانیم الآن در فرایند قصد پایهمحور چه میگذرد. این مقصود ما در بخش دوم بوده است. حالا با توضیحاتی که عرض میکنم.
در این فرایندی که آمدیم، اول عرض کردم اساس اینکه کامپیوتر پدید آمد و رشد کرد، این بود که عدد در مبنای دودویی -باینری- جلو رفت و شروع به پیشرفت کرد. اگر عدد در مبنای دو -صفر و یکی- نبود، اینها نبود. البته فهرستوار عرض میکنم. ولی چیزی که بسیار مهم بود و اگر آن نبود، کامپیوتر نبود -یعنی از نظر وزن علمی مهم بود- کاری بود که شانون کرد - که با تورینگ معاصر بود - او جبر صفر و یکی را وارد کامپیوتر کرد. عدد صفر و یک با جبر صفر و یکی -جبر بولی- خیلی متفاوت است. اینها را عرض کردم. جبری که متغیرهای آن فقط یکی از صفر یا یک را قبول میکند؛ این جبر صفر و یکی است؛ جبر دو ارزشی است. او بهترین استفاده را از این جبر کرد. جبر را کنار باینری آورد. 0 و 1 بهعنوان یک عدد، بهعنوان رقمی که عددی را میرساند، یک هویت مقولی دارد. شما الآن میگویید صفر و یک؛ یک درکی دارید که در ذهن شما روشن است؛ همانطور که از اعداد دو و سه و پنج و … یک درک مقولی و هویت مفهومی در ذهنتان میآید. اما اگر بگویم «صحیح - غلط» مفهومی واضح در ذهنتان میآید، اما یک هویت ندارد. هویت «صحیح» چیست؟ شما بیان کنید. میگویید «یک»، یک هویت مفهومی دارد که یک عدد است. میگویید «انسان» یا سائر مقولات، اینها یک مفاهیمی هستند که هویت دارند. حالا یا شخصیتی پیشین یا پسین. اما وقتی میگویم «صحیح»، مفهوم خیلی روشنی دارد ولی این مفهوم چه هویتی را ارائه میکند؟ هویتی ارائه نمیکند. چرا؟ چون اصلاً ریختش، نسبت است. صحیح یعنی آنچه که مطابق واقع است و دارد نسبت مطابقت یک قضیه و یک ایده را با واقع بیان میکند. صحیح یعنی مطابق واقع و درست. ببینید؛ هویت ندارد.
بنابراین در چنین فضایی جبر صفر و یکی، معنا را -نه معنای هویتدار مثل عدد صفر و یک- که در حیطه روابط و نسب است، داخل کرد. این گام بسیار مهمی بود که جبر آمد و نقش ایفاء کرد.
رد تبعیت تمام تکنیکهای امروزی از ایده فلسفی
جلوتر عرض کردم؛ گفته میشود که خیلی از تکنیکهای امروزی تبلور و تجسم یک ایده فلسفی است. جلوترها هم عرض کردم که اندازهای که من میفهمم، در ذهنم صاف نمیشود. اتفاقاً مهندسین نرمافزار، یا کلاً مهندسین از اول عالَم، آن کسی و چیزی که برای مهندس کار انجام میدهد ریاضیدان و ریاضیات است. اوست که دارد کار انجام میدهد. فیلسوف اصلاً برای مهندس کار انجام نمیدهد. خود کلمه مهندس، اسم فاعل از هندسه است. اقلیدس یک کتاب هندسی نوشت و سایر مهندسین کتاب نوشتند و یک ابزار ریاضی به دست مهندسین دادند. حالا آن چیست؟ یک خطکش دست میگرفتند؛ خطکش و پرگار کهکشانپیما؛ اقیانوسپیما. مهندس همین است. یعنی ریاضیات و یکی از شعب ریاضی که هندسه است، برای مهندس یک ابزاری را فراهم میکند که با این ابزار ریاضی کارش را جلو میبرد؛ اینکه فلاسفه چه میگویند و نقطه چیست و خط چیست و تعریفش چیست و اصلاً هست یا نیست؛ اصلاً کاری با اینها ندارد. نه هندسه در بند آن بحثهای فلسفی است و نه مهندس وقتی میخواهد با ابزار هندسه طول چیزی را اندازه بگیرد یا فاصله زمین تا خورشید را اندازه بگیرد، در بند آنها است. تشابه، مهمترین ابزار کهکشانپیما و اقیانوسپیمای مهندسین است؛ آن هم در فضای هندسی؛ فضای سه بُعدی.
خب ببینید؛ الآن هم همینطور است. واقعاً به این صورت است. هر چه هم فکرش را میکنم، اینجور به ذهنم میآید. یعنی در زمان ما و این صد سالی که گذشت، یک ایده فلسفی نیامد به اینها بگوید بروید بهدنبال هوش مصنوعی و آن را بهعنوان یک تکنیک، تکنولوژی و صنعت بیاورید. ابزار ریاضی فراهم شد و این تکنیک پیش رفت. الآن هم مهندسین نرمافزار، کاری با فلسفه ذهن و … ندارند. آنها دارند کار خودشان را میکنند. یک فضایی برای خودشان است.
شروع نسل اول هوش مصنوعی با جبر صفر و یکی
خب ابزار این فضا از کجا میآید؟ عدد باینری، یک ابزار ریاضیاتی بسیار قوی به دست مهندسین داد. این کاری به فلسفه ندارد. عدد باینری را فلاسفه باید به آنها بدهند؟ نه. بعدش کلود شانون آمد جبر صفر و یکی را آورد و محاسبات نمادین را شروع کرد. نسل اول هوش مصنوعی -هوش مصنوعی نمادین- با کار او شروع شد که جبر صفر و یکی وارد فضا شد و از آن استفاده کردند. جبر است؛ جبر که فلسفه نیست. جبر، سرآمد شعب ریاضیات است. میتوانید فلسفه جبر داشته باشید، اما خود جبر، پیشرفت جبر و کار جبری کردن، ربطی به تفلسف ندارد و جای خودش است. این، ابزار تهیه میکند و به دست مهندس میدهد.
نسل دوم هوش مصنوعی با جبر خطی
الآن زمان ما، بهخصوص در سه-چهار سال اخیر که پیشرفت عجیبی شد، دوباره این جبر خطی را وارد فضا کردند. جبر خطی آمد و الآن شما مدام از آن سؤال میپرسید و جواب میدهد. همین چند سال آمد، خیلی عمر طولانیای ندارد. شروعش شاید پانزده-شانزده سال بشود، اما پیشرفتهای خیلی بزرگش برای همین چند سال اخیر است. جبر خطی به فضای همین هوش مصنوعی آمد. با آمدن جبر خطی، دوباره یک هنگامهای به پا شد. مهندس نرمافزار، کاری ندارد که فلسفه ذهن و نماد و … چیست. او میبیند که الآن جبر خطی یک ابزار خوبی به دستش میدهد و با این ابزار ریاضی کارش را جلو میبرد. ابزار، نیاز است. خود دکارت وقتی مختصات دکارتی را طراحی کرد -محور x و y؛ مختصات دو بعدی کارتزین- یک کار ریاضیاتی کرد. دکارت در اینجا فیلسوف نبود. بگویید دکارت فیلسوف بود، حرف زد، چه ایدههایی داشت و …، هر چه بگویید، کاری که دکارت در ابداع و ارائه محور مختصات که هندسه تحلیلی با آن عظمت بعداً مدام پیشرفت کرد، این ابزار ریاضیاتی بود؛ تفلسف نکرد. این چیزی است که من میفهمم.
الآن هم همینطور است. الآن هم در بخش دوم مباحثه، تمام همّ ما این است که این ابزارها را شناسایی کنیم. ببینیم در علوم پایه چه ابزاری فراهم کردند؛ شما هم بهعنوان طلبه هر چه روی اینها مطالعه کنید، خوب است. البته نه بهصورت حجیم، ولی برنامهریزی کنید و مدیریت زمان کنید تا هر هفته ببینید یک مقداری پیش رفتهاید. اگر من یک کلمه از جبر خطی بلد نیستم، اما با هفتهای نیم ساعت وقت گذاشتن، بعد از پنج-شش ماه میبینم دیگر یاد گرفتهام. علی ای حال، جبر خطی در این زمان بسیار اهمیت دارد. جبر بردارها است، جبر تنسورها است، جبر ماتریسها است.
شاگرد۱: اینکه به فلسفه کاری ندارند، آیا بهصورت خودآگاه و اختیاری کاری ندارند، یا در ناخودآگاهشان مبانی فلسفی وجود دارد؟
استاد: ببینید اصلاً ممکن نیست کسی کاری را بدون تفلسف شروع کند. قبلاً هم این را عرض کردم. من که منکر این نیستم. هر چه هم میخواهید کار فلسفی انجام بدهید، من مشکلی ندارم. من میخواهم قاطی نشود. یعنی آن جایی که یک ابزار ریاضی برای مهندس فراهم شده و دارد جلو میرود، شما بگویید اینجا یک ایده فلسفی فعال است، نه، اینطور نیست. بله، ناخودآگاه، ایدههای فلسفی دارد کار میکند، اما آنچه که موتور کار است، تفلسف نیست و آنچه که موتور کار است، فراهم شدن یک ابزار ریاضی است. الآن اینها دارد جلو میرود.
اتفاقاً شاهد عرض من هم همین نسل دوم هوش مصنوعی است. اگر مدام میگفتند هوش مصنوعی تجسم یک ایده فلسفی است، نسل دوم هوش مصنوعی که آمد، به گمانم آشکارا دارد میگوید که این حرف درست نیست. نسل دوم چه بود؟ جلوتر هم صحبتش شد. نسل اول همان نمادگرائی بود که طبق ضوابط و قانونهایی که بود، قانونمند جلو میرفت. اشکالاتی هم درایفوس به مبانی آنها. یکی از اشکالاتی که میخواستند مطلب را سر برسانند، مشکل چارچوب بود. یعنی وقتی صحنه عوض میشود و یک انتقال میخواهد صورت بگیرد، چه چیزهایی باقی میماند و چه چیزهایی متغیر میشود. خب این یکی بود. نسل دوم هوش مصنوعی که آمد، با یک فاصله کوتاهی نسل سوم آمد. خود نسل دوم یک مرحله ابتدائی داشت؛ هوش مصنوعی که یک زمستان داشت، بهارش که شروع شد، یک مرتبه اول داشت که یادگیری ساده بود. گام بعدی آن با یک پیشرفتی، یادگیری عمیق پیش آمد (Deep learning). وقتی این پیش آمد، با مشکل جدیدی روبهرو شدند.
شاگرد۲: نسل اول و دوم چه بود؟ بعد از نمادگرایی چه شد؟
استاد: یادگیری ساده بود. نسل دوم آن وقتی است که دیگر نمادگرایی کنار رفت و اتصالگرائی آمد. یعنی سعی کردند ادای فضای شبکه عصبی انسان را درآورند؛ این ابتدای نسل دوم است. یعنی کلاً نمادگرایی و قاعدهمحور بودن کنار رفت و دقیقاً شبکههای عصبی را پیاده کردند؛ ببینند که خدای متعال شبکههای عصبی را در دماغ انسان چطور قرار داده است و چطور دارد کار میکند، کار آن را پیاده کنند. چرا؟ چون قبلی شکست خورد. برای نسل اول، خیلی پول داده بودند، اما به نتیجه نرسید و کارها هم ماند. بودجه ها را قطع کردند. تعبیر میکنند به زمستان. این خودش آتش زیر خاکستر بود؛ خودشان مشغول بودند تا کمکم در رده بعدی، نسل دوم آمد. نسل دوم همان شبکههای عصبی بود. سادهترین شبکه عصبی بود.
یادگیری عمیق و مشکل جعبه سیاه در هوش مصنوعی
مرحله دوم، یادگیری عمیق بود. یک مشکلی هم که الآن هست، مشکل جعبه سیاه است. الآن خیلی مهم است و دارند خیلی روی آن کار میکنند؛ «Black-box problem». این جعبه سیاه، شاهد عرض من است که تفلسف و ایده فلسفی، پشت کار پیشرفت اینها نیست.
الآن میخواهند کار شبکه عصبی را و نورونهای عصبی را شبیهسازی کنند و پیاده کنند، این فلسفه است؟! من به گمانم اصلاً فلسفه نیست. در مهندسی نرمافزار میبیند که شبکههای عصبی رفتارشان به چه صورت است تا همان را پیاده کنند. اینجا اصلاً فلسفه نیست. او اصلاً کاری با فلسفه ندارد. آنجا یک رفتاری را میخواهد از نورونها ببیند و آن را پیاده کند. مرحله اولش ساده بود؛ نورونهای سادهای که تنها یک لایه دارد: ورودی و لایه پردازش و خروجی. به این، سادهترین پردازش شبکه سلول عصبی میگویند. ورودی و یک لایه پردازش و خروجی.
شاگرد۳: این متوقف بر این است که معرفت را یک امر مجرد بدانیم.
استاد: اصلاً متوقف بر اینها نیست. مثال بزنم؛ مثلاً نانوتکنولوژی که الآن کار میکنند، چقدر مبتنی بر تفلسف است؟! ذهنمان را دور نبریم. فیزیک خیلی نزدیک به تفلسف است. از علومی که خیلی دور از تفلسف است -نمیگویم نیست - شیمی است. روال کارهای شیمی و تحقیقاتی که دارند، تفلسف ندارد؛ میخواهم غلبه را بگویم. الآن نانوتکنولوژی مرتب دارد کار میکند - ذرات را مهندسی میکنند و مواد با خواص مختلف پدید میآید - فلسفه این چیست؟ شما بگویید.
شاگرد۳: بله، ممکن است از فلسفه دور باشد، اما باید ببینیم معرفت چطور است. چون میخواهد بشناسد.
استاد: ما کاری به معرفت نداریم. ما میخواهیم بگوییم یک شبکه نورونی با پیامهای شیمیایی و الکتریکی چکار میکند. یک نورون عصبی، ورودی دارد و خروجی دارد. چکار میکند؟ شما میگویید معرفت چیست، درحالیکه کاری به معرفت ندارد. دارد میگوید این عملکرد یک نورون است. بعداً عرض میکنم که مشکل جعبه سیاه چیست.
شاگرد۳: پیشفرض آنها این است که آگاهی از همین نورونها به وجود میآید
استاد: نه، شما به قدمهای آخر نروید. اگر من توضیح آن را عرض کنم، میبینید که آنچه که میگویید، چه آخر کار وحشتناکی است؛ برای خودش یک چیزی است. ابتدا همین است: او میخواهد کار یک نورون را شبیهسازی کند. نسل دوم این است.
شاگرد۲: این قدم اولش بود.
استاد: این قدم ساده اول بود. «Deep Learning» یا یادگیری عمیق است. آموزش، مرتبه بعدی است که عرض میکنم. یادگیری عمیق چیست؟ لایهها، متعدد میشود. یعنی وقتی ورودی وارد میشود، مثلاً در ده لایه، پردازش میآید تا خروجی دربیاید. اینجا وقتی یادگیری عمیق پیش آمد، یعنی الآن مهندسین با ابزار شبیهسازی شبکه عصبی و نورونهای مغزی، پردازشی عمیق درست کردهاند. یعنی ورودیای که به آن میدادند، چند لایه پردازش میشد و بعد، خروجی میداد. اینجا بود که مشکل جعبه سیاه پیش آمد. یعنی مکانیسم اینکه چرا جواب داد، برای آنها مخفی است. جعبه سیاه، یعنی نمیدانند که چه گذشت. جعبه شیشهای و سفید و اینها نیست. الآن این را جلو برویم، تا بعد به آگاهی برسیم. این الآن برایشان خیلی ناخوشایند است. آقا هم میگفت یک جوابهای با اطمینانی میدهد، دیدم خودشان نمیتوانند برگردند و ببینند چرا این کارها را میکند. مهندس آمده در نسل سوم و بعد، نسل چهارم «Deep Learning» کرده، کار خودش را انجام میدهد و شروع میکند به او داده میدهد. آن هم حسابی جواب میدهد؛ یک جاهایی جوابهای خوبی میدهد و یک جاهایی هم با اطمینان، جوابهای غلط میدهد که از خودش درآورده است. میگویند توهم زده است. خود مهندسین میگویند ماشین توهم زده است، چرا؟ نمیدانند.
شاگرد۲: جهتش را نمیدانستهاند
استاد: اصلاً نمیتوانند برگردند و ببینند چکار کردهاند. یعنی در آن درخت تصمیمگیری که یکی را انتخاب میکند، نمیدانند چرا این را انتخاب کرد.
شاگرد۲: این در گام دوم بود؟
استاد: بله، در یادگیری عمیق، مشکل جعبه سیاه پیش آمد.
شاگرد۲: این الآن همان چیزی است که در هوش مصنوعیها سر و کار داریم؟
استاد: بله.
شاگرد۲: اینکه جواب غلط میدهد، همین است؟
استاد: بله، با اطمینان هم جواب غلط میدهد و خود مهندسین هم نمیتوانند آن را تصحیح کنند. در هوش مصنوعی نمادین، برمیگردد و درست میکند و میگوید اینجا اشتباه شد. اما اینجا چون طبق اتصالات شبکه عصبی است، آن هم عمیق، یعنی ما نمیدانیم در لایههای مخفی پردازش چکار کرده که این خروجی را داده، لذا نمیتوانیم برگردیم و بگوییم آن را درست کن. اینجا خیلی زحمت کشیدهاند که چکار کنیم. به این، هوش مصنوعی توضیحناپذیر میگویند. یعنی نمیتوان توضیح داد که چکار کرده است.
الآن دارند کار بسیار مهمی انجام میدهند؛ «xAI» میگویند، یعنی توضیحپذیر؛ میخواهند هوش مصنوعی توضیحناپذیر را توضیحپذیر کنند.
شاگرد۴: نسل سوم چه میشود؟
استاد: نسل سوم همین آموزش عمیق است.
شاگرد۴: منظورتان از نسل سوم همین لایه دوم است؟
استاد: نسلها را که به کار میبرند اصطلاحات مختلفی دارد. فقط باید محتوا را دید. البته اندازهای که من مطالعه کردهام.
شاگرد۴: اینکه با فاصله کوتاهی بعد از نسل دوم، نسل سوم آمد… .
استاد: نسل سوم نه، گفتم مرتبه دوم نسل دوم. مبنای نسل دوم، اتصالگرائی و شبکههای عصبی است. وقتی در فضای شبکههای عصبی وارد میشوید، دیگر سر و کار شما با معنا نیست. اینها را عرض میکنم چون قبلاً گفتیم که یک شبکه معنا درست میکنند. شبکه معنایی که من عرض کردم، دو جور است. الآن یک شبکه معنایی هست که روی همان مبنای قاعدهمحور است که آن، یک جور شبکه درست میکند و قبلاً توضیح آن را عرض کردم. طبق حرفهایی که الآن هست، شبکه معنایی، طور دیگری به پا میشود.
شاگرد۲: الآن این گام دوم را پیش رفتهاند؟ متوجه شدهاند که چرا جواب غلط میدهد؟
استاد: نه، متوجه نمیشوند. اصلاً نخواهند شد. یعنی مشکلی است که نمیتوانند کاری کنند. او خودش پردازش انجام میدهد و آنها نمیتوانند بفهمند چکار کرده است. فقط میتوانند مرحله به مرحله تفکیک کنند و آن را توضیحپذیر کنند؛ «xAI» کنند.
نسل سوم هوش مصنوعی و روش دادهمحوری
شاگرد۲: این مرحله سوم است؟
استاد: مرحله سوم جور دیگری است که الآن میخواهم عرض کنم.
شاگرد۲: قبل از مرحله سوم چکار میکند؟ فرمودید که نمیتوانند بفهمند چکار میکند، اما آن را بخش بخش میکنند؟
استاد: نسل سوم که خیلی مهم است، این است که اصلاً ریخت درک منطقی…؛ یادتان هست که عرض کردم دو تا «LLM» داریم؟ یکی ماشین یادگیری منطقی بود، اما دیگری، مدل زبانی بزرگ بود. اولی که یادگیری ماشین منطقی باشد، نسل اول است که الآن صحبت شد. نسل سوم که آمد، دادهمحور شد.
شاگرد۲: ریخت درک منطقی را فرمودید نسل سوم چکار کرد؟
استاد: عوض کرد. به جای اینکه منطقی فکر کند، آماری جلو میرود. خیلی تفاوت میکند که در یک فضایی، مبنای کار شما بر آمار باشد تا مبنای کار شما بر معانی و منطق و استنتاج باشد. این جهت، الآن خیلی اهمیت دارد. اینها را که دیدم، مثالهای قدیمی طلبگی به ذهنم آمد؛ اگر زیج را با هیئت مقایسه کنید؛ مثلاً تشریح الافلاک، سی فصل قوشچی را با مجسطی مقایسه کنید. بشر در رصدخانه چکار کرده؟ یادتان هست که عرض میکردم استاد فرمودند من به رصدخانه مراغه رفتم، آقا جان یک حال خوشی به من دست داد که این بندههای خدا در دل کوه چه کارها کردهاند! رصدخانه مراغه بالای کوه است. خب رصدخانههایی که بوده و امروز هم هست؛ کار رصدخانه چیست؟ کاررصدخانه، نه فلسفه است و حتی نه مستقیماً کار ریاضیاتی است و نه منطقی است. رصدخانه فقط جمعآوری اطلاعات است. با ابزاری که دارد، میگوید این لحظه طلوع کرد و غروب کرد و این اندازه رفت. زیج، همین است. زیج، آن دیتاهای نجومی را پیاده میکند. بعد بشر چکار میکند؟ این اندازهای که نگاهش به آسمان است و زیجاتی را آورده، مبنای زیج، بر آمار بوده است. او بعد شروع به الگوسازی میکند. الگوسازی قدیم بطلیموسی چه بود؟ میگفت زمین، وسط است. از چیزهایی که از دیتاهای زیج کشف کردیم، این بود که نزدیکترین کره به ما، ماه است. بعد، تیر است. بعد ناهید و بعد خورشید و بعد مریخ و بعد مشتری است و بعد زحل است. تا زحل هم که تمام میشد و اورانوس و نپتون هم که نداشتهاند. بعد هم ثوابت است و بعد فلک اطلس که در تشریح الافلاک بود.
شاگرد۲: پردازش اطلاعات را میفرمودید.
استاد: بله، کشف الگو. یعنی میگوید این دادههای آماری زیج، به این صورت است و مبتنی بر چنین الگو و مدلی است.
نکته مهم در نسل سوم این است: الآن وقتی نسل سوم آمد، دیگر از راه اطلاعات وسیع که به او دادند، شروع کند به کشف الگو کردن. و لذا مدل زبانی بزرگ چرا بزرگ است؟ چون پارامترهای بسیار زیادی در آن دخالت میکند. اما نکتهی مهم در بزرگ بودنش، این است که شما اصلاً طبق یک ضابطه منطقی و قواعدی که از پیش تعیین کردهاید، جلو نمیروید، بلکه شما با یک اطلاعات خام مواجه هستید که مثل یک خزینه در آن میریزید. فقط بر پایه لارج (Big Data/کلانداده)، یک اطلاعات وسیع میدهید و او شروع میکند، اما طبق یک معنا و طبق یک قاعده و ضابطه جلو نمیرود، بلکه صرفاً با ضوابط آمار شروع میکند و توکنگیری میکند و بر مبنای آمار جلو میرود. هر چه هم جلوتر رفت، بعداً با بردار پیش میرود. مبنای توکن (token) بر آمار است. هر متنی را به آن بدهید، به توکنها تجزیه میکند و آمارگیری میکند. اصلاً کاری با معنا ندارد. بعد هم شروع میکند به حدس زدن. بخشی از کار ذهن ما هم همینطور است. حالا مدام پیشرفت کرده که بعداً عرض میکنم. من وقتی جملهای را عرض میکنم، ذهن شما فوری در محور همنشینی تحلیل میکند و همنشینهای آن را حدس میزند. مثلاً تا ماشین میگویم، شما فوری راننده را حدس میزنید، چون میبینید راننده به ماشین مربوط است.
شاگرد۱: این به معنایی نزدیکتر است تا آماری.
استاد: جالب این است که وقتی آماری کار میکند، در ذهن شما نمیآید…؛ زبانشناس میگوید شما که به بچه کلی اطلاعات گوگل را یاد نمیدهید! اینطور ایراد گرفته است. ولی اینها الآن انجام دادهاند. آنها با مختصر یادگیری و پیشیادگیری، اطلاعات را به او دادهاند و بعد او با آمار کار میکند. در کل زبان بشر، هر چه به او دادهاند، نگاه میکند تا ببیند در این سندها و جاهایی که ماشین آمده، چند چیز دیگر با آن آمده است. در این همه دیتای وسیع، آمارگیری میکند و کلماتی که بیشتر با هم از نظر درصد کاربرد با هم هستند را پیدا میکند. خب در اینجا بعداً از صِرف آمار متوجه میشود. او اصلاً نمیداند ماشین به چه معنا است. او فقط میبیند ماشین با راننده در مجموع این همه دادهای که به او دادهاند، خیلی زیاد در سندها آمده است. بدون اینکه بفهمد معنای آن چیست. اینجا از طریق آمار جلو رفته است؛ «LLM» مدل زبان است. صوریت زبان را هم به آن ضمیمه کنید؛ الآن مدت زمان زیادی نیست که «LCM: Large Concept Models» را هم اعلام کردهاند؛ یعنی مدل مفهومی؛ الآن شروع شده است.
شاگرد۲: وقتی فهمید در کنار ماشین چه کلماتی زیاد استعمال شده، بعد چکار میکند؟
استاد: مهمترین چیزی که در اینجا اساس مطلب است تا فهم آن برایتان واضح شود، این است که از مفهوم بردار شروع کنید. بردار یک مفهوم ریاضی است و همه در کلاسها شنیدهاید، ولی برای درک این فضا که این زبانها چکار میکنند، شما باید جبر خطی را بدانید. جبر صفر و یکی را آن آقا آورد و شروع شد. الآن این جبر تنسورها است. به جای جبر صفر و یک، جبر تنسورها است. جبری است که سر و کارش با تنسورها است. وقتی بهدنبال این بروید، میفهمید که دارد چکار میکند. بردار به چه صورت است؟ شما الآن دستگاه مختصات در ذهنتان هست؛ محور x و محور y. برای اینکه یک نقطه را در یک صفحه معین کنید، به چند چیز نیاز بود؟ دو چیز نیاز داشتید تا بگویید در محور x، چهارتا جلو برو و در محور y شش تا برو، بعد آن نقطه میشود. با دو شناسه و دو چیزی که معرفی میکرد، در صفحه، یک نقطهای را تعیین میکرد. خب در تک محور اعداد، فقط یک نقطه بود که با یک عدد تعیین میشد که میگویند تنسور رتبه صفر؛ یک عدد است که نقطه تعیین میشود.
اما بردار چیست؟ خیلی مفهوم مهمی است. شروعش هم ساده بوده است. در علم فیزیک، فرمولهایی که در جاذبیت و نیرو و مکانیک کلاسیک و حرفهایی که نیوتن آورده بود را میخواستند جلو ببرند، این بردار آمد و بعد هم خیلی ریاضیاتی و قوی شد. آن وقت یک بردار یک بُعدی و دو بُعدی بود، الآن دیگر در این زبان، با بردارهایی با ابعاد بسیار بالا کار میکنند. یعنی شما اول باید تصور ساده بردار را بکنید و بعد با ابعاد بالاتر تصور کنید که اصلاً به شکل ریاضی نمیتوانید دربیاورید و فقط باید تصور عقلانی کنید. بعد از اینکه بردار معلوم شد، بعد هم ماتریس و بعد از ماتریس هم تنسور آمد. تا جلسه دیگر اگر زنده بودیم مبادی اینها را مطالعه کنید. من هم اندازهای که مطالعه کردهام، عرض کردم. بینی و بین الله دیگر سن من اقتضاء این حرفها را ندارد، ولی میتوانم بهانه شوم و هندل بزنم. طبق اقتضای سن، شما ان شاء الله به دنبالش میروید و ملاحظه میکنید.
ببینید؛ خصوصیت بردار این است که یک نقطه نیست. نقطه، فقط پایه بردار است. وقتی گفتید در طول محور x شش تا جلو برو و شش تا بالا برو، وقتی به آن نقطه رسیدیم، تازه یک پایهای با عرض از مبدأ و طول از مبدأ پیدا کردهاید. هر بردار، دو چیز مقوم دارد: جهت و عدد؛ یعنی مقدار یک بردار و جهت بردار. پایه [یا مبدأ] هم که شروع کارش است. بعد میگویید از این پایه با فاصله عدد پنج در جهت خاصی. هر چه شما تعیین کنید؛ مختصات سه بعدی، دو بعدی، یا اگر زمان را در کارش بیاورید چهاربعدی میشود، با انواع و اقسام آن. مثالهای آن را چندین جور یادداشت کردهام.
بنابراین مهمترین کاری که در این نسل جدید انجام شده و لذا مشکل جعبه سیاه پیش آمده؛ مشکل جعبه سیاه این است که او در پردازشهای خودش و در اینکه شما به آن ورودی میدهید و بعد هم میبینید جوابهای خوبی میدهد، اما توهم هم دارد. هوش مصنوعی میتواند تخیل کند؟ تخیل، میتواند قاعدهمند باشد. مهندسین نرمافزار برای تخیل هوش مصنوعی مشکلی ندارند و اصلاً به آن برنامه میدهند. اما وقتی به اصطلاح خودشان توهم میزند، در توهم، دست مهندس بسته است و هیچ کاری نمیتواند بکند؛ به محکمی میگوید مطلب این است. اما از کجا در آورده است؟ نمیدانند. بعداً وقتی خیلی کار کنید، قدم به قدم نه اینکه مکانیسم کار آن را بفهمید، بلکه قدم به قدم کار آن را کنترل میکنید و توضیحپذیرش میکنید. با زحماتی که کشیدهاند.
شاگرد۲: در این نسل جدید، مهمترین کاری که شده، توضیحپذیر بودن است؟
استاد: در نسل جدید، بر مبنای آمار، الگوهایی کشف میشود که چه بسا اصلاً بشر هم کشف نکرده. ولذا من برای لغت و اشتقاق گفتم که خیلی پرفایده است. یعنی شما الف و باء و کاربرد و آمارش را به این مدل زبانی میدهید و همه اطلاعات اشتقاق کبیر را به آن میدهید، خودش فقط با آمار شروع میکند و کشف الگو میکند. الگوهایی که چه بسا بعداً میبینید درست هم هست؛ الگوهای زبانی خیلی عالی. این نسل سوم است. یعنی «based statistical»؛ بر پایه و محور آمار جلو میرود و کاری به معانی ندارد. فقط با عدد، آمارگیری میکند؛ تعداد آمارها و بعد با بردار، «embedding» (تعبیه برداری) میکند. مهمترین فنی که الآن خیلی کارساز بوده، همین است که کلمات را توکنبندی میکنند و در بردارهایی با بُعد زیاد، جهتدهی معنایی میکنند؛ جهتدهی معنایی اما بر مبنای آمار. این نسل سوم است. یعنی بردارهایی است که تعیین میکند این کلمات نزدیک هم هستند-درست هم میگوید- اما نه اینکه معنا را درک کرده باشد و صرفاً با آمار جلو میرود.
تنظیر توضیحناپذیری هوش مصنوعی به پرنده هدهد
شاگرد۱: تحلیل خطای ما که هوش واقعی هستیم چیست؟ ما هم این خطاها را میکنیم؛ گاهی ورودیها درست است، ولی خطا میکنیم.
استاد: اتفاقاً چون ریخت شبکههای عصبی را پیاده سازی کردهاند، اگر اینها در آینده پیشرفت کند و پردازشهای عمیق را بتوانند به رده بالای توضیحپذیری دربیاورند، چه بسا خیلی از جاهایی که در ذهنمان اشتباه میکنیم را به همان نحوه انجام دهند. همان چیزی که مرحوم آسیدعلی نجفآبادی میگفتند؛ وقتی به نجف رفته بودند گفته بودند نوشتهجات علمای نجف را برایم بیاورید؛ مبیضّه آن را نیاورید، مسودّهها را بیاورید. این دلالت بر علو علمی آسید علی نجفآبادی دارد؛ عالم بزرگی بودند. استاد اسفار مرحومه بانو مجتهده امین بودند. میگفتند دستنوشتههای علماء را بیاورید تا وقتی در نجف مشرف هستم، استفاده کنم. ولی پاکنویس را نیاورید. چرکنویس را بیاورید که خط زدهاند و برگشتهاند و درست کردهاند. بعد این را میگفتند - جمله خیلی بزرگ آسید علی است - میگفتند من استفادههایی که از خط زدهها میکنم بیش از جاهای دیگرش است. این خیلی حرف بزرگی است. یعنی ایشان به نحوه پیشرفت ذهن نویسنده نگاه میکند که چطور شد که آن را نوشت و بعد برگشت و خط زد؟! چرا خط زد؟! فهمید اشتباه کرده و چرا اول اشتباه کرده بود؟! چطور شد اشتباه کرده بود؟! درک چطور شدن اشتباه و رفتوبرگشت او، یک ذهن لطیف دقیقی میخواهد تا بفهمد. کسی که اینها را بفهمد در فکر خودش قویتر و سلیمتر و از خطا دورتر است. چرا میگویند منطق بخوانید؟ «آلة تعصم مراعاتها الذهن عن الخطا فی الفکر»؛ فکر، منظم میشود.
شاگرد۲: فرمودید اشتباه را در همان گامی که پیش آمده، کشف میکنند، اما نمیدانند که چرا اشتباه شده؟
استاد: نه، اول آموزش عمیق پیش آمد و با آن صحبت میکردند. میدیدند که چیزهایی را میگوید که توهم زده است، ولی نمیدانند چرا. نمیتوانند برگردند و بگویند اینجا سبب شد که او توهم زد و نکته توهم زدن او، مشخص نیست. او که داعیهای ندارد که بخواهد دروغ بگوید. ولی حتی با اطمینان میآید و میگوید مطلب این است.
شاگرد۲: نقطه توهم را کشف میکنند، ولی دلیل آن را نمی فهمند.
استاد: نقطه توهم، کشف نمیشود، چون عمیق است. قوام عمیق به این است که لایههای پردازش، مخفی است. جعبه سیاه، همین است. یادم آمد از کاری که هدهد برای حضرت سلیمان میکرد. حضرت سلیمان نشستند و گفتند: «مَا لِيَ لَآ أَرَى ٱلۡهُدۡهُدَ»[1]؛ هدهد کجا است؟ چرا نمیبینمش؟ «مَا لِيَ لَا أَرَى ٱلۡهُدۡهُدَ أَمۡ كَانَ مِنَ ٱلۡغَآئِبِينَ، لَأُعَذِّبَنَّهُۥ عَذَابا شَدِيدًا أَوۡ لَأَذۡبَحَنَّهُۥ أَوۡ لَيَأۡتِيَنِّي بِسُلۡطَٰن مُّبِين». بعد هدهد آمد و چه گفت؟ «وَجِئۡتُكَ مِن سَبَإِۭ بِنَبَإ يَقِينٍ». خب حضرت سلیمان منطق الطیر را میدانستند؛ «عُلِّمۡنَا مَنطِقَ ٱلطَّيۡرِ»[2]. حضرت سلیمان منطق طیر را میدانستند. چطور شد که بهدنبال هدهد گشتند؟ چکارش داشتند؟ در روایت هست. به نظرم در تفسیر برهان باشد؛ او آب را پیدا میکرد. یکی از چیزهای جالب است؛ حضرت، هدهد را با خود میبردند به این خاطر که زمین و خاک مانع دیدن چشم هدهد نیست. مثلاً با فاصله صد متر و دویست متر، آب زیر خاک را میبیند. در روایت هست که حضرت او را با خودشان میبردند. چون لشکر ایشان بیابانها طی میکرد. هدهد میگفت اینجا را بکَنید و با فاصله پنج متر به آب برسید. نشاندادن نقطه، مهم است که جا را بداند کجاست.
مرحوم سید بحر العلوم رضواناللهعلیه! حاج آقا میفرمودند میخواستند مسجد کوفه را تعمیر کنند، ایشان به وادی السلام، نزدیک قبر حضرت هود و صالح(علیهما السلام) آمد. گفت اینجا را بکَنید. کندند و پایین رفتند؛ سنگهای خیلی عال العال و خوبی از زیر خاک درآمد. گفتند اینها را برای تعمیر مسجد کوفه ببرید. حالا سید چطور میگفت اینجا را بکنید؟ هدهد هم اینطور بود. بعد هم رفت و گفت «إِنِّي وَجَدْتُ امْرَأَةً تَمْلِكُهُمْ…». آنچه که به ذهنم آمد، این بود: هدهد نگاه میکند، در روایت دارد حضرت سلیمان با اینکه پیامبر بودند، [اما به لحاظ عملکرد ظاهری بدن چنین توانی را نداشتند]؛ خب خداوند به هر کسی یک چیزی داده است. آن علوم غیبیه یک چیز است، اما آن عملکرد ظاهری بدن یک نبی، این نیست که زیر خاک، یک چیزی را ببیند. بدن او هم « إِنَّمَا أَنَا۠ بَشَر مِّثۡلُكُمۡ»[3]، و لذا هدهد را به کار میگرفتند. ولو ممکن است از حیث مقام نبوت، بالاترش را هم داشتند. مثل خود آصف بن برخیا؛ با اینکه او وصی حضرت بود، اما او را در آوردن تخت بلقیس به کار گرفتند. الآن حضرت، هدهد را به کار گرفتند و او میگوید اینجا آب است. بدن هدهد که خداوند به این ظرافت آفریده، خدا آن را یک جعبه سیاه آفریده است. یعنی نه خود هدهد خبر دارد که چرا آنجا را میبیند و میگوید آب است، و نه ما میتوانیم بفهمیم -یا حضرت سلیمان به اندازه علمشان- که چه مکانیسمی رخ داده که دارد آب را میبیند. ولی میگوید اینجا آب است و میرویم و میبینیم درست است. نکته، این است. مدل زبانی بزرگ چکار میکند؟ شما چیزی به آن میگویید و درست جواب میدهد. یعنی در صد مورد، یکی توهم میزند. و الّا صدتا جواب خوب داد. چطور دارد؟ یعنی چطور شد به این نتیجه رسید و توضیح داد؟ ما نمیدانیم چطور به این مسیر آمد. «Rule-based» نیست که طبق قاعده رفته باشیم و مسیر را برویم و برگردیم؛ این خبرها نیست. اما میبینیم که درست جواب میدهد. مثل هدهدی که میگوید و میکَنیم و میبینیم آب بود. چطور؟ نمیدانیم.
راجع به همین هدهد دارد؛ ابوحنیفه از حضرت سؤال کرد، چه شد؟ شما میگویید آب را در زیر زمین میبیند؟! حضرت فرمودند چه مشکلی دارد؟ میخواست ایراد بگیرد. گفت چطور آب را صد متر زیر زمین میبیند، اما توری که یک بند انگشت زیر خاک مخفی کردهاند را نمیبیند؟! ما مکرر دیدهایم که هدهد در تور میافتد و صیاد آن را میگیرد. ابوحنیفه گفت: «ظفرت بك»؛ یعنی گویا مچ شما را گرفتم. چطور آب را زیر زمین میبیند، ولی تور صیاد را زیر خاک نمیبیند. حاج آقا میفرمایند: چون این جور حرف زد، حضرت کنیه او را نگفتند و اسم او را گفتند. حضرت فرمودند: «يا نعمان، أما علمت أنّه إذا نزل القدر أغشي البصر»[4]. حضرت به اشکال او این جواب را دادند.
لذا میبینید جایی توهم میزند، ولی نمیدانیم چه شده است. علی ای حال، خیلی مهم است. هوشی هم که اخیراً آمد، اینکه مهم شد و در سختافزار نیاز کمی داشت، همین « Deepseek» بود. گفتنش آسان است؛ 671 بیلیارد پارامتر دخیل در این است که به شما جواب بدهد. مدل زبانی بزرگ است. اما چرا سختافزار کمتری نسبت به هوشهای شرکتهای آمریکایی با بودجههای بالا استفاده کردند؟ چون وقتی شما درخواست را به آن میدهید، همه را فعال نمیکند و با الگوهایی که ریاضیدانها به آن دادهاند، فقط 67 میلیاردش را فعال میکنند. هر درخواستی که میدهید، 67 میلیارد پارامتر را فعال میکند. 67 تا ششصد و … خیلی است. لذا پردازشش پایین آمد. دیدند در مدل اینها، آن نیازی که به سختافزار هست، خیلی کمتر است و در درخواستهایتان اینقدر نیاز نبود.
والحمد لله رب العالمین
[1] النمل ۲۰
[2] النمل ۱۶
[3] الکهف ۱۱۰
[4] تفسير کنز الدقائق و بحر الغرائب , جلد۹ , صفحه۵۵۴