۲۲. فقه هوش مصنوعی (۱۴۰۴/۰۱/۲۱)

سال تحصیلی (۱۴۰۴-۱۴۰۳) - پنجشنبه، ۲۱ فروردین ماه ۱۴۰۴

پیشـگفتار(چـکیده)

موضوعات مطروحه در جلسه:
مروری بر سیر تحلیل هوش پایه‌محور و معرفی نسل‌های مختلف هوش مصنوعی،
 تبیین مشکل جعبه سیاه در هوش مصنوعی، هوش مصنوعی داده‌محور،
 روش آماری در هوش مصنوعی، یادگیری عمیق و توضیح ناپذیری در هوش مصنوعی

تمایز بین هوش اشراق‌محور و پایه‌محور

قرار شد مباحثه را سه بخش کنیم. بخش اول مسأله مهم تمایز بین هوش اشراق‌‎محور با پایه‌محور است. با تلاش‌هایی که در آینده صورت می‌گیرد، برای نوع انسان واضح می‌شود که امتیاز انسان، دارا بودن روح و نفس مجرده است؛ نفسی که از عالم دیگر آمده است؛ این برای نوع بشر واضح می‌شود. الآن به گمانم هنوز آن‌چنان در محافل جمعی و عقل جمعی بشر واضح نیست، ولی مبادی آن فراهم است؛ یعنی زحمت کشیده بشود که این جاهای خاص را نشان بدهند و تفاوت‌های آن را به نحو خیلی منحاز نشان بدهد. این بخش اول بود. هر چه هم ممکن بود، از آن صحبت کردیم. در ادامه هم هر چه شما به نکته‌ای در توضیحش برخورد کردید، حتماً بفرمایید. پرونده بخش اول همین‌طور مفتوح است. عرض کردم رویکرد و روشی که می‌خواهیم اعمال کنیم، بیشتر روشی است که نمی‌خواهیم حالت تفلسف و اثبات کردن داشته باشد، بلکه می‌خواهیم بیشتر حالت ارائه شهودات وجدانی داشته باشد و همان‌طور که عرض کردم طوری باشد که چشمِ ذهن ببیند، نه این‌که ذهن، با استدلال قانع شود. خیلی تفاوت است بین جایی که چشم ذهن چیزی را می‌بیند با این‌که ذهن با اثبات برهانی قانع شود. مقصود ما در بخش اول، بیشتر آن است.

سیر تحلیل هوش پایه‌محور با شروع از سخت‌افزار به سمت مبنای باینری

بخش دوم این بود: بعد از فراغ از این‌که ما بین اشراق‌محور و پایه‌محور تفاوت گذاشتیم، حالا بیاییم هوش پایه‌محور را دقیق تحلیل کنیم و به آن آگاهی کامل پیدا کنیم به نحوی که وقتی می‌خواهیم برای آن حکم فقهی بیاوریم، بدانیم که موضوع چیست و نسبتاً یک دید روشنی از پایه‌محور بودنش داشته باشیم.

بخش سوم هم که بیان حکم شرعی بود.

در بخش دوم برای مباحثه ما یک مسیری طی شد. اگر نظرتان باشد، برای این‌که توضیح بدهم که این هوش پایه‌محور چیست، از همان دل سخت‌افزار شروع کردیم و مسیری را جلو آمدیم. دیدم بعضی از اساتید تذکری داده بودند که به گمانم در مباحثه ما انجام شده است. فرمایشات اساتید در مباحثه‌های هوش مصنوعی را ارسال کرده بودند؛ دیدم تذکر داده بودند که رئالیستی رفتار کنید، یعنی روی فروض و قضایای شرطیه جلو نروید و به این شکل که اگر آگاهی داشت، اگر قصد داشت حکمش چیست و … جلو نروید. بگویید این کارهایی که انجام می‌شود، جایز هست یا جایز نیست؟ احکامش چیست؟ این کارها بشود یا نشود؟ یکی هم این است که آنچه که هست را بگویید. در این فاصله که مباحثه کردیم، هیچ وقت دنبال این نرفتیم که بگوییم اگر هوش داشت و اگر قصد داشت.

از روزهای اول عرض کردم، قصد و آگاهی‌های با روش فلسفه ذهن و هوش قوی و ... اصلاً مورد بحث ما نبود. مکرر عرض کردم که من روی پایه‌محور تأکید می‌کنم به این جهت که متمحض و متبلور در رئالیستی است. یعنی در چنین فضایی که جلو می‌رویم، آنچه که الآن هست و واضح است و دارد انجام می‌شود و مهندس‌های نرم‌افزار با آن سر و کار دارند، داریم حکم همین را می‌گوییم، نه این‌که اگر فلان طور شد، بعداً بگوییم حکم فقهی‌اش چیست. همه تلاش ما در این بخش دوم همین است که آنچه که دارد می‌گذرد و آنچه که الآن هست را ببینیم حکمش چیست و اگر ما می‌گوییم قصد پایه‌محور، یک امر مبهم انیاب اغوال به‌صورت قضیه شرطیه نباشد و بدانیم داریم چه می‌گوییم و بدانیم الآن در فرایند قصد پایه‌محور چه می‌گذرد. این مقصود ما در بخش دوم بوده است. حالا با توضیحاتی که عرض می‌کنم.

در این فرایندی که آمدیم، اول عرض کردم اساس این‌که کامپیوتر پدید آمد و رشد کرد، این بود که عدد در مبنای دودویی -باینری- جلو رفت و شروع به پیشرفت کرد. اگر عدد در مبنای دو -صفر و یکی- نبود، این‌ها نبود. البته فهرست‌وار عرض می‌کنم. ولی چیزی که بسیار مهم بود و اگر آن نبود، کامپیوتر نبود -یعنی از نظر وزن علمی مهم بود- کاری بود که شانون کرد - که با تورینگ معاصر بود - او جبر صفر و یکی را وارد کامپیوتر کرد. عدد صفر و یک با جبر صفر و یکی -جبر بولی- خیلی متفاوت است. این‌ها را عرض کردم. جبری که متغیرهای آن فقط یکی از صفر یا یک را قبول می‌کند؛ این جبر صفر و یکی است؛ جبر دو ارزشی است. او بهترین استفاده را از این جبر کرد. جبر را کنار باینری آورد. 0 و 1 به‌عنوان یک عدد، به‌عنوان رقمی که عددی را می‌رساند، یک هویت مقولی دارد. شما الآن می‌گویید صفر و یک؛ یک درکی دارید که در ذهن شما روشن است؛ همانطور که از اعداد دو و سه و پنج و … یک درک مقولی و هویت مفهومی در ذهنتان می‌آید. اما اگر بگویم «صحیح - غلط» مفهومی واضح در ذهنتان می‌آید، اما یک هویت ندارد. هویت «صحیح» چیست؟ شما بیان کنید. می‌گویید «یک»، یک هویت مفهومی دارد که یک عدد است. می‌گویید «انسان» یا سائر مقولات، این‌ها یک مفاهیمی هستند که هویت دارند. حالا یا شخصیتی پیشین یا پسین. اما وقتی می‌گویم «صحیح»، مفهوم خیلی روشنی دارد ولی این مفهوم چه هویتی را ارائه می‌کند؟ هویتی ارائه نمی‌کند. چرا؟ چون اصلاً ریختش، نسبت است. صحیح یعنی آنچه که مطابق واقع است و دارد نسبت مطابقت یک قضیه و یک ایده را با واقع بیان می‌کند. صحیح یعنی مطابق واقع و درست. ببینید؛ هویت ندارد.

بنابراین در چنین فضایی جبر صفر و یکی، معنا را -نه معنای هویت‌دار مثل عدد صفر و یک- که در حیطه روابط و نسب است، داخل کرد. این گام بسیار مهمی بود که جبر آمد و نقش ایفاء کرد.

رد تبعیت تمام تکنیک‌های امروزی از ایده فلسفی

جلوتر عرض کردم؛ گفته می‌شود که خیلی از تکنیک‌های امروزی تبلور و تجسم یک ایده فلسفی است. جلوترها هم عرض کردم که اندازه‌ای که من می‌فهمم، در ذهنم صاف نمی‌شود. اتفاقاً مهندسین نرم‌افزار، یا کلاً مهندسین از اول عالَم، آن کسی و چیزی که برای مهندس کار انجام می‌دهد ریاضی‌دان و ریاضیات است. اوست که دارد کار انجام می‌دهد. فیلسوف اصلاً برای مهندس کار انجام نمی‌دهد. خود کلمه مهندس، اسم فاعل از هندسه است. اقلیدس یک کتاب هندسی نوشت و سایر مهندسین کتاب نوشتند و یک ابزار ریاضی به دست مهندسین دادند. حالا آن چیست؟ یک خط‌کش دست می‌گرفتند؛ خط‌کش و پرگار کهکشان‌پیما؛ اقیانوس‌پیما. مهندس همین است. یعنی ریاضیات و یکی از شعب ریاضی که هندسه است، برای مهندس یک ابزاری را فراهم می‌کند که با این ابزار ریاضی کارش را جلو می‌برد؛ اینکه فلاسفه چه می‌گویند و نقطه چیست و خط چیست و تعریفش چیست و اصلاً هست یا نیست؛ اصلاً کاری با این‌ها ندارد. نه هندسه در بند آن بحث‌های فلسفی است و نه مهندس وقتی می‌خواهد با ابزار هندسه طول چیزی را اندازه بگیرد یا فاصله زمین تا خورشید را اندازه بگیرد، در بند آن‌ها است. تشابه، مهم‌ترین ابزار کهکشان‌پیما و اقیانوس‌پیمای مهندسین است؛ آن هم در فضای هندسی؛ فضای سه بُعدی.

خب ببینید؛ الآن هم همین‌طور است. واقعاً به این صورت است. هر چه هم فکرش را می‌کنم، اینجور به ذهنم می‌آید. یعنی در زمان ما و این صد سالی که گذشت، یک ایده فلسفی نیامد به این‌ها بگوید بروید به‌دنبال هوش مصنوعی و آن را به‌عنوان یک تکنیک، تکنولوژی و صنعت بیاورید. ابزار ریاضی فراهم شد و این تکنیک پیش رفت. الآن هم مهندسین نرم‌افزار، کاری با فلسفه ذهن و … ندارند. آن‌ها دارند کار خودشان را می‌کنند. یک فضایی برای خودشان است.

شروع نسل اول هوش مصنوعی با جبر صفر و یکی

خب ابزار این فضا از کجا می‌آید؟ عدد باینری، یک ابزار ریاضیاتی بسیار قوی به دست مهندسین داد. این کاری به فلسفه ندارد. عدد باینری را فلاسفه باید به آن‌ها بدهند؟ نه. بعدش کلود شانون آمد جبر صفر و یکی را آورد و محاسبات نمادین را شروع کرد. نسل اول هوش مصنوعی -هوش مصنوعی نمادین- با کار او شروع شد که جبر صفر و یکی وارد فضا شد و از آن استفاده کردند. جبر است؛ جبر که فلسفه نیست. جبر، سرآمد شعب ریاضیات است. می‌توانید فلسفه جبر داشته باشید، اما خود جبر، پیشرفت جبر و کار جبری کردن، ربطی به تفلسف ندارد و جای خودش است. این، ابزار تهیه می‌کند و به دست مهندس می‌دهد.

نسل دوم هوش مصنوعی با جبر خطی

الآن زمان ما، به‌خصوص در سه-چهار سال اخیر که پیشرفت عجیبی شد، دوباره این جبر خطی را وارد فضا کردند. جبر خطی آمد و الآن شما مدام از آن سؤال می‌پرسید و جواب می‌دهد. همین چند سال آمد، خیلی عمر طولانی‌ای ندارد. شروعش شاید پانزده-شانزده سال بشود، اما پیشرفت‌های خیلی بزرگش برای همین چند سال اخیر است. جبر خطی به فضای همین هوش مصنوعی آمد. با آمدن جبر خطی، دوباره یک هنگامه‌ای به پا شد. مهندس نرم‌افزار، کاری ندارد که فلسفه ذهن و نماد و … چیست. او می‌بیند که الآن جبر خطی یک ابزار خوبی به دستش می‌دهد و با این ابزار ریاضی کارش را جلو می‌برد. ابزار، نیاز است. خود دکارت وقتی مختصات دکارتی را طراحی کرد -محور x و y؛ مختصات دو بعدی کارتزین- یک کار ریاضیاتی کرد. دکارت در اینجا فیلسوف نبود. بگویید دکارت فیلسوف بود، حرف زد، چه ایده‌هایی داشت و …، هر چه بگویید، کاری که دکارت در ابداع و ارائه محور مختصات که هندسه تحلیلی با آن عظمت بعداً مدام پیشرفت کرد، این ابزار ریاضیاتی بود؛ تفلسف نکرد. این چیزی است که من می‌فهمم.

الآن هم همین‌طور است. الآن هم در بخش دوم مباحثه، تمام همّ ما این است که این ابزارها را شناسایی کنیم. ببینیم در علوم پایه چه ابزاری فراهم کردند؛ شما هم به‌عنوان طلبه هر چه روی این‌ها مطالعه کنید، خوب است. البته نه به‌صورت حجیم، ولی برنامه‌ریزی کنید و مدیریت زمان کنید تا هر هفته ببینید یک مقداری پیش رفته‌اید. اگر من یک کلمه از جبر خطی بلد نیستم، اما با هفته‌ای نیم ساعت وقت گذاشتن، بعد از پنج-شش ماه می‌بینم دیگر یاد گرفته‌ام. علی ای حال، جبر خطی در این زمان بسیار اهمیت دارد. جبر بردارها است، جبر تنسورها است، جبر ماتریس‌ها است.

شاگرد۱: این‌که به فلسفه کاری ندارند، آیا به‌صورت خودآگاه و اختیاری کاری ندارند، یا در ناخودآگاهشان مبانی فلسفی وجود دارد؟

استاد: ببینید اصلاً ممکن نیست کسی کاری را بدون تفلسف شروع کند. قبلاً هم این را عرض کردم. من که منکر این نیستم. هر چه هم می‌خواهید کار فلسفی انجام بدهید، من مشکلی ندارم. من می‌خواهم قاطی نشود. یعنی آن جایی که یک ابزار ریاضی برای مهندس فراهم شده و دارد جلو می‌رود، شما بگویید اینجا یک ایده فلسفی فعال است، نه، این‌طور نیست. بله، ناخودآگاه، ایده‌های فلسفی دارد کار می‌کند، اما آنچه که موتور کار است، تفلسف نیست و آنچه که موتور کار است، فراهم شدن یک ابزار ریاضی است. الآن این‌ها دارد جلو می‌رود.

اتفاقاً شاهد عرض من هم همین نسل دوم هوش مصنوعی است. اگر مدام می‌گفتند هوش مصنوعی تجسم یک ایده فلسفی است، نسل دوم هوش مصنوعی که آمد، به گمانم آشکارا دارد می‌گوید که این حرف درست نیست. نسل دوم چه بود؟ جلوتر هم صحبتش شد. نسل اول همان نمادگرائی بود که طبق ضوابط و قانون‌هایی که بود، قانون‌مند جلو می‌رفت. اشکالاتی هم درایفوس به مبانی آنها. یکی از اشکالاتی که می‌خواستند مطلب را سر برسانند، مشکل چارچوب بود. یعنی وقتی صحنه عوض می‌شود و یک انتقال می‌خواهد صورت بگیرد، چه چیزهایی باقی می‌ماند و چه چیزهایی متغیر می‌شود. خب این یکی بود. نسل دوم هوش مصنوعی که آمد، با یک فاصله کوتاهی نسل سوم آمد. خود نسل دوم یک مرحله ابتدائی داشت؛ هوش مصنوعی که یک زمستان داشت، بهارش که شروع شد، یک مرتبه اول داشت که یادگیری ساده بود. گام بعدی آن با یک پیشرفتی، یادگیری عمیق پیش آمد (Deep learning). وقتی این پیش آمد، با مشکل جدیدی روبه‌رو شدند.

شاگرد۲: نسل اول و دوم چه بود؟ بعد از نمادگرایی چه شد؟

استاد: یادگیری ساده بود. نسل دوم آن وقتی است که دیگر نمادگرایی کنار رفت و اتصال‌گرائی آمد. یعنی سعی کردند ادای فضای شبکه عصبی انسان را درآورند؛ این ابتدای نسل دوم است. یعنی کلاً نمادگرایی و قاعده‌محور بودن کنار رفت و دقیقاً شبکه‌های عصبی را پیاده کردند؛ ببینند که خدای متعال شبکه‌های عصبی را در دماغ انسان چطور قرار داده است و چطور دارد کار می‌کند، کار آن را پیاده کنند. چرا؟ چون قبلی شکست خورد. برای نسل اول، خیلی پول داده بودند، اما به نتیجه نرسید و کارها هم ماند. بودجه ها را قطع کردند. تعبیر می‌کنند به زمستان. این خودش آتش زیر خاکستر بود؛ خودشان مشغول بودند تا کم‌کم در رده بعدی، نسل دوم آمد. نسل دوم همان شبکه‌های عصبی بود. ساده‌ترین شبکه عصبی بود.

یادگیری عمیق و مشکل جعبه سیاه در هوش مصنوعی

 مرحله دوم، یادگیری عمیق بود. یک مشکلی هم که الآن هست، مشکل جعبه سیاه است. الآن خیلی مهم است و دارند خیلی روی آن کار می‌کنند؛ «Black-box problem». این جعبه سیاه، شاهد عرض من است که تفلسف و ایده فلسفی، پشت کار پیشرفت این‌ها نیست.

الآن می‌خواهند کار شبکه عصبی را و نورون‌های عصبی را شبیه‌سازی کنند و پیاده کنند، این فلسفه است؟! من به گمانم اصلاً فلسفه نیست. در مهندسی نرم‌افزار می‌بیند که شبکه‌های عصبی رفتارشان به چه صورت است تا همان را پیاده کنند. اینجا اصلاً فلسفه نیست. او اصلاً کاری با فلسفه ندارد. آنجا یک رفتاری را می‌خواهد از نورون‌ها ببیند و آن را پیاده کند. مرحله اولش ساده بود؛ نورون‌های ساده‌ای که تنها یک لایه دارد: ورودی و لایه پردازش و خروجی. به این، ساده‌ترین پردازش شبکه سلول عصبی می‌گویند. ورودی و یک لایه پردازش و خروجی.

شاگرد۳: این متوقف بر این است که معرفت را یک امر مجرد بدانیم.

استاد: اصلاً متوقف بر این‌ها نیست. مثال بزنم؛ مثلاً نانوتکنولوژی که الآن کار می‌کنند، چقدر مبتنی بر تفلسف است؟! ذهنمان را دور نبریم. فیزیک خیلی نزدیک به تفلسف است. از علومی که خیلی دور از تفلسف است -نمی‌گویم نیست - شیمی است. روال کارهای شیمی و تحقیقاتی که دارند، تفلسف ندارد؛ می‌خواهم غلبه را بگویم. الآن نانوتکنولوژی مرتب دارد کار می‌کند - ذرات را مهندسی می‌کنند و مواد با خواص مختلف پدید می‌آید - فلسفه این چیست؟ شما بگویید.

شاگرد۳: بله، ممکن است از فلسفه دور باشد، اما باید ببینیم معرفت چطور است. چون می‌خواهد بشناسد.

استاد: ما کاری به معرفت نداریم. ما می‌خواهیم بگوییم یک شبکه نورونی با پیام‌های شیمیایی و الکتریکی چکار می‌کند. یک نورون عصبی، ورودی دارد و خروجی دارد. چکار می‌کند؟ شما می‌گویید معرفت چیست، درحالی‌که کاری به معرفت ندارد. دارد می‌گوید این عملکرد یک نورون است. بعداً عرض می‌کنم که مشکل جعبه سیاه چیست.

شاگرد۳: پیش‌فرض آنها این است که آگاهی از همین نورون‌ها به وجود می‌آید

استاد: نه، شما به قدم‌های آخر نروید. اگر من توضیح آن را عرض کنم، می‌بینید که آنچه که می‌گویید، چه آخر کار وحشتناکی است؛ برای خودش یک چیزی است. ابتدا همین است: او می‌خواهد کار یک نورون را شبیه‌سازی کند. نسل دوم این است.

شاگرد۲: این قدم اولش بود.

استاد: این قدم ساده اول بود. «Deep Learning» یا یادگیری عمیق است. آموزش، مرتبه بعدی است که عرض می‌کنم. یادگیری عمیق چیست؟ لایه‌ها، متعدد می‌شود. یعنی وقتی ورودی وارد می‌شود، مثلاً در ده لایه، پردازش می‌آید تا خروجی دربیاید. اینجا وقتی یادگیری عمیق پیش آمد، یعنی الآن مهندسین با ابزار شبیه‌سازی شبکه عصبی و نورون‌های مغزی، پردازشی عمیق درست کرده‌اند. یعنی ورودی‌ای که به آن می‌دادند، چند لایه پردازش می‌شد و بعد، خروجی می‌داد. اینجا بود که مشکل جعبه سیاه پیش آمد. یعنی مکانیسم این‌که چرا جواب داد، برای آن‌ها مخفی است. جعبه سیاه، یعنی نمی‌دانند که چه گذشت. جعبه شیشه‌ای و سفید و اینها نیست. الآن این را جلو برویم، تا بعد به آگاهی برسیم. این الآن برایشان خیلی ناخوشایند است. آقا هم می‌گفت یک جواب‌های با اطمینانی می‌دهد، دیدم خودشان نمی‌توانند برگردند و ببینند چرا این کارها را می‌کند. مهندس آمده در نسل سوم و بعد، نسل چهارم «Deep Learning» کرده، کار خودش را انجام می‌دهد و شروع می‌کند به او داده می‌دهد. آن هم حسابی جواب می‌دهد؛ یک جاهایی جواب‌های خوبی می‌دهد و یک جاهایی هم با اطمینان، جواب‌های غلط می‌دهد که از خودش درآورده است. می‌گویند توهم زده است. خود مهندسین می‌گویند ماشین توهم زده است، چرا؟ نمی‌دانند.

شاگرد۲: جهتش را نمی‌دانسته‌اند

استاد: اصلاً نمی‌توانند برگردند و ببینند چکار کرده‌اند.  یعنی در آن درخت تصمیم‌گیری که یکی را انتخاب می‌کند، نمی‌دانند چرا این را انتخاب کرد.

شاگرد۲: این در گام دوم بود؟

استاد: بله، در یادگیری عمیق، مشکل جعبه سیاه پیش آمد.

شاگرد۲: این الآن همان چیزی است که در هوش مصنوعی‌ها سر و کار داریم؟

استاد: بله.

شاگرد۲: این‌که جواب غلط می‌دهد، همین است؟

استاد: بله، با اطمینان هم جواب غلط می‌دهد و خود مهندسین هم نمی‌توانند آن را تصحیح کنند. در هوش مصنوعی نمادین، برمی‌گردد و درست می‌کند و می‌گوید اینجا اشتباه شد. اما اینجا چون طبق اتصالات شبکه عصبی است، آن هم عمیق، یعنی ما نمی‌دانیم در لایه‌های مخفی پردازش چکار کرده که این خروجی را داده، لذا نمی‌توانیم برگردیم و بگوییم آن را درست کن. اینجا خیلی زحمت کشیده‌اند که چکار کنیم. به این، هوش مصنوعی توضیح‌ناپذیر می‌گویند. یعنی نمی‌توان توضیح داد که چکار کرده است.

الآن دارند کار بسیار مهمی انجام می‌دهند؛ «xAI» می‌گویند، یعنی توضیح‌پذیر؛ می‌خواهند هوش مصنوعی توضیح‌ناپذیر را توضیح‌پذیر کنند.

شاگرد۴: نسل سوم چه می‌شود؟

استاد: نسل سوم همین آموزش عمیق است.

شاگرد۴: منظورتان از نسل سوم همین لایه دوم است؟

استاد: نسل‌ها را که به کار می‌برند اصطلاحات مختلفی دارد. فقط باید محتوا را دید. البته اندازه‌ای که من مطالعه کرده‌ام.

شاگرد۴: این‌که با فاصله کوتاهی بعد از نسل دوم، نسل سوم آمد… .

استاد: نسل سوم نه، گفتم مرتبه دوم نسل دوم. مبنای نسل دوم، اتصال‌گرائی و شبکه‌های عصبی است. وقتی در فضای شبکه‌های عصبی وارد می‌شوید، دیگر سر و کار شما با معنا نیست. این‌ها را عرض می‌کنم چون قبلاً گفتیم که یک شبکه معنا درست می‌کنند. شبکه معنایی که من عرض کردم، دو جور است. الآن یک شبکه معنایی هست که روی همان مبنای قاعده‌محور است که آن، یک جور شبکه درست می‌کند و قبلاً توضیح آن را عرض کردم. طبق حرف‌هایی که الآن هست، شبکه معنایی، طور دیگری به پا می‌شود.

شاگرد۲: الآن این گام دوم را پیش رفته‌اند؟ متوجه شده‌اند که چرا جواب غلط می‌دهد؟

استاد: نه، متوجه نمی‌شوند. اصلاً نخواهند شد. یعنی مشکلی است که نمی‌توانند کاری کنند. او خودش پردازش انجام می‌دهد و آن‌ها نمی‌توانند بفهمند چکار کرده است. فقط می‌توانند مرحله به مرحله تفکیک کنند و آن را توضیح‌پذیر کنند؛ «xAI» کنند.

نسل سوم هوش مصنوعی و روش داده‌محوری

شاگرد۲: این مرحله سوم است؟

استاد: مرحله سوم جور دیگری است که الآن می‌خواهم عرض کنم.

شاگرد۲: قبل از مرحله سوم چکار می‌کند؟ فرمودید که نمی‌توانند بفهمند چکار می‌کند، اما آن را بخش بخش می‌کنند؟

استاد: نسل سوم که خیلی مهم است، این است که اصلاً ریخت درک منطقی…؛ یادتان هست که عرض کردم دو تا «LLM» داریم؟  یکی ماشین یادگیری منطقی بود، اما دیگری، مدل زبانی بزرگ بود. اولی که یادگیری ماشین منطقی باشد، نسل اول است که الآن صحبت شد. نسل سوم که آمد، داده‌محور شد.

شاگرد۲: ریخت درک منطقی را فرمودید نسل سوم چکار کرد؟

استاد: عوض کرد. به جای این‌که منطقی فکر کند، آماری جلو می‌رود. خیلی تفاوت می‌کند که در یک فضایی، مبنای کار شما بر آمار باشد تا مبنای کار شما بر معانی و منطق و استنتاج باشد. این جهت، الآن خیلی اهمیت دارد. این‌ها را که دیدم، مثال‌های قدیمی طلبگی به ذهنم آمد؛ اگر زیج را با هیئت مقایسه کنید؛ مثلاً تشریح الافلاک، سی فصل قوشچی را با مجسطی مقایسه کنید. بشر در رصدخانه چکار کرده؟ یادتان هست که عرض می‌کردم استاد فرمودند من به رصدخانه مراغه رفتم، آقا جان یک حال خوشی به من دست داد که این بنده‌های خدا در دل کوه چه کارها کرده‌اند! رصدخانه مراغه بالای کوه است. خب رصدخانه‌هایی که بوده و امروز هم هست؛ کار رصدخانه چیست؟ کاررصدخانه، نه فلسفه است و حتی نه مستقیماً کار ریاضیاتی است و نه منطقی است. رصدخانه فقط جمع‌آوری اطلاعات است. با ابزاری که دارد، می‌گوید این لحظه طلوع کرد و غروب کرد و این اندازه رفت. زیج، همین است. زیج، آن دیتاهای نجومی را پیاده می‌کند. بعد بشر چکار می‌کند؟ این اندازه‌ای که نگاهش به آسمان است و زیجاتی را آورده، مبنای زیج، بر آمار بوده است. او بعد شروع به الگوسازی می‌کند. الگوسازی قدیم بطلیموسی چه بود؟ می‌گفت زمین، وسط است. از چیزهایی که از دیتاهای زیج کشف کردیم، این بود که نزدیک‌ترین کره به ما، ماه است. بعد، تیر است. بعد ناهید و بعد خورشید و بعد مریخ و بعد مشتری است و بعد زحل است. تا زحل هم که تمام می‌شد و اورانوس و نپتون هم که نداشته‌اند. بعد هم ثوابت است و بعد فلک اطلس که در تشریح الافلاک بود.

شاگرد۲: پردازش اطلاعات را می‌فرمودید.

استاد: بله، کشف الگو. یعنی می‌گوید این داده‌های آماری زیج، به این صورت است و مبتنی بر چنین الگو و مدلی است.

نکته مهم در نسل سوم این است: الآن وقتی نسل سوم آمد، دیگر از راه اطلاعات وسیع که به او دادند، شروع کند به کشف الگو کردن. و لذا مدل زبانی بزرگ چرا بزرگ است؟ چون پارامترهای بسیار زیادی در آن دخالت می‌کند. اما نکته‌ی مهم در بزرگ بودنش، این است که شما اصلاً طبق یک ضابطه منطقی و قواعدی که از پیش تعیین کرده‌اید، جلو نمی‌روید، بلکه شما با یک اطلاعات خام مواجه هستید که مثل یک خزینه در آن می‌ریزید. فقط بر پایه لارج (Big Data/کلان‌داده)، یک اطلاعات وسیع می‌دهید و او شروع می‌کند، اما طبق یک معنا و طبق یک قاعده و ضابطه جلو نمی‌رود، بلکه صرفاً با ضوابط آمار شروع می‌کند و توکن‌گیری می‌کند و بر مبنای آمار جلو می‌رود. هر چه هم جلوتر رفت، بعداً با بردار پیش می‌رود. مبنای توکن (token) بر آمار است. هر متنی را به آن بدهید، به توکن‌ها تجزیه می‌کند و آمارگیری می‌کند. اصلاً کاری با معنا ندارد. بعد هم شروع می‌کند به حدس زدن. بخشی از کار ذهن ما هم همین‌طور است. حالا مدام پیشرفت کرده که بعداً عرض می‌کنم. من وقتی جمله‌ای را عرض می‌کنم، ذهن شما فوری در محور همنشینی تحلیل می‌کند و همنشین‌های آن را حدس می‌زند. مثلاً تا ماشین می‌گویم، شما فوری راننده را حدس می‌زنید، چون می‌بینید راننده به ماشین مربوط است.

شاگرد۱: این به معنایی نزدیک‌تر است تا آماری.

استاد: جالب این است که وقتی آماری کار می‌کند، در ذهن شما نمی‌آید…؛ زبان‌شناس می‌گوید شما که به بچه کلی اطلاعات گوگل را یاد نمی‌دهید! این‌طور ایراد گرفته است. ولی این‌ها الآن انجام داده‌اند. آن‌ها با مختصر یادگیری و پیش‌یادگیری، اطلاعات را به او داده‌اند و بعد او با آمار کار می‌کند. در کل زبان بشر، هر چه به او داده‌اند، نگاه می‌کند تا ببیند در این سندها و جاهایی که ماشین آمده، چند چیز دیگر با آن آمده است. در این همه دیتای وسیع، آمارگیری می‌کند و کلماتی که بیشتر با هم از نظر درصد کاربرد با هم هستند را پیدا می‌کند. خب در اینجا بعداً از صِرف آمار متوجه می‌شود. او اصلاً نمی‌داند ماشین به چه معنا است. او فقط می‌بیند ماشین با راننده در مجموع این همه داده‌ای که به او داده‌اند، خیلی زیاد در سندها آمده است. بدون این‌که بفهمد معنای آن چیست. اینجا از طریق آمار جلو رفته است؛ «LLM»  مدل زبان است. صوریت زبان را هم به آن ضمیمه کنید؛ الآن مدت زمان زیادی نیست که «LCM: Large Concept Models»  را هم اعلام کرده‌اند؛ یعنی مدل مفهومی؛ الآن شروع شده است.

شاگرد۲: وقتی فهمید در کنار ماشین چه کلماتی زیاد استعمال شده، بعد چکار می‌کند؟

استاد: مهم‌ترین چیزی که در اینجا اساس مطلب است تا فهم آن برایتان واضح شود، این است که از مفهوم بردار شروع کنید. بردار یک مفهوم ریاضی است و همه در کلاس‌ها شنیده‌اید، ولی برای درک این فضا که این زبان‌ها چکار می‌کنند، شما باید جبر خطی را بدانید. جبر صفر و یکی را آن آقا آورد و شروع شد. الآن این جبر تنسورها است. به جای جبر صفر و یک، جبر تنسورها است. جبری است که سر و کارش با تنسورها است. وقتی به‌دنبال این بروید، می‌فهمید که دارد چکار می‌کند. بردار به چه صورت است؟ شما الآن دستگاه مختصات در ذهنتان هست؛ محور x و محور y. برای این‌که یک نقطه را در یک صفحه معین کنید، به چند چیز نیاز بود؟ دو چیز نیاز داشتید تا بگویید در محور x، چهارتا جلو برو و در محور y شش تا برو، بعد آن نقطه می‌شود. با دو شناسه و دو چیزی که معرفی می‌کرد، در صفحه، یک نقطه‌ای را تعیین می‌کرد. خب در تک محور اعداد، فقط یک نقطه بود که با یک عدد تعیین می‌شد که می‌گویند تنسور رتبه صفر؛ یک عدد است که نقطه تعیین می‌شود.

اما بردار چیست؟ خیلی مفهوم مهمی است. شروعش هم ساده بوده است. در علم فیزیک، فرمول‌هایی که در جاذبیت و نیرو و مکانیک کلاسیک و حرف‌هایی که نیوتن آورده بود را می‌خواستند جلو ببرند، این بردار آمد و بعد هم خیلی ریاضیاتی و قوی شد. آن وقت یک بردار یک بُعدی و دو بُعدی بود، الآن دیگر در این زبان، با بردارهایی با ابعاد بسیار بالا کار می‌کنند. یعنی شما اول باید تصور ساده بردار را بکنید و بعد با ابعاد بالاتر تصور کنید که اصلاً به شکل ریاضی نمی‌توانید دربیاورید و فقط باید تصور عقلانی کنید. بعد از این‌که بردار معلوم شد، بعد هم ماتریس و بعد از ماتریس هم تنسور آمد. تا جلسه دیگر اگر زنده بودیم مبادی این‌ها را مطالعه کنید. من هم اندازه‌ای که مطالعه کرده‌ام، عرض کردم. بینی و بین الله دیگر سن من اقتضاء این حرف‌ها را ندارد، ولی می‌توانم بهانه شوم و هندل بزنم. طبق اقتضای سن، شما ان شاء الله به دنبالش می‌روید و ملاحظه می‌کنید.

ببینید؛ خصوصیت بردار این است که یک نقطه نیست. نقطه، فقط پایه بردار است. وقتی گفتید در طول محور x شش تا جلو برو و شش تا بالا برو، وقتی به آن نقطه رسیدیم، تازه یک پایه‌ای با عرض از مبدأ و طول از مبدأ پیدا کرده‌اید. هر بردار، دو چیز مقوم دارد: جهت و عدد؛ یعنی مقدار یک بردار و جهت بردار. پایه [یا مبدأ] هم که شروع کارش است. بعد می‌گویید از این پایه با فاصله عدد پنج در جهت خاصی. هر چه شما تعیین کنید؛ مختصات سه بعدی، دو بعدی، یا اگر زمان را در کارش بیاورید چهاربعدی می‌شود، با انواع و اقسام آن. مثال‌های آن را چندین جور یادداشت کرده‌ام.

بنابراین مهم‌ترین کاری که در این نسل جدید انجام شده و لذا مشکل جعبه سیاه پیش آمده؛ مشکل جعبه سیاه این است که او در پردازش‌های خودش و در این‌که شما به آن ورودی می‌دهید و بعد هم می‌بینید جواب‌های خوبی می‌دهد، اما توهم هم دارد. هوش مصنوعی می‌تواند تخیل کند؟ تخیل، می‌تواند قاعده‌مند باشد. مهندسین نرم‌افزار برای تخیل هوش مصنوعی مشکلی ندارند و اصلاً به آن برنامه می‌دهند. اما وقتی به اصطلاح خودشان توهم می‌زند، در توهم، دست مهندس بسته است و هیچ کاری نمی‌تواند بکند؛ به محکمی می‌گوید مطلب این است. اما از کجا در آورده است؟ نمی‌دانند. بعداً وقتی خیلی کار کنید، قدم به قدم نه این‌که مکانیسم کار آن را بفهمید، بلکه قدم به قدم کار آن را کنترل می‌کنید و توضیح‌پذیرش می‌کنید. با زحماتی که کشیده‌اند.

شاگرد۲: در این نسل جدید، مهم‌ترین کاری که شده، توضیح‌پذیر بودن است؟

استاد: در نسل جدید، بر مبنای آمار، الگوهایی کشف می‌شود که چه بسا اصلاً بشر هم کشف نکرده‌. ولذا من برای لغت و اشتقاق گفتم که خیلی پرفایده است. یعنی شما الف و باء و کاربرد و آمارش را به این مدل زبانی می‌دهید و همه اطلاعات اشتقاق کبیر را به آن می‌دهید، خودش فقط با آمار شروع می‌کند و کشف الگو می‌کند. الگوهایی که چه بسا بعداً می‌بینید درست هم هست؛ الگوهای زبانی خیلی عالی. این نسل سوم است. یعنی «based statistical»؛ بر پایه و محور آمار جلو می‌رود و کاری به معانی ندارد. فقط با عدد، آمارگیری می‌کند؛ تعداد آمارها و بعد با بردار، «embedding» (تعبیه برداری) می‌کند. مهم‌ترین فنی که الآن خیلی کارساز بوده، همین است که کلمات را توکن‌بندی می‌کنند و در بردارهایی با بُعد زیاد، جهت‌دهی معنایی می‌کنند؛ جهت‌دهی معنایی اما بر مبنای آمار. این نسل سوم است. یعنی بردارهایی است که تعیین می‌کند این کلمات نزدیک هم هستند-درست هم می‌گوید- اما نه این‌که معنا را درک کرده باشد و صرفاً با آمار جلو می‌رود.

تنظیر توضیح‌ناپذیری هوش مصنوعی به پرنده هدهد

شاگرد۱: تحلیل خطای ما که هوش واقعی هستیم چیست؟ ما هم این خطاها را می‌کنیم؛ گاهی ورودی‌ها درست است، ولی خطا می‌کنیم.

استاد: اتفاقاً چون ریخت شبکه‌های عصبی را پیاده سازی کرده‌اند، اگر این‌ها در آینده پیشرفت کند و پردازش‌های عمیق را بتوانند به رده بالای توضیح‌پذیری دربیاورند، چه بسا خیلی از جاهایی که در ذهنمان اشتباه می‌کنیم را به همان نحوه انجام دهند. همان چیزی که مرحوم آسیدعلی نجف‌آبادی می‌گفتند؛ وقتی به نجف رفته بودند گفته بودند نوشته‌جات علمای نجف را برایم بیاورید؛ مبیضّه آن را نیاورید، مسودّه‌ها را بیاورید. این دلالت بر علو علمی آسید علی نجف‌آبادی دارد؛ عالم بزرگی بودند. استاد اسفار مرحومه بانو مجتهده امین بودند. می‌گفتند دست‌نوشته‌های علماء را بیاورید تا وقتی در نجف مشرف هستم، استفاده کنم. ولی پاک‌نویس را نیاورید. چرک‌نویس را بیاورید که خط زده‌اند و برگشته‌اند و درست کرده‌اند. بعد این را می‌گفتند - جمله خیلی بزرگ آسید علی است - می‌گفتند من استفاده‌هایی که از خط زده‌ها می‌کنم بیش از جاهای دیگرش است. این خیلی حرف بزرگی است. یعنی ایشان به نحوه پیشرفت ذهن نویسنده نگاه می‌کند که چطور شد که آن را نوشت و بعد برگشت و خط زد؟! چرا خط زد؟! فهمید اشتباه کرده‌ و چرا اول اشتباه کرده بود؟! چطور شد اشتباه کرده بود؟! درک چطور شدن اشتباه و رفت‌وبرگشت او، یک ذهن لطیف دقیقی می‌خواهد تا بفهمد. کسی که این‌ها را بفهمد در فکر خودش قوی‌تر و سلیم‌تر و از خطا دورتر است. چرا می‌گویند منطق بخوانید؟ «آلة تعصم مراعاتها الذهن عن الخطا فی الفکر»؛ فکر، منظم می‌شود.

شاگرد۲: فرمودید اشتباه را در همان گامی که پیش آمده، کشف می‌کنند، اما نمی‌دانند که چرا اشتباه شده؟

استاد: نه، اول آموزش عمیق پیش آمد و با آن صحبت می‌کردند. می‌دیدند که چیزهایی را می‌گوید که توهم زده است، ولی نمی‌دانند چرا. نمی‌توانند برگردند و بگویند اینجا سبب شد که او توهم زد و نکته توهم زدن او، مشخص نیست. او که داعیه‌ای ندارد که بخواهد دروغ بگوید. ولی حتی با اطمینان می‌آید و می‌گوید مطلب این است.

شاگرد۲: نقطه توهم را کشف می‌کنند، ولی دلیل آن را نمی فهمند.

استاد: نقطه توهم، کشف نمی‌شود، چون عمیق است. قوام عمیق به این است که لایه‌های پردازش، مخفی است. جعبه سیاه، همین است. یادم آمد از کاری که هدهد برای حضرت سلیمان می‌کرد. حضرت سلیمان نشستند و گفتند: «مَا لِيَ لَآ أَرَى ٱلۡهُدۡهُدَ»[1]؛ هدهد کجا است؟ چرا نمی‌بینمش؟ «مَا لِيَ لَا أَرَى ٱلۡهُدۡهُدَ أَمۡ كَانَ مِنَ ٱلۡغَآئِبِينَ، لَأُعَذِّبَنَّهُۥ عَذَابا شَدِيدًا أَوۡ لَأَذۡبَحَنَّهُۥ أَوۡ لَيَأۡتِيَنِّي بِسُلۡطَٰن مُّبِين». بعد هدهد آمد و چه گفت؟ «وَجِئۡتُكَ مِن سَبَإِۭ بِنَبَإ يَقِينٍ». خب حضرت سلیمان منطق الطیر را می‌دانستند؛ «عُلِّمۡنَا مَنطِقَ ٱلطَّيۡرِ»[2]. حضرت سلیمان منطق طیر را می‌دانستند. چطور شد که به‌دنبال هدهد گشتند؟ چکارش داشتند؟ در روایت هست. به نظرم در تفسیر برهان باشد؛ او آب را پیدا می‌کرد. یکی از چیزهای جالب است؛ حضرت، هدهد را با خود می‌بردند به این خاطر که زمین و خاک مانع دیدن چشم هدهد نیست. مثلاً با فاصله صد متر و دویست متر، آب زیر خاک را می‌بیند. در روایت هست که حضرت او را با خودشان می‌بردند. چون لشکر ایشان بیابان‌ها طی می‌کرد. هدهد می‌گفت اینجا را بکَنید و با فاصله پنج متر به آب برسید. نشان‌دادن نقطه، مهم است که جا را بداند کجاست.

مرحوم سید بحر العلوم رضوان‌الله‌علیه! حاج آقا می‌فرمودند می‌خواستند مسجد کوفه را تعمیر کنند، ایشان به وادی السلام، نزدیک قبر حضرت هود و صالح(علیهما السلام) آمد. گفت اینجا را بکَنید. کندند و پایین رفتند؛ سنگ‌های خیلی عال العال و خوبی از زیر خاک درآمد. گفتند این‌ها را برای تعمیر مسجد کوفه ببرید. حالا سید چطور می‌گفت اینجا را بکنید؟ هدهد هم این‌طور بود. بعد هم رفت و گفت «إِنِّي وَجَدْتُ امْرَأَةً تَمْلِكُهُمْ…». آنچه که به ذهنم آمد، این بود: هدهد نگاه می‌کند، در روایت دارد حضرت سلیمان با این‌که پیامبر بودند، [اما به لحاظ عملکرد ظاهری بدن چنین توانی را نداشتند]؛ خب خداوند به هر کسی یک چیزی داده است. آن علوم غیبیه یک چیز است، اما آن عملکرد ظاهری بدن یک نبی، این نیست که زیر خاک، یک چیزی را ببیند. بدن او هم « إِنَّمَا أَنَا۠ بَشَر مِّثۡلُكُمۡ»[3]، و لذا هدهد را به کار می‌گرفتند. ولو ممکن است از حیث مقام نبوت، بالاترش را هم داشتند. مثل خود آصف بن برخیا؛ با این‌که او وصی حضرت بود، اما او را در آوردن تخت بلقیس به کار گرفتند. الآن حضرت، هدهد را به کار گرفتند و او می‌گوید اینجا آب است. بدن هدهد که خداوند به این ظرافت آفریده، خدا آن را یک جعبه سیاه آفریده است. یعنی نه خود هدهد خبر دارد که چرا آنجا را می‌بیند و می‌گوید آب است، و نه ما می‌توانیم بفهمیم -یا حضرت سلیمان به اندازه علمشان- که چه مکانیسمی رخ داده که دارد آب را می‌بیند. ولی می‌گوید اینجا آب است و می‌رویم و می‌بینیم درست است. نکته، این است. مدل زبانی بزرگ چکار می‌کند؟ شما چیزی به آن می‌گویید و درست جواب می‌دهد. یعنی در صد مورد، یکی توهم می‌زند. و الّا صدتا جواب خوب داد. چطور دارد؟ یعنی چطور شد به این نتیجه رسید و توضیح داد؟ ما نمی‌دانیم چطور به این مسیر آمد. «Rule-based» نیست که طبق قاعده رفته باشیم و مسیر را برویم و برگردیم؛ این خبرها نیست. اما می‌بینیم که درست جواب می‌دهد. مثل هدهدی که می‌گوید و می‌کَنیم و می‌بینیم  آب بود. چطور؟ نمی‌دانیم.

راجع به همین هدهد دارد؛ ابوحنیفه از حضرت سؤال کرد، چه شد؟ شما می‌گویید آب را در زیر زمین می‌بیند؟! حضرت فرمودند چه مشکلی دارد؟ می‌خواست ایراد بگیرد. گفت چطور آب را صد متر زیر زمین می‌بیند، اما توری که یک بند انگشت زیر خاک مخفی کرده‌اند را نمی‌بیند؟! ما مکرر دیده‌ایم که هدهد در تور می‌افتد و صیاد آن را می‌گیرد. ابوحنیفه گفت: «ظفرت بك»؛ یعنی گویا مچ شما را گرفتم. چطور آب را زیر زمین می‌بیند، ولی تور صیاد را زیر خاک نمی‌بیند. حاج آقا می‌فرمایند: چون این جور حرف زد، حضرت کنیه او را نگفتند و اسم او را گفتند. حضرت فرمودند: «يا نعمان، أما علمت أنّه إذا نزل القدر أغشي البصر»[4]. حضرت به اشکال او این جواب را دادند.

لذا می‌بینید جایی توهم می‌زند، ولی نمی‌دانیم چه شده است. علی ای حال، خیلی مهم است. هوشی هم که اخیراً آمد، این‌که مهم شد و در سخت‌افزار نیاز کمی داشت، همین « Deepseek» بود. گفتنش آسان است؛ 671 بیلیارد پارامتر دخیل در این است که به شما جواب بدهد. مدل زبانی بزرگ است. اما چرا سخت‌افزار کمتری نسبت به هوش‌های شرکت‌های آمریکایی با بودجه‌های بالا استفاده کردند؟ چون وقتی شما درخواست را به آن می‌دهید، همه را فعال نمی‌کند و با الگوهایی که ریاضیدان‌ها به آن داده‌اند، فقط 67 میلیاردش را فعال می‌کنند. هر درخواستی که می‌دهید، 67 میلیارد پارامتر را فعال می‌کند. 67 تا ششصد و … خیلی است. لذا پردازشش پایین آمد. دیدند در مدل این‌ها، آن نیازی که به سخت‌افزار هست، خیلی کمتر است و در درخواست‌هایتان اینقدر نیاز نبود.

 

والحمد لله رب العالمین 


[1] النمل ۲۰

[2] النمل ۱۶

[3] الکهف ۱۱۰

[4] تفسير کنز الدقائق و بحر الغرائب  ,  جلد۹  ,  صفحه۵۵۴