کارکردگرائی در پردازش زبان طبیعی با هوش مصنوعی؛ مثال دو نقطه و مفهوم بردار
این مربوط به بخش اول بود. راجع به بخش دوم، در جلسه قبل مطالبی را عرض کردم. پیشرفتهایی که در سالهای اخیر صورت گرفته و مرتب دارد معلومات عمومی میشود و هم کارکردهای آن در دستها میآید و …. آقا یک هوش مصنوعی را امتحان کرده بودند. یک فایل صوتی مربوط به حدود یک ساعت مباحثه را با فاصله چند ثانیه، متن میکند و دستهبندی میکند و موضوعبندی میکند و میگوید چند مطلب مطرح شد. خب این کارها دارد صورت میگیرد. مبادی اینها مهم است. یعنی ببینیم چه شده که الآن به اینجا رسیده است. همه اینها، هوش پایهمحور است. در هوش مصنوعی پایهمحور چکار کردهاند؟ مبادی این بحث، دو روز دیگر معلومات عمومی میشود. عرض کردم ممکن است فعلاً در زمان ما اطلاع بر معلومات عمومی، کمال باشد، اما چهار روز دیگر اگر اطلاع نداشته باشیم فقد کمال نیست، بلکه نقص است؛ این را باید بدانیم. لذا بعضی از چیزها را که مطالعه میکنم، سرنخی را در ذهن شریف شما راه میاندازم، اما پیجویی آن توسط شما بجا است. بعدها میگویید کار درستی شد که ما اصطلاحات مبادی را یاد گرفتیم. یعنی اگر اقدام نمیکردیم، بعدها سخت میشد. مبادی آن کمکم برای انسان میآید.
لذا در جلسه قبل سؤالاتی مطرح شد و اگر یادتان باشد من به صفحه کاغذ مثال زدم. گفتم که یک صفحه کاغذ هست که یک نقطه این طرفش هست و یک نقطه آن طرفش. از این مثال شروع کردم و جلو رفتیم. من با این مثال میخواستم مفهوم بردار را توضیح بدهم. چون الآن تمام این کارهایی که امروزه هوش مصنوعی انجام میدهد مبتنی بر فهم همین مفهوم بردار است. خاستگاه کلمه بردار، فیزیک و مسائل جاذبیت و ... بوده است؛ بردار جابهجایی که با جهت و مقدار نیرو، جابهجایی را محاسبه میکردند. چون به این صورت بوده، از اول به آن بردار میگفتند. فلش هم درست میکنند. و الّا امروزه مفهوم بردار ریاضی از آن بردار بودن درآمده است و بردار نیست. بردار فقط برای همان جایی بود که مقدار نیرو و جهتش را مشخص میکرد. آن، بردار بود و جابهجایی درست میکرد. و الّا امروزه بردار، یک آرایه یک بُعدی است. آرایه، خیلی با بردار تفاوت دارد. الآن در بردار، جهت به معنایی که میگوییم مطرح نیست. جهت برای نیرو است، ولی برداری که امروزه میگوییم، جهت بهمعنای قبلی را اصلاً نیاز ندارد. برداری میتواند باشد که اصلاً جهتی که در فیزیک میگفتیم در آن نباشد، کما اینکه اصلاً نیست و مرتب از بردارها استفاده میشود. فضاهای برداری که الآن هست، تمام این مدلهای زبانی بزرگ مبتنی بر آن فضاهای برداری هستند که اینها بردارهایی هستند که همگرا هستند و به هم نزدیک میشوند با آن وزنی که در مبنای آمارگرائی به آن میدهند، یا شبکه معنا که ذهن من بیشتر روی شبکه معنا عنایت دارد. قبلاً هم گفتهام. تفاوتهای اینها را بفهمیم تا بعداً جلو برویم.
وقتی میخواهید یک بردار را درک کنید، آن دو نقطهای که عرض کردم، با ضمیمه مثالهایی که زدم را در نظر بگیرید. البته آقایان اشکال کردند و دیدم آن مقصود من خوب واضح نشده است. باز هم مقصودم را عرض میکنم تا روی آن تأمل بفرمایید. آن مثالی که عرض کردم هم زمینه این بود که آدم هم بردار را تصور کند و هم زمینه یک چیزی بود که امروزه بسیار مهم است و از مراحل آخر آموزش زبان طبیعی است که به آن «Pragmatism» یا کارکردگرائی میگویند. از «Context» متن و زمینه، برای فهم و کشف معنا کمک میگیرند. یک پردازشگر میخواهد از یک واژه کشف معنا کند. یک لفظ در جاهای مختلف جورواجور به کار میرود. شما ببینید یک واژه در فارسی، در صدها مورد کاربرد دارد؛ از مشترک لفظی، از مجاز، از شوخی، استفهام و اخبار و …. جورواجور با یک واژه مواجه میشوید. هر جایی هم یک مقصودی از آن اراده شده است. اگر شما بخواهید این پردازشگر مقصود از این متن را بفهمد، خیلی سخت است. لذا جلسه قبل گفتم اول شکست خورد، بعد با مبنای اتصالگرائی، پیشرفت خوبی کرد. آن وقت مشکل جعبه سیاه پیش آمد. تا ببینیم با زحماتی که بعداً کشیده میشود تا کجا حل میشود. در چنین فضایی با این مواجه میشویم که این زبان میخواهد پردازش بشود.
خب چرا آن مثال را زدم؟ آن مثال از این جهت خیلی خوب که کارکردگرائی امروزه که آخرین مرحله پردازش زبان طبیعی است را نشان میدهد. اولش پردازش آواها است. بعد، پردازشهای صرفی و نحوی است. بعد هم پردازشهای معنایی است. بعد از پردازش معنا، تازه به بررسی کارکردگرائی میرسد که از خود متن کمک میگیریم تا بفهمیم معنای این واژه چیست. و الّا صِرف پردازش معنا با قاموس و حتی دایرة المعارف، فایدهای ندارد. شما یک قاموس دارید مثل فرهنگ المنجد یا لسان العرب، اما یک دایرة المعارف دارید که دایرة المعارف با لسان العرب خیلی تفاوت دارد؛ آن، لغت معنا میکند، اما دایرة المعارف اینطور نیست. با این وجود، شما حتی با اطلاع از تمام دایرة المعارفهای حجیم، نمیتوانید مقصود تصدیقی از یک واژه در متن را بفهمید و این نیازمند یک کار بسیار عظیمی است. به این، کارکردگرائی میگویند که مرتبه آخر پردازش زبان طبیعی است.
مثالی که من عرض کردم، بهخوبی این را نشان میدهد. بعد از اینکه مقدمه مثال دو نقطه را عرض کردم، سؤالی را مطرح کردم که فاصله بین این دو نقطه چقدر است؟ الآن مقصود من از فاصله، کاملاً مرتبط با بستر است. مرتبط با بستری است که این دو نقطه در آنجا هست. و لذا عرض کردم اگر همین کاغذ را خمیده کنید، قبلاً کوتاهترین فاصله ده سانت بود، بعد که آن را خمیده میکنید، الآن فاصله این دو نقطه چقدر است؟ اگر از وسط خمیده را نگاه کنیم، پنج سانت است. اینها که به هم نزدیک شدند! اگر از روی خود صفحه بروید، همان ده سانت است. الآن این سؤال، سؤال مهمی است. وقتی روی کاغذ خمیده، میگویید فاصله این دو نقطه چقدر است، در پردازش زبان طبیعی باید بفهمد در جواب سؤال شما باید فاصله پنج سانتی را جواب بدهد یا دیگری را. یعنی بستر، بستر غامضی است. لذا جاهایی که میگویند توضیحپذیر نیست و خود پردازشگر تصمیم میگیرد، برای این است که در موارد آمارگرائی شما نمیدانید چرا این را جواب داده است. یعنی روی کارهایی که در پردازش خودش انجام میدهد، متفاوت میشود، چون یادگیری عمیق بود. در یادگیری ساده، شما میدانستید که چه چیزی صورت میگیرد، اما چون یادگیری عمیق شده یعنی خروجیهای چندین لایه دارد به لایه دیگر وارد میشود و آخر کار، یک خروجی به شما میدهد، نمیدانید چه کاری را در لایههای عمیق انجام داد. این مثال خیلی واضحی بود. سؤال سادهای مطرح شد که فاصله بین این دو نقطه چقدر است. لذا مثال دیگری عرض کردم و گفتم اگر این برگه را در ماده شیمیایی بگذارید - تورنسل باشد - بعد میبینید آن یک دایره بوده است؛ دایرهای که این دو نقطه روی محیط آن قرار گرفتهاند. حالا اگر گفتیم فاصله بین این دو نقطه چقدر است، شما چه میگویید؟ آقا گفتند قطر را میگوییم. اما این برای زمانی است که شما دو نقطه را دو نقطه متقاطر ببینید. ولی اگر ببینید قوسی که این دو نقطه روی آن قرار گرفتهاند ۱۸۰ درجه نیست، نمیتوانید بگویید فاصله آن قطر است. باید بگویید فاصلهاش آن وتر است.
حالا هم خمیده کنید و هم دایره آشکار شده باشد، میگویید فاصله بین این دو نقطه چقدر است؟ چند جواب میتوان داد؟ لذا سه هندسه معروفی که امروزه هست، همینطور است؛ سطوح منفی، سطوح مثبت و سطوح صفر؛ هندسههای بیضوی (ریمانی)، هندسههای اقلیدسی و هندسههای هذلولوی. این سه هندسه کلی است. حتماً آن بستر در اینها دخالت دارد. یعنی وقتی میگویید فاصله بین این دو نقطه چقدر است، یک سؤال دیگر این است که در کدام سطح است. در سطوح مثبت است؟ در سطوح صفر است؟ یا در سطوح منفی و هذلولوی است؟ همه اینها دخالت دارد. عین همین کار در پردازش زبان طبیعی گرفتار آن هستند. یعنی وقتی هوش مصنوعی میخواهد بگوید مقصود شما از این واژه چه بود. مثلاً پیکان میگویید. وقتی پیکان میگویید مقصود چیست؟ ماشین است، فلش پیکان است، یا تیر است، یا اسم یک باشگاه هست. خب کدام یک از اینها است؟ تا این اندازه جلو بروید و بگویید، میتواند بگردد. مثلاً اگر واژه پیکان آمده، این طرف و آن طرف بگردید؛ مثل دکتری است که میگوید ببینید آن مریض چه خورده است. اینجا هم همانطور است؛ میبیند واژه پیکان گفتهاید، بعد میگردد و میبیند چرخ هم گفتهاید، فرمان هم گفتهاید. لذا میگوید کنار واژه پیکان در اینجا چرخ و … هم آمده، لذا به معنای ماشین است. اگر کلمه کشتن آمده باشد، میفهمد که منظور پیکان بهمعنای تیر است. مشکلی که عرض میکنم و مهم است، تصمیمگیری است. حالا متنی آمده که هم کشتن در آن هست و هم چرخ و فرمان. حالا منظور از پیکانی که آمده، کدام است؟ مخصوصاً در لطائف ادبی؛ در استعارات، مجازات، مجازات بالکنایه. مثلاً منظور در «اظفار» در بیت «وإذا المنية أنشبت أظفارها ***** ألفيت کل تميمة لا تنفع» چیست؟ منظور این است یا آن است؟ این قدر مهم است.
این را عرض کردم تا مراحل پردازش زبان طبیعی را جلوه بدهیم. خود پردازش آوا چقدر دقیق و لطیف است. در آن مباحثه، زبرزنجیرهها را عرض کردم. اگر هوش مصنوعی بخواهد صوت شما را تشخیص دهد، حتماً باید در آواشناسی به مرتبه خیلی بالا رفته باشد. چون در صوت شما، استفهام و تعجب و سائر چیزها هست که باید تشخیص بدهد. اگر تشخیص ندهد، نمیفهمد که شما میخواهید چه بگویید. یعنی صرفاً این نیست که صوت را به متن تبدیل کند، ولی نداند. در مرحله ابتدائی آواشناسی پردازش زبان، مهمترین مباحث زبانشناسی به کار میرود؛ از زنجیرهها، از دونزنجیرهها و از زبرزنجیره ها، باید اینها را به کار بگیرد. الآن هم مقالات خوبی نوشته شده است. مطالعه کنید که خیلی فایده دارد. اساتید خیلی خوبی هستند که بین پردازش زبان ماشینی با زبانشناسی نقطه عطف شدهاند. این اساتید خیلی قیمت دارند. رشته آنها زبانشناسی بوده، کاملاً زبان شناسی را میدانند، و از طرف دیگر خواستهاند این اطلاعات را در هوش مصنوعی پیاده کنند. مقالاتی دارند بهخصوص در فارسی. در پردازش خط فارسی و پردازش اصوات زبان فارسی که کارهای خوبی شده است.
یکی از مهمترین چیزهایی که چند سال اخیر شده، حالت «embedding» دارد که در متن، یک کلمه را به بردار تبدیل میکنید؛ به یک عدد تبدیل میکنید؛ به یک وزن تبدیل میکنید. این خیلی خیلی کارساز است. اینکه این چیست، شما مطالعه کنید. دو روز دیگر، اینها معلومات عمومی میشود. یعنی اصطلاحاتی است که مرتب تکرار میشود. بعضی از سایتهای خبری است، اما میبینید همین معلومات عمومی دستگاه هوش مصنوعی مرتب به چشم میخورد. دو روز دیگر بچههایی که بالا میآیند، در سن پانزده و بیست سالگیشان اینها را میدانند. دیگر چیزی نیست که بخواهند حالت ابهام داشته باشند.
شاگرد۱: این آنتن و بستر رابط، خودش یک فضای بینهایت در بینهایت است، به همین خاطر وقتی میخواهند آن را تحلیل کنند، دوباره در یک فضای مجهول با خلأهایی مواجه میشوند که باز به این نمیرسند که از بیرون آمده و به این دلیل دوباره تحلیل میکنند که پس در همین بدن است، یعنی یک حالت عدم قطعیتی وجود دارد که ...
استاد: یعنی آن مثال سنسور که برای ربات زدم و برای خودمان زدم، به آن میرسیم و باز هم مشکل داریم؟
شاگرد۱: یعنی بستر رابط را نمیتوانند تحلیل تام کنند، چون بینهایت است
در ربات مثال خوبی است؛ پس چرا برای آن سنسور میگذارند؟
شاگرد۱: در مورد بدن میگویم و رابطه بین بدن با عالَم اشراق
استاد: چشم هم همینطور است. خود چشم، سنسور فیزیکی است. چطور میبندد و نمیبیند؟! چون خدا به آن چیزی داده که این مردمک را وقتی میبندد، نمیبیند.
شاگرد۱: این سنسوری که از اشراق دریافت میکند را میگویم.
استاد: اتفاقاً بحث ما در همین است. همینجور که اینجا یک سنسوری داریم و شما مشکلی ندارید، اگر همین را آنجا ارائه بدهیم مشکلی ندارند. گودل که از نظر قوه منطقی از همه اینها بالاتر است و متقدم است، چه گفت؟ گفت چرا چشمم سنگ را میبیند و مشکلی نداریم، اما وقتی چشم ذهن من عنصر ریاضیاتی را در موطن خودش میبیند، آن را انکار میکنیم؟ چرا این را میگوید؟ چون کار کرده است. با آن فضا مأنوس است و میگوید واقعاً ما یک چشمی داریم که عنصر ریاضیاتی و افلاطونی را میبیند. اگر ارائه کردیم، عین همین سنسور میشود. چرا شما در این سنسور مشکلی ندارید و میگویید بحث من در آن نیست؟ چون برایتان واضح است. اگر آنجا هم همین کاری که این سنسور انجام میدهد را ارائه دادید، ذهن نوع بشر مثل ذهن همین آقای گودل میشود؛ تفاوت ندارد. او با اشتغال و انغمارش به جایی رسیده که اینها برایش ممتاز شده است. مثل آن عالمی که گفتم مکاشفات خودش را از مشاهداتش تمییز میدهد، گودل هم میفهمد که این هم چشم است و دارد میبیند و تخیل و فرض نمیکند و آن عنصر ریاضیاتی ثابتی که اگر کره زمین و بشر نبود، آن عنصر میبود، را دارد میبیند. اگر ما بتوانیم مبادی آن را فراهم کنیم به نحوی که نوع بشر به وضوح ببیند، دیگر مشکلی نداریم.
والحمد لله رب العالمین