کارکردگرائی در پردازش زبان طبیعی با هوش مصنوعی؛ مثال دو نقطه و مفهوم بردار

این مربوط به بخش اول بود. راجع به بخش دوم، در جلسه قبل مطالبی را عرض کردم. پیشرفت‌هایی که در سال‌های اخیر صورت گرفته و مرتب دارد معلومات عمومی می‌شود و هم کارکردهای آن در دست‌ها می‌آید و …. آقا یک هوش مصنوعی را امتحان کرده بودند. یک فایل صوتی مربوط به حدود یک ساعت مباحثه را با فاصله چند ثانیه، متن می‌کند و دسته‌بندی می‌کند و موضوع‌بندی می‌کند و می‌گوید چند مطلب مطرح شد. خب این کارها دارد صورت می‌گیرد. مبادی این‌ها مهم است. یعنی ببینیم چه شده که الآن به اینجا رسیده است. همه این‌ها، هوش پایه‌محور است. در هوش مصنوعی پایه‌محور چکار کرده‌اند؟ مبادی این بحث، دو روز دیگر معلومات عمومی می‌شود. عرض کردم ممکن است فعلاً در زمان ما اطلاع بر معلومات عمومی، کمال باشد، اما چهار روز دیگر اگر اطلاع نداشته باشیم فقد کمال نیست، بلکه نقص است؛ این را باید بدانیم. لذا بعضی از چیزها را که مطالعه می‌کنم، سرنخی را در ذهن شریف شما راه می‌اندازم، اما پی‌جویی آن توسط شما بجا است. بعدها می‌گویید کار درستی شد که ما اصطلاحات مبادی را یاد گرفتیم. یعنی اگر اقدام نمی‌کردیم، بعدها سخت می‌شد. مبادی آن کم‌کم برای انسان می‌آید.

لذا در جلسه قبل سؤالاتی مطرح شد و اگر یادتان باشد من به صفحه کاغذ مثال زدم. گفتم که یک صفحه کاغذ هست که یک نقطه این طرفش هست و یک نقطه آن طرفش. از این مثال شروع کردم و جلو رفتیم. من با این مثال می‌خواستم مفهوم بردار را توضیح بدهم. چون الآن تمام این کارهایی که امروزه هوش مصنوعی انجام می‌دهد مبتنی بر فهم همین مفهوم بردار است. خاستگاه کلمه بردار، فیزیک و مسائل جاذبیت و ... بوده است؛ بردار جابه‌جایی که با جهت و مقدار نیرو، جابه‌جایی را محاسبه می‌کردند. چون به این صورت بوده، از اول به آن بردار می‌گفتند. فلش هم درست می‌کنند. و الّا امروزه مفهوم بردار ریاضی از آن بردار بودن درآمده است و بردار نیست. بردار فقط برای همان جایی بود که مقدار نیرو و جهتش را مشخص می‌کرد. آن، بردار بود و جابه‌جایی درست می‌کرد. و الّا امروزه بردار، یک آرایه یک بُعدی است. آرایه، خیلی با بردار تفاوت دارد. الآن در بردار، جهت به معنایی که می‌گوییم مطرح نیست. جهت برای نیرو است، ولی برداری که امروزه می‌گوییم، جهت به‌معنای قبلی را اصلاً نیاز ندارد. برداری می‌تواند باشد که اصلاً جهتی که در فیزیک می‌گفتیم در آن نباشد، کما این‌که اصلاً نیست و مرتب از بردارها استفاده می‌شود. فضاهای برداری که الآن هست، تمام این مدل‌های زبانی بزرگ مبتنی بر آن فضاهای برداری هستند که این‌ها بردارهایی هستند که همگرا هستند و به هم نزدیک می‌شوند با آن وزنی که در مبنای آمارگرائی به آن می‌دهند، یا شبکه معنا که ذهن من بیشتر روی شبکه معنا عنایت دارد. قبلاً هم گفته‌ام. تفاوت‌های این‌ها را بفهمیم تا بعداً جلو برویم.

وقتی می‌خواهید یک بردار را درک کنید، آن دو نقطه‌ای که عرض کردم، با ضمیمه مثال‌هایی که زدم را در نظر بگیرید. البته آقایان اشکال کردند و دیدم آن مقصود من خوب واضح نشده است. باز هم مقصودم را عرض می‌کنم تا روی آن تأمل بفرمایید. آن مثالی که عرض کردم هم زمینه این بود که آدم هم بردار را تصور کند و هم زمینه یک چیزی بود که امروزه بسیار مهم است و از مراحل آخر آموزش زبان طبیعی است که به آن «Pragmatism» یا کارکردگرائی می‌گویند. از «Context» متن و زمینه، برای فهم و کشف معنا کمک می‌گیرند. یک پردازش‌گر می‌خواهد از یک واژه کشف معنا کند. یک لفظ در جاهای مختلف جورواجور به کار می‌رود. شما ببینید یک واژه در فارسی، در صدها مورد کاربرد دارد؛ از مشترک لفظی، از مجاز، از شوخی، استفهام و اخبار و …. جورواجور با یک واژه مواجه می‌شوید. هر جایی هم یک مقصودی از آن اراده شده است. اگر شما بخواهید این پردازش‌گر مقصود از این متن را بفهمد، خیلی سخت است. لذا جلسه قبل گفتم اول شکست خورد، بعد با مبنای اتصال‌گرائی، پیشرفت خوبی کرد. آن وقت مشکل جعبه سیاه پیش آمد. تا ببینیم با زحماتی که بعداً کشیده می‌شود تا کجا حل می‌شود. در چنین فضایی با این مواجه می‌شویم که این زبان می‌خواهد پردازش بشود.

خب چرا آن مثال را زدم؟ آن مثال از این جهت خیلی خوب که کارکردگرائی امروزه که آخرین مرحله پردازش زبان طبیعی است را نشان می‌دهد. اولش پردازش آواها است. بعد، پردازش‌های صرفی و نحوی است. بعد هم پردازش‌های معنایی است. بعد از پردازش معنا، تازه به بررسی کارکردگرائی می‌رسد که از خود متن کمک می‌گیریم تا بفهمیم معنای این واژه چیست. و الّا صِرف پردازش معنا با قاموس و حتی دایرة المعارف، فایده‌ای ندارد. شما یک قاموس دارید مثل فرهنگ المنجد یا لسان العرب، اما یک دایرة المعارف دارید که دایرة المعارف با لسان العرب خیلی تفاوت دارد؛ آن، لغت معنا می‌کند، اما دایرة المعارف این‌طور نیست. با این وجود، شما حتی با اطلاع از تمام دایرة المعارف‌های حجیم، نمی‌توانید مقصود تصدیقی از یک واژه در متن را بفهمید و این نیازمند یک کار بسیار عظیمی است. به این، کارکردگرائی می‌گویند که مرتبه آخر پردازش زبان طبیعی است.

مثالی که من عرض کردم، به‌خوبی این را نشان می‌دهد. بعد از اینکه مقدمه مثال دو نقطه را عرض کردم، سؤالی را مطرح کردم که فاصله بین این دو نقطه چقدر است؟ الآن مقصود من از فاصله، کاملاً مرتبط با بستر است. مرتبط با بستری است که این دو نقطه در آنجا هست. و لذا عرض کردم اگر همین کاغذ را خمیده کنید، قبلاً کوتاه‌ترین فاصله ده سانت بود، بعد که آن را خمیده می‌کنید، الآن فاصله این دو نقطه چقدر است؟ اگر از وسط خمیده را نگاه کنیم، پنج سانت است. این‌ها که به هم نزدیک شدند! اگر از روی خود صفحه بروید، همان ده سانت است. الآن این سؤال، سؤال مهمی است. وقتی روی کاغذ خمیده، می‌گویید فاصله این دو نقطه چقدر است، در پردازش زبان طبیعی باید بفهمد در جواب سؤال شما باید فاصله پنج سانتی را جواب بدهد یا دیگری را. یعنی بستر، بستر غامضی است. لذا جاهایی که می‌گویند توضیح‌پذیر نیست و خود پردازش‌گر تصمیم می‌گیرد، برای این است که در موارد آمارگرائی شما نمی‌دانید چرا این را جواب داده است. یعنی روی کارهایی که در پردازش خودش انجام می‌دهد، متفاوت می‌شود، چون یادگیری عمیق بود. در یادگیری ساده، شما می‌دانستید که چه چیزی صورت می‌گیرد، اما چون یادگیری عمیق شده یعنی خروجی‌های چندین لایه دارد به لایه دیگر وارد می‌شود و آخر کار، یک خروجی به شما می‌دهد، نمی‌دانید چه کاری را در لایه‌های عمیق انجام داد. این مثال خیلی واضحی بود. سؤال ساده‌ای مطرح شد که فاصله بین این دو نقطه چقدر است. لذا مثال دیگری عرض کردم و گفتم اگر این برگه را در ماده شیمیایی بگذارید - تورنسل باشد - بعد می‌بینید آن یک دایره بوده است؛ دایره‌ای که این دو نقطه روی محیط آن قرار گرفته‌اند. حالا اگر گفتیم فاصله بین این دو نقطه چقدر است، شما چه می‌گویید؟ آقا گفتند قطر را می‌گوییم. اما این برای زمانی است که شما دو نقطه را دو نقطه متقاطر ببینید. ولی اگر ببینید قوسی که این دو نقطه روی آن قرار گرفته‌اند ۱۸۰ درجه نیست، نمی‌توانید بگویید فاصله آن قطر است. باید بگویید فاصله‌اش آن وتر است.

حالا هم خمیده کنید و هم دایره آشکار شده باشد، می‌گویید فاصله بین این دو نقطه چقدر است؟ چند جواب می‌توان داد؟ لذا سه هندسه معروفی که امروزه هست، همین‌طور است؛ سطوح منفی، سطوح مثبت و سطوح صفر؛ هندسه‌های بیضوی (ریمانی)، هندسه‌های اقلیدسی و هندسه‌های هذلولوی. این سه هندسه کلی است. حتماً آن بستر در این‌ها دخالت دارد. یعنی وقتی می‌گویید فاصله بین این دو نقطه چقدر است، یک سؤال دیگر این است که در کدام سطح است. در سطوح مثبت است؟ در سطوح صفر است؟ یا در سطوح منفی و هذلولوی است؟ همه این‌ها دخالت دارد. عین همین کار در پردازش زبان طبیعی گرفتار آن هستند. یعنی وقتی هوش مصنوعی می‌خواهد بگوید مقصود شما از این واژه چه بود. مثلاً پیکان می‌گویید. وقتی پیکان می‌گویید مقصود چیست؟ ماشین است، فلش پیکان است، یا تیر است، یا اسم یک باشگاه هست. خب کدام یک از این‌ها است؟ تا این اندازه جلو بروید و بگویید، می‌تواند بگردد. مثلاً اگر واژه پیکان آمده، این طرف و آن طرف بگردید؛ مثل دکتری است که می‌گوید ببینید آن مریض چه خورده است. اینجا هم همان‌طور است؛ می‌بیند واژه پیکان گفته‌اید، بعد می‌گردد و می‌بیند چرخ هم گفته‌اید، فرمان هم گفته‌اید. لذا می‌گوید کنار واژه پیکان در اینجا چرخ و … هم آمده، لذا به معنای ماشین است. اگر کلمه کشتن آمده باشد، می‌فهمد که منظور پیکان به‌معنای تیر است. مشکلی که عرض می‌کنم و مهم است، تصمیم‌گیری است. حالا متنی آمده که هم کشتن در آن هست و هم چرخ و فرمان. حالا منظور از پیکانی که آمده، کدام است؟ مخصوصاً در لطائف ادبی؛ در استعارات، مجازات، مجازات بالکنایه. مثلاً منظور در «اظفار» در بیت «وإذا المنية أنشبت أظفارها ***** ألفيت کل تميمة لا تنفع» چیست؟ منظور این است یا آن است؟ این قدر مهم است.

این را عرض کردم تا مراحل پردازش زبان طبیعی را جلوه بدهیم. خود پردازش آوا چقدر دقیق و لطیف است. در آن مباحثه، زبرزنجیره‌ها را عرض کردم. اگر هوش مصنوعی بخواهد صوت شما را تشخیص دهد، حتماً باید در آواشناسی به مرتبه خیلی بالا رفته باشد. چون در صوت شما، استفهام و تعجب و سائر چیزها هست که باید تشخیص بدهد. اگر تشخیص ندهد، نمی‌فهمد که شما می‌خواهید چه بگویید. یعنی صرفاً این نیست که صوت را به متن تبدیل کند، ولی نداند. در مرحله ابتدائی آواشناسی پردازش زبان، مهم‌ترین مباحث زبان‌شناسی به کار می‌رود؛ از زنجیره‌ها، از دون‌زنجیره‌ها و از زبرزنجیره ها، باید این‌ها را به کار بگیرد. الآن هم مقالات خوبی نوشته شده است. مطالعه کنید که خیلی فایده دارد. اساتید خیلی خوبی هستند که بین پردازش زبان ماشینی با زبان‌شناسی نقطه عطف شده‌اند. این اساتید خیلی قیمت دارند. رشته آن‌ها زبان‌شناسی بوده، کاملاً زبان شناسی را می‌دانند، و از طرف دیگر خواسته‌اند این اطلاعات را در هوش مصنوعی پیاده کنند. مقالاتی دارند به‌خصوص در فارسی. در پردازش خط فارسی و پردازش اصوات زبان فارسی که کارهای خوبی شده است.

یکی از مهم‌ترین چیزهایی که چند سال اخیر شده، حالت «embedding» دارد که در متن، یک کلمه را به بردار تبدیل می‌کنید؛ به یک عدد تبدیل می‌کنید؛ به یک وزن تبدیل می‌کنید. این خیلی خیلی کارساز است. این‌که این چیست، شما مطالعه کنید. دو روز دیگر، این‌ها معلومات عمومی می‌شود. یعنی اصطلاحاتی است که مرتب تکرار می‌شود. بعضی از سایت‌های خبری است، اما می‌بینید همین معلومات عمومی دستگاه هوش مصنوعی مرتب به چشم می‌خورد. دو روز دیگر بچه‌هایی که بالا می‌آیند، در سن پانزده و بیست سالگیشان این‌ها را می‌دانند. دیگر چیزی نیست که بخواهند حالت ابهام داشته باشند.

شاگرد۱: این آنتن و بستر رابط، خودش یک فضای بی‌نهایت در بی‌نهایت است، به همین خاطر وقتی می‌خواهند آن را تحلیل کنند، دوباره در یک فضای مجهول با خلأهایی مواجه می‌شوند که باز به این نمی‌رسند که از بیرون آمده و به این دلیل دوباره تحلیل می‌کنند که پس در همین بدن است، یعنی یک حالت عدم قطعیتی وجود دارد که ...

استاد: یعنی آن مثال سنسور که برای ربات زدم و برای خودمان زدم، به آن می‌رسیم و باز هم مشکل داریم؟

شاگرد۱: یعنی بستر رابط را نمی‌توانند تحلیل تام کنند، چون بی‌نهایت است

در ربات مثال خوبی است؛ پس چرا برای آن سنسور می‌گذارند؟

شاگرد۱: در مورد بدن می‌گویم و رابطه بین بدن با عالَم اشراق

استاد: چشم هم همین‌طور است. خود چشم، سنسور فیزیکی است. چطور می‌بندد و نمی‌بیند؟! چون خدا به آن چیزی داده که این مردمک را وقتی می‌بندد، نمی‌بیند.

شاگرد۱: این سنسوری که از اشراق دریافت می‌کند را می‌گویم.

استاد: اتفاقاً بحث ما در همین است. همینجور که اینجا یک سنسوری داریم و شما مشکلی ندارید، اگر همین را آنجا ارائه بدهیم مشکلی ندارند. گودل که از نظر قوه منطقی از همه اینها بالاتر است و متقدم است، چه گفت؟ گفت چرا چشمم سنگ را می‌بیند و مشکلی نداریم، اما وقتی چشم ذهن من عنصر ریاضیاتی را در موطن خودش می‌بیند، آن را انکار می‌کنیم؟ چرا این را می‌گوید؟ چون کار کرده است. با آن فضا مأنوس است و می‌گوید واقعاً ما یک چشمی داریم که عنصر ریاضیاتی و افلاطونی را می‌بیند. اگر ارائه کردیم، عین همین سنسور می‌شود. چرا شما در این سنسور مشکلی ندارید و می‌گویید بحث من در آن نیست؟ چون برایتان واضح است. اگر آنجا هم همین کاری که این سنسور انجام می‌دهد را ارائه دادید، ذهن نوع بشر مثل ذهن همین آقای گودل می‌شود؛ تفاوت ندارد. او با اشتغال و انغمارش به جایی رسیده که این‌ها برایش ممتاز شده است. مثل آن عالمی که گفتم مکاشفات خودش را از مشاهداتش تمییز می‌دهد، گودل هم می‌فهمد که این هم چشم است و دارد می‌بیند و تخیل و فرض نمی‌کند و آن عنصر ریاضیاتی ثابتی که اگر کره زمین و بشر نبود، آن عنصر می‌بود، را دارد می‌بیند. اگر ما بتوانیم مبادی آن را فراهم کنیم به نحوی که نوع بشر به وضوح ببیند، دیگر مشکلی نداریم.

والحمد لله رب العالمین

بازبینی #2
ایجاد شده 9 فوریه 2026 13:19:09 توسط ... .
به روزرسانی شده 9 فوریه 2026 14:29:54 توسط ... .