فناوری اطلاعات

May 3, 2023
15:03 چهارشنبه، 13ام اردیبهشتماه 1402
کد خبر: 145076

«ChatGpt» نظریه‌های مشهورترین زبان‌شناس جهان را به چالش می‌کشد!

«ChatGpt» پرسش‌هایی را در مورد چگونگی دستیابی انسان به زبان مطرح می‌کند که بحثی را در مورد نظریه‌های «نوآم چامسکی»، مشهورترین زبان‌شناس جهان برانگیخته‌اند.
 
به گزارش اکونومیست، هنگامی که یک ابررایانه شطرنج‌باز موسوم به «دیپ بلو»(Deep Blue)، «گری کاسپاروف»(Garry Kasparov) قهرمان جهان را در سال ۱۹۹۷ شکست داد، ترس از پیروزی ماشین‌ها بر بشریت، بسیاری از مردم را فراگرفت. در این سالها، هوش مصنوعی کارهای شگفت‌انگیزی را انجام داده است اما هیچ‌ کدام نتوانسته‌اند تصورات عمومی را به همان شکل جذب کنند. در هر حال، لحظه شگفت‌انگیز دیپ بلو اکنون بازگشته است زیرا رایانه‌ها چیزی را به کار می‌گیرند که انسانها آن را توانایی تعیین‌کننده خود می‌دانند. این توانایی، زبان است.
 
اگرچه مدل‌های بزرگ زبانی که معروف‌ترین آنها «ChatGpt» است، چیزی مشابه نوشتار بی‌عیب و نقص انسان تولید می‌کنند اما در مورد اینکه ماشین‌ها واقعا چه می‌کنند، بحثی پیرامون نظریه‌های «نوآم چامسکی»(Noam Chomsky) مشهورترین زبان‌شناس جهان درگرفته است.
 
اگرچه ایده‌های پروفسور چامسکی از زمانی که در دهه ۱۹۵۰ به شهرت رسید، به طور قابل توجهی تغییر کرده‌اند اما چندین عنصر نسبتا ثابت مانده‌اند. او و پیروانش استدلال می‌کنند که زبان انسان از نظر نوع(نه فقط میزان بیان) با سایر انواع ارتباطات متفاوت است. همه زبان‌های انسانی بیشتر به یکدیگر شباهت دارند تا مثلا به رمزهای رایانه. پروفسور چامسکی مکررا گفته است که یک مریخی هنگام بازدید از سیاره ما به این نتیجه می‌رسد که همه انسان‌های روی زمین به یک زبان و با تنوع سطحی صحبت می‌کنند.
 
شاید مهم‌ترین نظریه‌ چامسکی این باشد که کودکان با وجود فقدان محرک، زبان مادری خود را با سرعت و سهولت شگفت‌انگیزی یاد می‌گیرند. تنها توضیح برای این موضوع شاید این باشد که نوعی استعداد برای یادگیری زبان در مغز انسان ایجاد شده است.
 
اندیشه‌های چامسکی بر «حوزه زبانی نحو» غالب بوده‌اند، اما بسیاری از زبان‌شناسان مخالف چامسکی هستند و برخی اکنون سعی دارند از ظرفیت‌ مدل‌های بزرگ زبانی برای حمله مجدد به نظریه‌های چامسکی استفاده کنند.
 
دستور زبان، ساختاری سلسله مراتبی و تو در تو دارد که شامل واحدهایی درون واحدهای دیگر است. کلمات، عباراتی را تشکیل می‌دهند که تشکیل‌دهنده جمله‌ها هستند. نظریه چامسکی، یک عملیات ذهنی به نام «ادغام» را مطرح می‌کند که واحدهای کوچک‌تر را به هم می‌چسباند تا واحدهای بزرگ‌تری را تشکیل دهد که می‌توان آنها را ادامه داد. در یکی از مقالاتی که اخیرا در نیویورک تایمز به چاپ رسید، چامسکی و دو نفر از نویسندگان مقاله گفتند: ما می‌دانیم که رایانه‌ها مانند انسان‌ها از زبان استفاده نمی‌کنند و به طور ضمنی این شناخت را در بر می‌گیرند. مدل‌های بزرگ زبانی در واقع فقط واژه بعدی را در میان یک رشته از واژه‌ها پیش‌بینی می‌کنند.
 
با وجود این، درک اینکه مردم به چه چیزی فکر می‌کنند، به چند دلیل دشوار است. جزئیات برنامه‌نویسی و آموزش داده‌های تجاری به چیزی مانند ChatGpt، یک کار اختصاصی است.
 
زبان‌شناسان راه‌های هوشمندانه‌ای را برای آزمایش کردن دانش زیربنایی مدل‌های بزرگ زبانی پیدا کرده‌اند که در واقع آنها را با آزمون‌های کاوشگری فریب می‌دهند. در واقع به نظر می‌رسد که مدل‌های بزرگ زبانی، ساختارهای دستوری تو در تو و سلسله مراتبی را یاد می‌گیرند؛ حتی اگر آنها فقط در معرض ورودی خطی یعنی رشته‌هایی از متن باشند. آنها می‌توانند به مدیریت واژه‌های جدید بپردازند و بخش‌هایی از گفتار را درک کنند. کافی است به ChatGpt بگویید که «dax» یک فعل به معنای خوردن یک برش پیتزا با تا کردن آن است و سیستم آن را به راحتی اجرا می‌کند. در جمله «پس از یک روز طولانی در محل کار، من دوست دارم در حین تماشای برنامه تلویزیونی مورد علاقه‌ام استراحت کنم و یک برش پیتزا را با تا کردن آن بخورم»( After a long day at work, I like to relax and dax on a slice of pizza while watching my favourite tv show.)، عنصر تقلیدی را می‌توان در «dax on» مشاهده کرد که ChatGpt احتمالا آن را از الگوهایی مانند «chew on» یا «munch on» به دست آورده است.
 
در مورد فقدان محرک چطور؟ به هر حال، مدل زبانی بزرگ «Gpt-۳» که زیربنای ChatGpt تا پیش از انتشار اخیر «Gpt-۴» در نظر گرفته می‌شود، با حدود ۱۰۰۰ برابر داده‌هایی که یک انسان ۱۰ ساله در معرض آن قرار می‌گیرد، آموزش می‌بیند. این موضوع، چنین امکانی را به جا می‌گذارد که کودکان به دستور زبان تمایل ذاتی دارند و همین امر آنها را بسیار ماهرتر از هر مدل زبانی بزرگی می‌کند.
 
در مقاله‌ای که در مجله «Linguistic Inquiry» به چاپ خواهد رسید، پژوهشگران ادعا می‌کنند یک مدل زبانی بزرگ را روی متنی آموزش داده‌اند که یک کودک انسان در معرض آن قرار می‌گیرد و دریافته‌اند که مدل زبانی می‌تواند حتی از بخش‌های نادر دستور زبان استفاده کند. سایر پژوهشگران تلاش کرده‌اند یک مدل زبانی بزرگ را روی پایگاه داده‌ای از زبانی آموزش دهند که فقط توسط کودک هدایت می‌شود و یک کپی از صحبت‌های افرادی است که با کودکان صحبت می‌کنند. در اینجا، مدل زبانی بزرگ به مراتب بدتر است. همان طور که پروفسور چامسکی می‌گوید، شاید مغز واقعا برای زبان ساخته شده است.
 
قضاوت کردن سخت است. هر دو طرف بحث در حال بررسی مدل‌های زبانی بزرگ هستند تا ادعای خود را تقویت کنند. خود بنیان‌گذار مکتب زبان‌شناسی، تنها یک پاسخ بی‌پرده را ارائه کرده است. برای این که نظریه‌های او از این چالش جان سالم به در ببرند، باید دفاع قوی‌تری داشته باشد.
  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.