سیستم‌عامل و نرم‌افزار

فناوری اطلاعات

March 4, 2023
14:30 شنبه، 13ام اسفندماه 1401
کد خبر: 143659

هوش مصنوعی جدید مایکروسافت امکان درک محتوای تصاویر و حل پازل را دارد

هوش مصنوعی جدید مایکروسافت قادر به نوشتن توضیح برای تصاویر، جواب به سوالات درباره محتوای آن‌ها و پاسخ به آزمون IQ است.
 
پژوهشگران هوش مصنوعی در مایکروسافت به‌تازگی از مدل جدیدی رونمایی کرده‌اند که می‌تواند محتوای تصاویر را بررسی و درک کند و قابلیت‌های دیگری مثل حل پازل، تشخیص متن و درک دستورات زبانی را هم به همراه دارد.
 
هوش مصنوعی Kosmos-1 مایکروسافت چه امکاناتی دارد؟
هوش مصنوعی جدید مایکروسافت که از چندین ماژول تشکیل شده است، Kosmos-1 نام دارد. سازندگان آن، معتقد هستند که این ابزار، یک گام کلیدی برای دستیابی به هوش جامع مصنوعی (AGI) محسوب می‌شود که قادر باشد وظایف عمومی را در سطح انسان به انجام برساند. نکته حائز اهمیت، این است که محصول آزمایشی جدید مایکروسافت می‌تواند از انواع ورودی‌های مختلف مثل متن، صدا، تصویر و حتی ویدئو برای دریافت دستورات استفاده نماید و از این لحاظ کمی با نمونه‌های فعلی شناخته شده، متفاوت است.
 
مثال‌های تصویری منتشر شده از هوش مصنوعی مذکور در مقاله پژوهشی مرتبط با آن، نشان می‌دهد که این ابزار امکان بررسی تصاویر و پاسخ به سوالات مرتبط با محتوای آنها را دارد. خواندن متن در عکس‌ها و نوشتن توضیحات پیرامون آنها از دیگر مواردی است که می‌تواند به انجام برساند. اگرچه درحال حاضر، توجه رسانه‌ای فراوانی روی مدل‌های زبانی عظیم (LLM) هوش مصنوعی وجود دارد؛ اما کارشناسان عقیده دارند که ابزارهای مبتنی بر چند ماژول می‌توانند پتانسیل بیشتری برای تبدیل شدن به هوش مصنوعی جامع باشند. دستیابی به چنین ابزاری، هدف نهایی بسیاری از شرکت‌های فعال در این زمینه، از جمله OpenAI سازنده ChatGPT، است که همکاری نزدیکی هم با مایکروسافت دارد.
 
 
 
البته به نظر می‌رسد که هوش مصنوعی جدید مایکروسافت، به شکل مستقل از OpenAI و تنها توسط ردموندی‌ها، توسعه یافته باشد. سازندگان آن، محصول خود را یک مدل چند ماژوله زبانی عظیم (MLLM) توصیف می‌کنند؛ زیرا با وجود پشتیبانی از ورودی‌های مختلف دستوری، باز هم پردازش‌های نهایی آن براساس مدل متن محور LLM و مشابه با ابزارهای کنونی مانند ChatGPT صورت می‌گیرد. به همین دلیل، کاملاً طبیعی است که برای درک تصاویر توسط این هوش مصنوعی، ابتدا محتوای آن‌ها باید به متن تبدیل شوند.
 
مایکروسافت از داده‌های موجود روی اینترنت برای تعلیم هوش مصنوعی جدید خود استفاده کرده است که از جمله منابع آن می‌توان به گزیده The Pile (مجموعه ۸۰۰ گیگابایتی از متون انگلیسی) و Common Crawl اشاره کرد. پس از تمرین‌های اولیه، عملکرد ابزار مورد بحث در آزمایش‌های مختلف مثل تست‌های درک زبانی، تشخیص کاراکترهای تصویری، نوشتن توضیحات برای عکس‌ها، پاسخ به سوالات از تصاویر یا صفحات اینترنتی و… مورد ارزیابی قرار گرفت. طبق ادعای مایکروسافت، این محصول در بسیاری از تست‌ها توانسته است تا مدل‌های فعلی مورد استفاده را پشت سر بگذارد.
 
 
یکی از تست‌های جالبی که Kosmos-1 توانسته در آن عملکرد قابل قبولی از خود نشان دهد، آزمون ریون (Raven) بوده است. ماتریس پیش‌رونده ریون برای ارزیابی IQ براساس پیش‌بینی توالی‌های تصویری طراحی شده است و در رده ازمون‌های گروهی غیر کلامی هوش قرار می‌گیرد که در اغلب اوقات داخل مراکز آموزشی، استفاده می‌شود. هوش مصنوعی مایکروسافت توانسته است در تلاش‌های خود، ۲۲ الی ۲۶ درصد از سوالات را با موفقیت پاسخ دهد؛ مقداری که اگرچه کم به نظر می‌رسد، ولی از حالت پاسخ تصادفی با نرخ ۱۷ درصد، فاصله محسوسی دارد.
 
محصول تازه مایکروسافت در مراحل اولیه قرار دارد و پیش‌بینی می‌شود که در آینده، با بهینه‌سازی‌های بیشتر، می‌تواند عملکرد بهتری را از خود نشان دهد. چنین مدل‌های هوش مصنوعی که می‌توانند از ورودی‌های گوناگونی پشتیبانی کنند، پتانسیل بالایی برای استفاده به عنوان دستیارهای مصنوعی توسط کاربران دارند. احتمال می‌رود که محققان مایکروسافت با گسترش ابداع خود، بتوانند ویژگی‌های دیگر از جمله تکلم را هم به آن اضافه نمایند. مایکروسافت اعلام کرده است که قصد دارد Kosmos-1 را در اختیار توسعه‌دهندگان قرار دهد؛ ولی هنوز تاریخ دقیقی برای انتشار کدها، اعلام نکرده است.
 
 
  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.