سیستم‌عامل و نرم‌افزار

فناوری اطلاعات

May 9, 2013
8:26 پنجشنبه، 19ام اردیبهشتماه 1392
کد خبر: 54886

پیکره موازی انگلیسی-فارسی «میزان» ارائه شد

 

پیکره موازی دوزبانه انگلیسی-فارسی با نام «میزان»، با یک میلیون جمله هم‌طراز شده به عنوان پایه و اساس تولید ماشین‌های ترجمه آماری تهیه شده است و در صورت نیاز در اختیار سازمان‌ها، نهادها، دانشگاه‌ها‌، مراکز علمی و پژوهشگران قرار خواهد گرفت.
 
به گزارش آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) از واحد ارتباطات دبیرخانه شورای عالی اطلاع‌رسانی، یکی از بنیادی‌ترین نیازها برای تولید ماشین ترجمه آماری، تولید پیکره‌ای موازی است و این دبیرخانه با توجه به اهمیت موضوع در حوزه گسترش خط و زبان فارسی در محیط رایانه‌ای، تهیه پیکره موازی انگلیسی-فارسی با یک میلیون جمله را در دستور کار خود قرار داد.
 
پیکره موازی از متونی تشکیل می‌شود که برای هر جمله از آن در یک زبان ترجمه معادل آن در زبان دیگر آورده می‌شود. مترجم ماشینی با استفاده از چنین پیکره‌ای، فرآیند ترجمه را فراگرفته و پس از گذراندن مرحله آموزش، می‌تواند برای ترجمه جملات جدید مورد استفاده قرار گیرد.
 
به دلیل نیاز شدیدی که به پیکره‌های موازی در تولید ماشین‌های ترجمه آماری وجود دارد، محققان علاوه بر تحقیقات فراوانی که در زمینه چگونگی یادگیری فرآیند ترجمه و الگوریتم‌های ترجمه آماری انجام داده‌اند، تلاش‌های زیادی نیز در زمینه پیکره‌های موازی و مسائل مربوط به آن‌ها انجام داده‌اند. با وجود همه تلاش‌ها و تحقیقاتی که در زمینه تولید پیکره‌های موازی صورت گرفته، متأسفانه تاکنون پیکره مناسبی که بتواند نیازهای محققان فارسی‌زبان را برآورده نماید، برای زبان فارسی تهیه نشده بود.
 
بر این اساس در مرحله اول پروژه به امکان‌سنجی و راه‌کارها و منابع ممکن برای تولید چنین پیکره‌ای پرداخته شد و سپس ابزار لازم برای الکترونیکی کردن منابع و هم‌طرازی آن‌ها توسعه یافت و در انتها با به‌کارگیری افراد متخصص پیکره‌ای با یک میلیون جمله هم‌طراز شده ایجاد شد.
 
گفتنی است راه‌اندازی سامانه ترجمه آماری پایه با عنوان «مترجم بر خط» با همکاری دانشگاه علم و صنعت و دبیرخانه شورای عالی اطلاع‌رسانی از جمله کاربردهای عملی تهیه پیکره موازی انگلیسی-فارسی میزان است که اکنون به صورت آزمایشی با آدرسwww.machinetranslation.ir در دسترس علاقه‌مندان قرار گرفته است.
 
نتایج ارزیابی‌ها نشان می‌دهد که علیرغم ساده و پایه بودن این سامانه ترجمه، کیفیت ترجمه بر اساس شاخص‌های بین‌المللی (مانند شاخص بلو) در مقایسه با سامانه‌های مشابه ترجمه ماشینی انگلیسی به فارسی قابل قبول است.
 
دریافت این پیکره پس از تکمیل کاربرگ الکترونیکی در قالب تفاهم‌نامه از طریق آدرس www.dadegan.ir/catalog/mizan در اختیار سازمان‌ها، نهادها، دانشگاه‌ها‌، مراکز علمی و پژوهشگران قرار خواهد گرفت.
  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.