لبه تکنولوژی

January 23, 2018
14:44 سه شنبه، 3ام بهمنماه 1396
کد خبر: 87470

۳۰ پروژه به پردازش زبان فارسی در فضای مجازی اختصاص یافت

رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران گفت: ۳۰ پروژه به پردازش زبان فارسی در فضای مجازی اختصاص یافت.

علیرضا یاری از آزادسازی خروجی دادگان و ابزارهای پردازش خط و زبان فارسی در فضای مجازی خبر داد و گفت: رشد فناوری اطلاعات و گسترش اینترنت، مرزهای تاثیرگذاری خط و زبان را از مرزهای جغرافیایی فراتر برده و پردازش زبان به عنوان یک نیاز ملی/ بین المللی جهت استفاده بهینه از منابع اطلاعاتی مطرح شده است.

رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران با بیان اینکه کاربردهای مبتنی بر پردازش زبان طبیعی مانند ترجمه ماشینی و جویشگرها اهمیت زیادی پیدا کرده و کشورهای مختلف سرمایه گذاری زیادی در این حوزه داشته اند، از اهمیت ارائه زیرساختهای پردازش خط و زبان فارسی برای نیل به اهداف کلان در فضای مجازی به عنوان دلیل اصلی سرمایه گذاری در این حوزه نام برد.

وی با تشریح برنامه پیشنهادی برای توسعه خط و زبان فارسی، محورهای توسعه خط و زبان را در سه مقوله دادگان و محتوا، ابزارها و کاربردها عنوان کرد و گفت : پژوهشگاه ارتباطات و فناوری اطلاعات (مرکز تحقیقات مخابرات) از چندین سال قبل تاکنون فعالیت­های متعددی را در قالب ۳۰ پروژه درونسپاری و برونسپاری شامل ۱۲ پروژه توسط شرکتهای دانش بنیان، ۱۳ پروژه توسط دانشگاه­ها و ۵ پروژه توسط پژوهشگاه ارتباطات و فناوری اطلاعات در این خصوص آغاز کرده است.

یاری با بیان اینکه برخی از این پروژه ها خاتمه یافته و برخی نیاز به توسعه بیشتری دارند، اضافه کرد: نمونه هایی از دستاوردهای حاصله از این پروژه ها شامل «گراف دانش فارسی» با حدود ۵۰۰ هزار موجودیت، «وردنت عمومی زبان فارسی» با عنوان «فارس­‌نت» شامل ۱۰۰هزار واژه عمومی زبان فارسی و نیز «شبکه تصویری تصویرنت» با حدود ۳۳هزار واژه و ۸ میلیون تصویر و ابزارهای خطایاب املایی و گرامری و نیز ابزارهای پایه پردازش زبان فارسی مانند ابزار تشخیص موجودیت نام­‌مند و مرجع‌­گزینی می شوند.

وی با تاکید بر آزادسازی کلیه دستاوردهای حاصله افزود: در راستای توسعه خدمات وب بومی فعالیت­های متعددی در حوزه توسعه جویشگرهای متنی، تصویری، خبری، نقشه و مستندات علمی و نیز مترجم­‌های دوزبانه فارسی/انگلیسی انجام شده است که ابزارها و دادگان خط و زبان فارسی از زیرساختهای ضروری آنهاست .

رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران برنامه آتی این پژوهشکده را توسعه ابزارهای مورد نیاز و بسط حوزه هایی نظیر خدمات مبتنی بر صوت، نویسه خوان نوری دست نوشته فارسی و همچنین ابزارهای معنایی خط و زبان فارسی و تاثیر آنها در بهبود کیفیت خدمات و کاربردهای بومی عنوان کرد.

  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.