لبه تکنولوژی

تحلیل نوارهای صوتی ماموریت آپولو با فناوری تشخیص گفتار

 
پژوهشگران آمریکایی، با فناوری تشخیص گفتار، نوارهای صوتی ماموریت آپولو را تحلیل کردند.
 
به گزارش ایسنا و به نقل از گیزمگ، گروهی از پژوهشگران دانشگاه "تگزاس" (Texas) در دالاس برای کمک به حفظ و قابل دسترس ساختن هزاران ساعت از صوت‌های ضبط شده ماموریت آپولو ، از فناوری تشخیص گفتار در مفهوم ساختن و تحلیل مکالمات میان فضانوردان، برج مراقبت و تکنسین‌ها در یک چهارم یک میلیون مایل از فضا استفاده کردند.
 
احتمالا فناوری نوار صوتی آنالوگ در سال 1960، یک موهبت به شمار می‌رفته است.
 
ماموریت 11 آپولو، احتمالا از 380 میلیون سال پیش که اولین ماهی‌ها پا خشکی نهادند بزرگترین ماجرا بود، اما برخلاف آن ماجرا، اولین فرود در ماه می‌توانست به صورت مفصل‌تر و جامع‌تر از هر واقعه بزرگ دیگری در تاریخ که تا آن زمان رخ داده بود، ثبت شود.
 
نمونه استفاده شده در پروژه دانشگاه تگزاس، به تنهایی صوتی از آپولو11، آپولو13 ، آپولو 1 و  ماموریت‌های  Gemini 8 را در برداشت و این مجموعه جزیی از 200 نوار صوتی آنالوگ در 14 ساعت و 30 ترک تشکیل شده است. 
 
 
کهنگی مشکل اصلی بود چون نوارها تنها می‌توانستند در دستگاهی موسوم به Soundscriber در مرکز فضایی جانسون ناسا پخش شوند که یک کوک دستی برای انتقال از یک ترک یه ترک دیگر داشت. بالاتر از همه اینکه این ضبط‌ها خام بود. هیچ اصلاح یا تطبیقی وجود نداشت و شخص در حال صحبت مشخص نبود زیرا بسیاری از تکنسین‌ها با هم صحبت می‌کردند.
 
به گفته دکتر "جان هانسن"(John H.L. Hansen)، بنیانگذار و مدیر مرکز سیستم‌های گفتاری روبوست (CRSS)، احتمالا استفاده از یک Soundscriber برای بررسی نوارهای ماموریت آپولو 11 به 170 سال زمان نیاز دارد.
 
گروه هانسن با همکاری دانشگاه "مریلند" (Maryland) سیستم صوتی جدیدی تولید کرد که می‌توانست در چند ماه این کار را انجام دهد.
 
هانسن می‌گوید: ما نمی‌توانستیم  از SoundScriber استفاده کنیم؛ بنابراین مجبور شدیم نوع جدیدتری را طراحی کنیم. ما دستگاه 30 ترکی خودمان را طراحی کردیم و یک راه حل موازی برای بدست آوردن هر 30 ترک در یک زمان به دست آوردیم. این تنها راه موجود بود.
 
 
مرحله بعد، صرف پنج سال برای بازنویسی و بازسازی آرشیو صوتی با استفاده از فناوری جدید پردازش گفتار و زبان بود که می‌توانست تا 35 نفر را در مکان‌های گوناگون با بسیاری از لهجه‌های محلی تگزاسی بررسی کند.
 
 
این کار، نیاز به الگوریتم‌های جدیدی داشت که بتواند صداهای افراد را تشخیص دهد و آنها را آنالیز کند تا مشخص شود که چه چیز و چه وقت از فرآیندی موسوم به "دیاریزاسیون" (diarization)استفاده شده است.
 
هدف از این کار نه تنها حفظ آسان، پاکسازی و رونویسی این صوت، بلکه یادگیری بیشتر درباره چگونگی کار کردن کارکنان ناسا با یکدیگر تحت استرس ماموریت سفر به ماه است. این کار تقریبا دشوار بود چون صداهای ضبط شده باید به ترتیب زمانی قرار می‌گرفتند اما گروه احساس می‌کند که این تلاش، داستان قهرمانان ستایش نشده عصر فضایی را مشخص می‌کند.
 
این پژوهش در مجله علمی (IEEE/ACM Transactions) در مورد پردازش شنیدار، گفتار و زبان به چاپ رسید.

​​