85,8% aniqlik bilan ishlaydi.

Manba: « Hi-Tech_Mail.ru ».    

Nikita Laktyushin

Hi-Tech Mail Muharriri

Необычная повязка на шею позволяет общаться, не говоря ни слова
Manba: Pohang University of Science and Technology

Janubiy Koreyadagi Pohang University of Science and Technology (POSTECH) olimlari tovushsiz nutqni tanib olish va uni to’liq ovozli signalga aylantirishga qodir bo’lgan silikonli bo’yin bog’ichini ishlab chiqdilar. Qurilma so’zlarni talaffuz qilishda paydo bo’ladigan mushaklar va terining zo’rg’a seziladigan harakatlarini qayd etadi va sun’iy intellekt yordamida ularni suhbatdoshga uzatiladigan audioga aylantiradi.

Texnologiya asosida nutq nafaqat tovushdan iborat degan g’oya yotadi. So’zlarni aytishda bo’yin harakatlarining o’ziga xos naqshlari (paternlari) shakllanadi. Katta hajmli uskunalar va elektrodlarni talab qiladigan elektromiografiya yoki elektroensefalografiyaga asoslangan an’anaviy yondashuvlardan farqli o’laroq, POSTECHda miniatyura kamerali va harakat datchiklariga ega yumshoq silikonli yoqadan foydalanildi.

Tizim terining deformatsiya darajasini va ushbu o’zgarishlarning yo’nalishini kuzatib boradi, bu esa nutq apparati harakatlarini aniqroq talqin qilish imkonini beradi. Bog’ich yuzasidagi maxsus markerlar kameraga deformatsiyalarni real vaqt rejimida qayd etishga yordam beradi, algoritm esa qurilmani qayta taqqanda yuzaga keladigan biroz siljishlarni kompensatsiya qiladi.

Pohang University of Science and Technology
Manba: Pohang University of Science and Technology

Ma’lumotlar aniq bir kishining ovoziga o’rgatilgan neyrotarmoq tomonidan qayta ishlanadi. So’z tanib olingandan so’ng, tizim uni serverga yuboradi, u yerda matn individual intonatsiyani saqlab qolgan holda nutqqa aylantiriladi. Tadqiqotchilarning ma’lumotlariga ko’ra, ovozli modelni o’rgatish uchun 10 daqiqadan kamroq yozuv talab qilinadi.

Sinovlar davomida qurilma NATO fonetik alifbosidagi so’zlarni 85,8% aniqlik bilan tanib oldi. Shuningdek, u shovqinga chidamliligini ko’rsatdi: taxminan 90 dB shovqin darajasida tizim yuqori signal/shovqin nisbatini saqlab qolib, tijorat EMG-echimlaridan ustun keldi.

Ishlab chiquvchilarning fikricha, ushbu texnologiya nutqida nuqsoni bor odamlarga yordam berishi, shuningdek, shovqinli sharoitlarda — masalan, ishlab chiqarishda yoki favqulodda xizmatlarda qo’llanilishi mumkin. Potentsial foydalanish ssenariylari orasida aviatsiya, dengiz operatsiyalari va harbiy soha ham tilga olingan.

Tizimning cheklovlari bor: u 26 so’zdan iborat sobit lug’at bilan ishlaydi, foydalanuvchi harakatlanganda esa aniqlik sezilarli darajada — 39,7% gacha tushib ketadi. Kelgusida jamoa so’z boyligini kengaytirishni va jismoniy faollikka chidamlilikni oshirishni rejalashtirmoqda. 

Fan

От qwert.uz