Аспирантони донишгоҳи Корнелл Руйдонг Чжан дастгоҳи нав – айнаки EchoSpeech-ро таҳия кардааст, ки қодир ба «шунидани» сухани хомӯши соҳиби онро дорад, танҳо артикуляцияи чеҳра кифоя аст.
Айнакҳо бо сонар муҷаҳҳаз шудаанд ва қодиранд ҳаракатҳои лабҳо ва забонро, ки мавҷҳои садои заифро тавлид мекунанд, бигиранд. Сипас ин мавҷҳо тавассути алгоритмҳои омӯзиши мошин коркард карда мешаванд, ки ҳаракатҳои лаб ва забонро тафсир мекунанд ва онҳоро ба сухани аудиоӣ тарҷума мекунанд.
Формати айнак нисбат ба гӯшмонакҳо қулайтар буд, зеро ба корбар лозим нест, ки ба камера нигоҳ кунад ё ба гӯш чизе гузорад. Ин ба корбар имкон медиҳад, ки фаъолият ва муоширати худро дар вақти воқеӣ сабт кунад ва дар ҳоле ки озодтар ва мобилӣ боқӣ мемонад.
Маълумоте, ки дар айнак сабт шудааст, ба смартфон интиқол дода мешавад, ки дар он бо алгоритмҳои зеҳни сунъӣ коркард карда мешавад. Ин ба корбарон имкон медиҳад, ки паёмҳои худро ба осонӣ таҳрир ва мубодила кунанд ва инчунин тавсияҳо дар бораи чӣ гуна ҷолибтар ва ҷолибтар кардани мундариҷаи худро гиранд.
Айнакҳои EchoSpeech-ро метавон ҳамчун дастгоҳи стандартии вуруд истифода кард, ки микрофонҳои анъанавӣ ва сабткунакҳои овозиро иваз мекунад. Ба гуфтаи Чжан, ин маҳсули инноватсионӣ метавонад барои афроди дорои нуқсони нутқ ва ҳамчунин ниҳодҳои низомӣ, пулис ва иктишофӣ, ки бояд дар ҳолатҳои муайян хомӯшона муошират кунанд, муфид бошад.
АКС: аз манбаъҳои кушода