Жаңалықтар

Дауыс қалай мәтінге айналады?

Жақында ғалым ­Өркен Мамырбаев қазақ тіліндегі дауыстық хабарламаларды мәтінге ауыс­тыратын жүйе ойлап тапты. «Kazak ASR» жүйе­сі Telegram әлеуметтік желісінде чат-бот ретінде жұмыс істейді.

[smartslider3 slider=2988]

 Өркен Мамырбаевтың айтуынша, платформаны жасауға 3 жыл уақыт кеткен. Ал ғалым 10 жылдан бері ғылыммен айналысып келеді. Қазіргі таңда Ғылым комитетінің Ақпараттық және есептеуіш технологиялар институтының ғылыми қызметкері.

– Әзірленген жүйе Telegram-да чат-бот ретінде жұмыс істейді. Жүйені тексеру үшін дауыстық хабарлама түймесін басып тұру керек. Жазу аяқталғаннан кейін бот сіздің дауыстық сигналдарыңызды мәтінге айналдырады. Сонымен қатар жиналыс немесе кездесу кезінде қосуға болатын дыбыс жазу құрылғысын әзірледік. Жиналыс аяқталғаннан кейін құрылғы қазақ тілінде дауысты мәтінге айналдырып береді. Бұл, бір жағынан, күнделікті өмірде де қолдануға тиімді. Мәселен, рөлде келе жатып екінші адамға дауыс­тық хабарлама жібердік делік. Ол жиналыста отырып, тыңдай алмауы мүмкін.  «Kazak ASR»  дауысты мәтін арқылы көрсетіп береді. Мұны негізі әлеуметтік желіге арнап істедік. Қазіргі таңда журналистерге де тиімді қосымша болып отыр, – дейді ғалым.

Қазақ тілінде дауысты мәтінге айналдыру қосымшасы әлі күнге жоқ. Соңғы үш жылда IT саласы жақсы дамығандықтан, осы жүйені жасап шығуға мүмкіндік болған.

– Негізі дауысты мәтінге айналдыру қосымшалары көп. Тек қазақ тілінде қолданыста жоқ. Себебі орыс, ағылшын, қытай тілдері көпресурсты тілдер саналады. Ал қазақ тілі аз ресурсты тілге жататындықтан, жүйені жасау қиындық тудыр­ды. Өйткені алдымен қазақ тіліндегі мәліметтер қорын құрдық. Одан соң сөйлеу базасын жасадық. Сөйтіп, машиналық оқыту тіліне айналдырдық. Мұның бәрін реттеу үшін уақыт керек болды. Әлемде мұндай қосымшалар көп. Бірақ бізге қазақ тілінің арнайы моделін құру керек болды. Сол үшін де кеш дайын болды, – дейді Өркен Мамырбаев.

«Kazak ASR»  чат-ботында кейбір дауыстық хабарламаларда қате кетуі мүмкін. Мұның екі себебі бар.

– Біріншіден, чат-ботқа дауыс­ты енгізген кезде белгілі бір ырғақпен сөйлеу керек. Себебі сөйлеген кезде кейбір әріптер жұтылады да, мәтінді қате шығарады. Екіншіден, кейбір сөздер сөздік қорда жоқ болуы мүмкін. Өйткені біздің жүйе 2000 сағатқа ғана шақталған. Алдағы уақытта мұны 5000 сағатқа жеткізуге тырысып жатырмыз. 10000 сағатқа жеткізгенде, сөздерді толық әрі қатесіз оқитын болады, – дейді Өркен Мамырбаев.

Ғалымның айтуынша, чат-боттан бөлек, «Kazak ASR» жүйе­сінің «Митинг» деп аталатын қосымшасы бар. 3 адам жиналыста отырған кезде дауысты танып, автоматты түрде мәтінге айналдырады. Бірақ бұл  компьютерлерге ғана арналған.

Айзада Жайыққызы

 

Тағыда

Ұқсас жаңалықтар

Пікір үстеу

Back to top button