Тэхналогіі распазванання тэкставай інфармацыі і пераводу яе ў маўленне распрацаваныя шмат для якіх моваў свету. Цяпер і беларуская не выключэнне. У нашай краіне распрацоўкай такой праграмы займаюцца ў Аб’яднаным інстытуце праблем інфарматыкі Нацыянальнай акадэміі навук, а таксама ў прыватнай кампаніі «Сакрамент». Пра сваю распрацоўку расказала кандыдат тэхнічных навук Лілія Цырульнік і малодшы навуковы супрацоўнік Юрась Гецэвіч, які непасрэдна займаецца беларускамоўным сегментам.

«Наша Ніва»: У чым адметнасць вашай лабараторыі?

Лшлія Цырульнік: Наша асаблівасць — гэта распрацоўка сістэмы сінтэзу маўлення для беларускай мовы. Акрамя гэтага, мы распрацавалі такія сістэмы для расейскай і польскай моваў, а таксама займаемся стварэннем сінтэзатара якуцкай мовы.

«НН»: Дзе можа выкарыстоўвацца ваша праграма?

ЛЦ:

Сфера прымянення даволі шырокая: стварэнне аўдыёкніг, чытанне электроннай пошты, дапамога сляпым людзям. Што яшчэ важна, сістэма сінтэзу беларускага маўлення будзе спрыяць захаванню мовы.

«НН»: Колькі каштуе такая праграма?

ЛЦ: Пакуль няма камерцыйнай версіі праграмы для беларускай мовы, яна будзе створана цягам некалькіх месяцаў. Для канчатковага карыстальніка гэта будзе адзін кошт, для карпаратыўнага ўжытку ці для выкарыстоўвання ў сістэмах апавяшчэння абанентаў па тэлефоне — іншы. Напрыклад, створаная намі праграма для агучвання аўдыёкніг на расейскай мове «aBookForge» каштуе каля $7. На гэту лічбу можна арыентавацца.

«НН»: Як даўно вы займаецеся распрацоўкамі сінтэзатараў маўлення?

ЛЦ: Лабараторыя існуе ўжо больш за 40 гадоў. Былы загадчык лабараторыі — Барыс Мяфодзевіч Лабанаў — вядомы вучоны, на рахунку якога шмат навуковых распрацовак. Дарэчы, яго голасам «размаўляе» праграма. А беларускамоўным сінтэзатарам пачалі займацца гадоў 10 таму.

«НН»: Ці звяртаецеся вы да паслуг філолагаў?

ЛЦ: Вядома ж. Трэба ўлічваць асаблівасці і гукаў, і інтанацыі. Напрыклад, у польскай мове націск трапляе пераважна на перадапошні склад. Мовы пастаянна развіваюцца, з’яўляюцца новыя словы. А вось колькасць гукаў — абмежаваная. У беларускай мове ёсць 42 гукі. Такім чынам, з існуючай базы гукаў праграма ўтварае словы, сказы, тэксты… Акрамя таго, адзін і той жа гук можа быць вымаўлены з рознай інтанацыяй і тэмпам.

«НН»: Ці можа праграмма «размаўляць» голасам іншага чалавека па жаданні заказчыка?

ЛЦ: Што тычыцца персанальнага голасу, у нас распрацавана тэхналогія, дзякуючы якой любы дыктар можа прачытаць пэўны тэкст, зрабіць яго аўдыёзапіс. Потым гэты запіс апрацоўваецца спецыяльным чынам і ствараецца маўленчая база дадзеных. Таму тэарэтычна праграма можа размаўляць любым голасам.

«НН»: З якімі цяжкасцямі вы сутыкаліся пры распрацоўцы беларускай версіі?

Юрась Гецэвіч: Найбольшую складанасць выклікаюць розныя скарачэнні, абрэвіятуры, даты, а таксама пастаноўка націскаў у словах. Да таго ж, людзі часта робяць памылкі пры напісанні тэкстаў. Таму мая задача — рабіць лінгвістычны блок, які б мог распазнаваць «закадаваныя» выразы ў тэксце, затым пераводзіць іх у арфаграфічныя словы, знаходзіць гэтыя словы ў слоўніку і расстаўляць націскі. Напачатку слоўніка не было. Нам яго перадалі з Лабараторыі камп’ютарнай лінгвістыкі БДУ. Зразумела, што прыйшлося яго адаптаваць, дадаваць новыя словы, імёны.

Каб лепш зразумець, як працуе праграма, Юрась Гецэвіч надрукаваў некалькі словаў на клавіятуры — і камп’ютар прамовіў прыемным мужчынскім голасам з лёгкім металічным акцэнтам: «Прывітанне, газета «Наша Ніва»! Вы першая беларуская газета з малюнкамі. А мы першая лабараторыя, якая сінтэзуе беларускую мову».

Клас
Панылы сорам
Ха-ха
Ого
Сумна
Абуральна

Хочаш падзяліцца важнай інфармацыяй ананімна і канфідэнцыйна?

Каб пакінуць каментар, калі ласка, актывуйце JavaScript у наладах свайго браўзеру