Bolšaść pracy za ludziej vykanała mašyna, jakaja aŭtamatyčna zhienieravała transkrypcyju 117 tysiač biełaruskich słoŭ z dakładnaściu 98%. A voś raspracavali mašynu śpiecyjalisty Łabaratoryi raspaznavańnia i sintezu maŭleńnia Abjadnanaha instytuta prablem infarmatyki Nacyjanalnaj Akademii navuk.

Užo daŭno pracuje całkam biaspłatnaja anłajn-płatforma dla apracoŭki tekstavaj i hukavoj infarmacyi dla roznych tematyčnych damienaŭ Corpus.by. Na joj sabranyja dziasiatki servisaŭ, jakija dapamahajuć u vyvučeńni biełaruskaj movy i nie tolki. Stvaryli jaje supracoŭniki łabaratoryi. Piać hadoŭ tamu tut było ŭsiaho try servisy. Zatoje siońnia servisaŭ bolš za 40. Na raspracoŭku niekatorych pajšło paŭdnia, na inšyja — miesiacy i hady.

Ciapier tut šmat mahčymaściaŭ: chočacie — hienierujcie transkrypcyi, chočacie — zapuskajcie servis «havoračaja hałava» i hladzicie na čałavieka, jaki ahučvaje toje, što vy paprosicie. Možna pravieryć pravapis, padzialić słovy na składy, uparadkavać słovy pa ałfavicie ci (kab vy ŭžo dakładna ŭpeŭnilisia ŭ raznastajnaści resursu) skanviertavać tekst u kod Morze.

Asabliva karysny servis — «ahučany elektronny hramatyčny słoŭnik». Tut možna pravieryć napisańnie luboha biełaruskaha słova pa ŭsich najaŭnych słoŭnikach i prasłuchać, jak jano hučyć u vykanańni sintezatara maŭleńnia.

Aściarožna — sajt zasmoktvaje!

Dla zručnaści servisy padzielenyja pa siekcyjach: «Vyčytka», «Piśmieńnik», «Linhvist», «Prahramist» i «Roznaje». Płanujecca, što paźniej źjaviacca asobnyja siekcyi dla miedykaŭ, biblijatekaraŭ i fizikaŭ. To bok dla kožnaj prafiesii praduhledžany svoj nabor instrumientaŭ.

Jak Corpus.by źviazany z arfaepičnym słoŭnikam

Kali ŭ Łabaratoryju raspaznavańnia i sintezu maŭleńnia źviarnułasia ŭkładalnica arfaepičnaha słoŭnika Valancina Rusak z prośbaj dapamahčy ŭ raspracoŭcy falijanta, prahramisty prydumali techničnaje rašeńnie, dziakujučy jakomu ŭdałosia zekanomić nie adzin hod pracy.

«Usio pačałosia z taho, što naša łabaratoryja raspracavała aŭtamatyčnuju sistemu sintezu maŭleńnia i vykłała jaje ŭ internet dla volnaha karystańnia, — raspaviadaje zahadčyk łabaratoryi Juraś Hiecevič. — Zhienieravanaje maŭleńnie nie samaje naturalnaje, ale razabrać słovy možna. Sintezatar zvyčajna vykarystoŭvajecca dla taho, kab pakazać studentam i vykładčykam, jak u pryncypie luby biełaruskamoŭny tekst moža pieratvarycca z paśladoŭnaści elektronnych simvałaŭ spačatku ŭ arfahrafičny tekst, a potym — u fanietyčny, jaki ŭ vyniku prahavorvaje mašyna. Heta vielmi važna razumieć, kab budavać čałavieka-mašynny interfiejs».

Juraś Hiecevič. Fota movananova.by

Juraś Hiecevič. Fota movananova.by

Hienieratar pracuje nie z zapisanymi słovami, a z zapisanymi asobnymi hukami.

«Kali ja rabiŭ łabaratornuju va ŭniviersitecie ŭ miežach kursa, jaki vioŭ Juryj Hiecevič, my pracavali niedzie z 80 hukami, — pryhadvaje małodšy navukovy supracoŭnik łabaratoryi Stanisłaŭ Łysy. — Heta było cikava, my sintezavali roznyja teksty, ale nie mahli zrazumieć, što chto nasintezavaŭ. Tady padychodziŭ Juryj i kazaŭ: «Aha, nu, heta z «Kałasoŭ»» [»Kałasy pad siarpom tvaim» Karatkieviča — NN]. Jon byŭ užo spraktykavany i dobra razumieŭ mašynu. Kaniečnie, 80 hukaŭ — heta adno. A tysiačy, jakija my majem ciapier, — zusim inšaje».

Pryncyp raboty sintezatara maŭleńnia paśla i vykarystali dla aŭtamatyčnaj hienieracyi transkrypcyj słoŭ. Stanisłaŭ Łysy stvaryŭ dla hetaha asobny servis — «Hienieratar arfaepičnaha słoŭnika». Spačatku jaho testavali linhvisty, jakija vyšukvali pamyłki i pieradavali ich u łabaratoryju na vypraŭleńnie. U vyniku servis navučyŭsia hienieravać transkrypcyi amal biezdakorna.

«Nam udałosia damahčysia hetych 98% dziakujučy niekalkim sotniam praviłaŭ, jakija prapisali Barys Łabanaŭ, Lilija Cyrulnik, Dźmitryj Pakładok i skarektavali Alena Hiuntar, Jaŭhienija Zianoŭka, Juraś Hiecevič i ja. Prabačcie, kali nie ŭsich raspracoŭščykaŭ praviłaŭ — supracoŭnikaŭ našaj łabaratoryi — uzhadaŭ. Čym bolš vuzkaje praviła, tym składaniej jaho dadać. Uziać toje ž «h» vybuchnoje. Daviałosia łamać hałavu na tym, jak jaho ŭklučyć, kab nie pałamać usio astatniaje», — dadaje Stanisłaŭ Łysy.

Stanisłaŭ Łysy.

Stanisłaŭ Łysy.

Adzin z samych dobra raspracavanych servisaŭ — «Pravierka pravapisu». Prahrama prahaniaje tekst i pa biełaruskich słoŭnikach, i pa zamiežnych. Darečy, karystalnik moža stvaryć i dadać svoj ułasny słoŭnik, jakim inšyja pry žadańni taksama mohuć karystacca.

«Servis pakul što nie prajaŭlaje intelekt, nie šukaje sensavyja pamyłki, a źviarajecca z usimi tymi bazami, što ŭ nas jość. Naprykład, kali ŭ słovie jość pamyłka, ale praź jaje ŭtvarajecca novaje słova, jakoje isnuje, takuju pamyłku servis nie ŭbačyć. Kali ž słova nie sustrakajecca ni ŭ adnym słoŭniku, prahrama abaviazkova pakaža heta, — tłumačyć Stanisłaŭ Łysy.

— Byvaje, čałaviek ustaŭlaje łacinskuju litaru «i» zamiest biełaruskaj, i potym nivodnaja kampjutarnaja prahrama hetaje słova nie razumieje. Adnojčy my navat adšukali słova «arachis», napisanaje całkam anhlijskimi litarami. Prahrama daje mahčymaść ubačyć usie źmiašanyja napisańni».

Stanisłaŭ dadaje, što servisy Corpus.by uvieś čas palapšajucca.

«My adrazu bačym aktyŭnaść karystalnika i nakiroŭvajem vysiłki ŭ raźvićcio taho, što jamu patrebna», — tłumačyć Stanisłaŭ Łysy.

Supracoŭniki łabaratoryi zaklikajuć karystalnikaŭ zachodzić na internet-resurs Corpus.by i znajomicca z servisami, amal kožny ź jakich maje padrabiaznaje apisańnie. A taksama ŭklučacca ŭ ich udaskanaleńnie i paviedamlać pra tyja rečy, jakija možna palepšyć, a taksama pamyłki, što varta vypravić.

Клас
1
Панылы сорам
0
Ха-ха
0
Ого
0
Сумна
0
Абуральна
0

Chočaš padzialicca važnaj infarmacyjaj ananimna i kanfidencyjna?