Top.Mail.Ru

Распазнаванне дыялектаў і расшыфроўка старажытных кніг: як беларускія навукоўцы выкарыстоўваюць ШІ

У Інстытуце мовазнаўства з дапамогай нейрасетак распрацавалі аўдыёкорпус, які дазваляе пераводзіць запісы народнай гаворкі ў тэкст. Пра гэта ў Міжнародны дзень роднай мовы расказаў БелТА дырэктар Інстытута мовазнаўства імя Якуба Коласа Цэнтра даследаванняў беларускай культуры, мовы і літаратуры НАН Беларусі Ігар Капылоў.


«Мы з дапамогай нейрасетак распрацавалі аўдыёкорпус, які дазваляе пераводзіць гукавыя запісы мясцовай, народнай, дыялектнай мовы ў тэкставы фармат. На працягу дзесяцігоддзяў, пачынаючы з пасляваеннага часу і да сённяшняга дня, навукоўцы выязджалі ў экспедыцыі ва ўсе рэгіёны Беларусі. Па выніках быў сабраны багаты аўдыёфонд, які патрабуе расшыфроўкі. Уручную зрабіць гэта вельмі складана, таму дапамагае ШІ», — сказаў Ігар Капылоў.


Ён дадаў, што аўдыёкорпус быў створаны зусім нядаўна. Праект яшчэ не запушчаны шырока, цяпер ідзе апрабацыя.

Паводле слоў Ігара Капылова, ШІ таксама дапамагае расшыфроўваць старыя друкаваныя кнігі, якія ствараліся з выкарыстаннем розных графічных сродкаў, бо гэта таксама цяжкая праца, якая займае шмат часу. Цяжкасці ўзнікаюць толькі з тэкстамі, сабранымі на Палессі, паколькі там вельмі адметная гаворка.

Яшчэ летась быў створаны сінтэзатар беларускага маўлення для тых, хто хоча атрымліваць інфармацыю па-беларуску, карыстаючыся, напрыклад, банкаматам. Для людзей з праблемамі зроку ён забяспечвае перавод тэкставай інфармацыі ў гукавую.

arrow
Нашы выданні

Толькі самае цікавае — па-беларуску!

Напішыце ў рэдакцыю