Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. Две реальности Чернобыля. Спецпроект «Зеркала» к 40-летию катастрофы на ЧАЭС: посмотрите, как власти лгали народу, пока люди гибли
  2. Правда ли, что Беларусью пожертвовали, чтобы спасти Москву? Дятлов виноват? 40 главных вопросов о Чернобыле с понятными ответами
  3. «Хочу перестать быть в конфронтации с ГУБОПиКом». Поговорили с правозащитницей Настой Лойко, которую отпустили после последнего визита Коула
  4. Строящаяся линия метро в Минске изменит направление — что известно о новом маршруте
  5. Сильный ветер валил деревья, срывал крыши, обрывал провода, есть пострадавшие. В МЧС рассказали о последствиях разгула стихии
  6. Чернобыль ни при чем? Почему в Беларуси так много людей имеют проблемы со щитовидной железой
  7. Для торговли вводят новшество — оно грозит дополнительными тратами для покупателей
  8. Женщина пожаловалась на четыре часа очереди в поликлинику. Там провели расследование и дали ответ — задело многих
  9. В мае повысят некоторые пенсии — кто получит прибавку
  10. Неизвестный устроил стрельбу на приеме президента США Дональда Трампа
  11. По ночам возможны заморозки, а днем ветер добавит сырости. С какой погодой в Беларусь придет май
  12. Лукашенко — чиновникам: «Ребята, вы просто одной ногой в тюрьме»
  13. На школьном стадионе в Минске умер 18-летний парень. Что известно о случившемся
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.