Как это работает

Practice with piano accompaniment and a guide vocal that sings the solfege syllables with you. Mute the vocal to sight-sing on your own, then unmute to check your answers.

Фортепианный аккомпанемент с помощью глубокого обучения

Оригинальные партитуры Ладухина — одноголосные (только мелодия), без аккомпанемента. Партии фортепиано в этом приложении были созданы с помощью BachBot.

BachBot — это модель глубокого обучения, разработанная Фейнманом Ляном в Кембриджском университете. Она использует сети LSTM (Long Short-Term Memory), обученные на примерно 350 хоралах Баха, для автоматической генерации четырёхголосной гармонии в стиле Баха.

Все мелодии Ладухина были поданы на вход BachBot для генерации гармонизаций, а затем результат был вручную переаранжирован разработчиком. Некоторые произведения можно было использовать без изменений, другие требовали значительной переработки, но в целом около 70 % аккомпанементов основаны на гармонизациях BachBot.

Синтез голоса

Голосовой гид генерируется с помощью технологии синтеза певческого голоса.

Основная используемая система — Sinsy, разработанная в Нагойском технологическом институте. Sinsy — технология синтеза певческого голоса на основе HMM (скрытых марковских моделей), которая синтезирует пение из мелодии и текста в формате MusicXML. Система выпущена как открытое ПО (модифицированная лицензия BSD) и работает с минимальным объёмом памяти. Разработчики Sinsy позднее основали университетский стартап Techno-Speech, Inc. и создали коммерческое ПО для синтеза пения «CeVIO».

В некоторых композициях также используется Synthesizer V от Dreamtonics Co., Ltd. Synthesizer V — это движок синтеза певческого голоса, сочетающий конкатенативный синтез с нейронными сетями для создания более естественного звучания.