Домашняя Часто задаваемые вопросы Ресурсы
Создание реклиста Создание войсбанка Использование (с Assistant) Использование (без Assistant) Список фонем VCCV в ARPAsing
Реклисты Коммишены на OTO Голосовые банки Тестовые USTы Каверные USTы Оригинальные USTы
Этот урок охватывает как запись, так и OTOирования.
Хотя вы можете использовать все, что вам нравится для записи, OREMO будет намного, намного проще. Если вы в настоящее время не знакомы с тем, как его использовать, посмотрите на это как на возможность узнать, как это сделать. Если вы планируете выполнять сэмплирование, вам придется делать это после записи.
Официальная загрузка: OSDN
Wine оболочка для macOS: UTAForum
Английский нативный перевод для Mac UTAForum
(Я рекомендую оболочку Wine, потому что у родной версии mac нет поля для комментариев.)
Для начала загрузите последний список по умолчанию со страницы реклиста. Вы можете выбрать либо версию с индексом, либо без него. If not using OREMO, the version without the index will be much easier to read.
Если вы используете реклист с индексом:
Если вы используете реклист без индекса:
Настройте папку для своего голосового банка и скопируйте + вставьте OREMO-comment.txt (и index.csv, если применимо) в новую папку. В OREMO откройте список. Установите папку назначения в новую папку.
Вы можете записывать с или без GuideBGM. Если вы хотите использовать guideBGM, я рекомендую использовать короткий, созданный для списков CVVC, таких как BGM CVVChinese или VCCV на английском языке.
Файл комментария расскажет вам, как произносить его приблизительно, используя слова и точно используя фонемы arpabet. Эта короткая статья объяснит, как читать и произносить арпабет. Это на самом деле довольно просто! Если вы уже знакомы с другой фонетической системой, такой как система PaintedCZ или X-SAMPA, см. Таблицу на этой странице.
Кроме строк гласных, каждая строка имеет только 1 тип гласных. Все три слога будут рифмоваться.
Спойте 3 слога подряд, как будто записываете VCV. Если в какой-то момент в фонетике есть «q» (или апостроф в словах), это означает короткую паузу (гортанная остановка).
Для справки, вы можете скачать существующие голосовые банки из каталога голосовых банков.
ДЛЯ МУЛЬТИПИТЧА: основная папка голосового банка должна содержать высоту тона, которая не имеет суффиксов. Все остальные поля должны быть размещены в подпапках. При записи не добавляйте суффиксы к именам файлов, иначе Moresampler не сможет прочитать index.csv во время ОТОирования.
ДЛЯ ДОПОЛНИТЕЛЬНЫХ СЕМПЛОВ: любые дополнительные образцы, которые не являются стандартными в ARPAsing, должны быть помещены в подпапку, чтобы они имели отдельный файл oto.ini. Это позволяет ARPAsing Assistant правильно читать основной файл oto.ini только со стандартными записями OTO ARPAsing.
На OTOирование! Просто перетащите папку на moresampler.exe, чтобы сделать это.
Введите 3, чтобы выбрать arpasing. Когда будет предложено переименовать дубликаты, введите y или да. Всякий раз, когда есть несколько одинаковых дифонов, таких как [s t], это добавит числовой суффикс в конце дополнительных копий. Это служит для того, чтобы отличать друг друга от другого, поскольку они могут звучать по-разному в зависимости от контекста соседних фонем в строке. Вы также можете выбрать, включать ли суффикс или нет. Нельзя использовать такие символы, как стрелки или иероглифы, поэтому вам придется использовать суффиксы, такие как “S” или “A#3”.
Если вы используете Mac или Linux, вам придется использовать wine для запуска Moresampler. Откройте терминал в папке, в которой находится файл moresampler.exe, и введите “wine moresampler.exe /path/to/voicebank”. Если вы не можете сделать это, перенесите свои файлы на компьютер с Windows или попросите друга с Windows помочь создать его.
Теперь, когда ваш базовый OTO сформирован, пришло время улучшить его. Каждая запись OTO - это дифон, означающий, что есть только две фонемы или два звука. Как правило, первый - это соединитель для предыдущей заметки, а второй - основная фонема для текущей заметки. Для OTO сначала найдите раздел, соответствующий первой фонеме, затем найдите раздел для второй фонемы.
Это покрывает синее offset и overlap.
[-]
Степень overlap на самом деле не имеет значения для этого, потому что эти заметки всегда идут в начале фразы, сразу после отдыха. Единственная важная вещь - это то, что она покрывает область молчания.
[c]
Взрывные глухие (p t k)
Если это первая фонема в строке, переместите offset так, чтобы overlap заканчивалось примерно за 15 мс до согласной.
Если перед этой фонемой есть другие фонемы, переместите offset туда, где закончилась предыдущая. Убедитесь, что вы не слышите предыдущего. Поместите overlap примерно за 15 мс до согласной.
Озвученные взрывные и аффрикаты (b d g ch jh)
Если это первая фонема в строке, переместите offset таким образом, чтобы overlap заканчивалось там, где начинается согласная.
Если перед этой есть другие фонемы, переместите offset туда, где заканчивалась предыдущая. Убедитесь, что вы не слышите предыдущий. Поместите overlap там, где начинается согласная.
Фрикативы, носовые и жидкие (f v th dh s z sh zh hh m n ng l r)
Переместите offset туда, где начинается согласная. В частности, для ‘r’ вы можете обратиться за помощью к разделу скользящих.
Скользящие (y w)
Эти согласные могут быть трудно различимы на нормальной форме волны. Нажав на кнопку [s], вы можете переключиться в вид спектрограммы, который дает вам другой способ визуализации звука. Яркие области - самые громкие частоты. Эти согласные проявляются как изменение частот с течением времени.
Переместите offset туда, где начинается согласная, затем поместите overlap там, где оно согласовано, до изменения. Preutterance закончится после изменения.
[v]
По умолчанию overlap для этих образцов должно быть прилично большим. Если он абсурдно мал, его перемещение на 50 мсек должно быть хорошо.
Переместите начальное offset, чтобы область между ним и перекрытием находилась на постоянном уровне.
Для дифтонгов overlap должно охватывать область до изменения гласного.
Во всех случаях preutterance должно быть размещено там, где заканчивается первая фонема и начинается вторая фонема. Это также охватывает розовую область, белую область и синюю границу.
[c]
Остановки (p b t d k g ch jh)
Там должно быть немного тишины или почти тишины непосредственно перед согласным. Переместите розовый цвет туда, где начинается тишина, а отсечение-туда, где тишина заканчивается. Да, мы не включаем саму согласную. Это потому, что в UST эта нота будет сопровождаться другим узлом, который действительно имеет согласную. Это обеспечивает плавный переход без неудобного двойного согласного звука.
Фрикативы (f v th dh s z sh zh hh)
Покройте всю согласную розовым цветом до самого конца. Доведите cutoff до того же места, оставив крошечный зазор. Без этого промежутка ресамплеры не смогут его отрендерить. Однако мы не хотим, чтобы эти согласные растягивались.
Если после согласного есть тишина, пусть вместо этого белая область будет тишиной.
Носовые, жидкие и скользящие (m n ng l r y w)
Переместите розовый цвет туда, где согласная начинает быть стабильной и последовательной. Используйте cutoff, чтобы удалить то место, где кончается или исчезает согласная. Эти согласные можно смело растягивать.
[v]
Переместите розовый цвет туда, где гласная начинает быть стабильной и последовательной. Используйте cutoff, чтобы удалить то место, где исчезает гласная. Белая область будет устойчивой частью ноты, что гарантирует, что она будет звучать хорошо.
Для дифонов гласных-гласных поместите preutterance в конце смены гласных.
Для дифтонгов поместите cutoff перед изменением гласной.
[-]
Покройте все розовым, так что все белое-это тишина.
И точно так же ваш голосовой банк уже готов. Пожалуйста, присылайте все выпущенные банки в каталог. Веселитесь, удачи вам!