音声変換入門 Pythonで作って学ぶボイスチェンジャー

Name: 音声変換入門 Pythonで作って学ぶボイスチェンジャー
Brand: 講談社
SKU: 9784065426371
Price: 3960 JPY
Availability: PreOrder

0.0

販売価格

3,960

税込

取扱中

予約受付中

発送目安

発売日以降のお届けになります

・こちらはフラゲ（発売日前日お届け）保証外の商品です

・各種前払い決済は、お支払い確認後の発送となります(Q&A)

在庫表示と発送目安について

店舗取り置きサービスについて

この商品のコレクション情報を確認する

コレクション機能とは？

構成数 : 1

1.[書籍]

音響学・機械学習の基礎から積み上げ、Diffusion Transformerによる音声変換の実装まで至る。
基礎から最先端まで一気通貫に解説!

《目次》
[第1部統計的機械学習に基づく音声言語情報処理]
第1章音声言語情報処理
1.1 音声言語情報処理とは何か
1.2 人間の音声生成
1.3 人間の音知覚
1.4 音声言語データの特徴抽出

第2章統計的機械学習
2.1 音声から何かを学習するということ
2.2 統計的機械学習の手引き
2.3 分類タスク
2.4 回帰タスク

第3章深層ニューラルネットワークの基礎
3.1 単純パーセプトロンから多層パーセプトロンへ
3.2 多層パーセプトロンからDNNへ
3.3 深層生成モデル

第4章実践して学ぶ音声言語情報処理
4.1 Google ColabolatoryでのPythonプログラミング
4.2 多話者音声コーパスのダウンロードと分析
4.3 PyTorchでの深層学習実装

[第2部統計的音声変換の基礎と応用]
第5章深層学習による音声変換の基礎
5.1 音声変換の定義と分類
5.2 作って学ぶ深層学習によるパラレル音声変換
5.3 作って学ぶ深層学習によるノンパラレル音声変換

第6章音声変換を取り巻く技術と社会的側面
6.1 処理タイミングによる音声変換の分類
6.2 変換対象話者の指定方法による音声変換の分類
6.3 変換先話者の学習データ量による分類
6.4 社会への影響
6.5 法的な視点

第7章正規化フローに基づく音声変換
7.1 FreeVCの概要と特徴
7.2 FreeVCのアーキテクチャ
7.3 事前エンコーダ
7.4 事後エンコーダと潜在変数zの推定
7.5 デコーダと波形出力
7.6 話者エンコーダ
7.7 音声変換モデル全体
7.8 識別器
7.9 スペクトログラムリサイズによるデータ拡張
7.10 訓練手順と損失関数
7.11 推論時の流れ

第8章拡散モデルに基づく音声変換モデル
8.1 ゼロショット音声変換
8.2 SeedVCの特徴と強み
8.3 拡散トランスフォーマー
8.4 フローマッチング
8.5 SeedVCの学習と推論

作品の情報

メイン

著者：齋藤佑樹、中村泰貴

フォーマット	書籍
発売日	2026年04月13日
国内/輸入	国内
出版社	講談社
構成数	1
パッケージ仕様	-
SKU	9784065426371
ページ数	272
判型	B5変形

メンバーズレビュー

レビューを書いてみませんか？

音声変換入門 Pythonで作って学ぶボイスチェンジャー

基本情報

商品説明

作品の情報

メンバーズレビュー