堀, 佐伯, 小坂,「敵対的生成ネットワークを用いた歌声変換の各種検討」
日本音響学会春季研究発表会, 1-2Q-7, 2021.3.10
並列学習と非並列学習の例
|
元音声 |
目標音声 |
変換音声 |
|
元音声 |
目標音声 |
変換音声 |
並列 |

男声童謡 |

女性童謡 |

男声童謡 →
女性童謡 |
|

女性童謡 |

男声童謡 |

女性童謡 →
男声童謡 |
非並列 |

女性POP |

女性童謡 |

女性POP →
女性童謡 |
|

女性童謡 |

女性POP |

女性童謡 →
女性POP |
・非並列に比べ並列は高品質で変換可能
・非並列では歌詞が不明瞭になる場合がある
・非並列の「女性POP→女性童謡」では元音声の声質が残り十分に変換できていない