下記の事項に注意することで、話者分離の精度向上につながる可能性があります。
■注意事項
話者分離の精度が悪い/話者が認識されないケース
- 発話が明瞭でない
- 声量が小さい話者
- 途切れかかったような喋り方(1秒ほど無音でぽつぽつ発声するような)
- 空調等のノイジーな録音環境
また、以下のようなケースで、話者の特徴を十分に捉えることが難しいため、話者人数予測や分離精度が悪化してしまう場合があります。
- 録音時間が短い
- 音声に残響(雑音)が含まれる
- ネットワーク帯域等の問題で、録音品質が悪い
- 同じ集音環境で、話者の識別が難しい声音
- 同じ集音環境で、発話量が少ない
- 音声をキャッチするマイクが遠い
- 複数人が同時に発話する(声音が重なる)
上記以外にも、収音される音声デバイスによって精度が変わる可能性があります。
そのため、音声デバイスやご利用されている端末(スマホからPCなど)を変更し、分離精度が向上しないかお試しください。
また、話者分離の精度をより高めるため、複数の発話者がいる場合は、お互いの声音が重ならないよう間隔をあけて発話してください。