はてぶ・Qiita・Zennのトレンド記事を紹介
こんにちは、最近、3D, 音声関連の機械学習にはまっている、わっしーです。音声合成の中でもVITSは、よく使用されるモデルの一つです。最近だと、BERT-VITS2が有名かもしれません。そのVITSモデルの性能と速度改善を行いました!最終的に、性能をキープした状態で、GPU上
はじめにFusicのレオナです。今回は、UpstageのDocumentAIモデルが提供するDocumentParse APIを使い、ドキュメントの前処理の新たな可能性について検証します。特に、RAG(Retrieval-Augmented Generation:検索と生成を組