2024年9月30日に開催された、日本IBM主催『IBM TechXchange: Watson事例共有会』にて、弊社・西原が「IBM Champion 2024 for Data & AI」として、生成AI・ChatGPTの企業や自治体での活用における最重要ポイントであるRAGについて、ベクトル型検索ではなく、Watson Discoveryを使う優位点や導入事例、システムのポイントを発表いたしました。
|
講演の様子 |
ChatGPTなどの言語系の生成AIを用いて、企業や自治体の業務の個別回答を得るためには、RAG(Retrieval-Augmented Generation:検索拡張生成)が重要であることは、業界では一般的なことになっています。生成AIにすべてのドキュメントを予め渡して生成AIそのものを個別に学習するのではなく、質問の答えが書いてある文書を「検索で抽出」し、抽出した文書のみを渡して回答生成させることで、学習のコストを下げ、実運用に耐えるシステムを構築することができます。
しかしながら、あまたある文書ファイルの中から質問にあった文書を検索し抽出するのは容易なことではなく、RAGの概念止まりで終わるPoCも多いのが実情です。西原は、RAGという言葉が一般的になる以前の2023年2月より、生成AIの活用の仕方として、検索が重要であることを認識し、その検索にAI検索機能「Watson Discovery」を利用することを進め、サイト内検索・社内ドキュメント検索「Cogmo Search」を進化させ「Cogmo Enterprise 生成AI」として製品化を行いました。
|
Cogmo SearchとCogmo Enterprise 生成AIを説明する西原 |
一般的にRAGが技術的に語られる際には、ベクトル検索が登場します。これは、旧来の単語マッチ検索ではなく、ChatGPTに質問するような自然言語でも検索できる必要があり、その代表的な方法がベクトル検索であるためです。また、OpenAIを企業向けに展開するAzureにベクトル検索機能があるため、インターネット上の技術情報ではRAGはベクトル検索で実現するものという情報が多く見受けられます。
しかし、弊社・西原は、ベクトル検索が優位に働く場面があることは理解しつつ、文書更新の頻度、RAG精度を企業担当者が運用できるかどうかなどからWatson Discoveryなどのランカー型AI検索が実際の利用ケースにおいては評価されやすい、使いやすい現実的なテクノロジー選択であることを本セッションで発表しました。
参加者アンケートでは、96%の方より参考になった・部分的に参考になったと評価をいただき、「まさにこれから作成する提案に非常に参考になる」などのお声もいただきました。
本セッションの内容は、日本IBM社からの推薦もあり、Watson関連の技術Blogとして2024年内に公開する予定でもあります。