top of page

将来に向けた効率的なAIモデルの運用・学習のための研究開発

信頼性の高いAIモデルを支える安全な学習技術の研究

AIの性能を左右する要因として、データ量やデータ品質が挙げられます。高品質のデータを多く集めることで性能の良いAIを開発することができます。

ビジネスとしてAIを利活用することを考えた場合、集めるデータの中には機密情報が含まれることが多くなります。私たちは、AIの開発や運用の際に、この機密情報が漏洩しないための施策について研究を進めています。

1つ目の研究課題としては、連合学習におけるMLOpsの検討を行っています。

一般的な機械学習では、データを1か所にまとめて学習を行う必要があり、データを収集する際に情報漏洩の可能性が高まります。

連合学習は、AIモデルの学習の際に必要となるデータがセキュリティゾーンを超えることなく、複数のセキュリティゾーンにある多くのデータを使用した学習を可能とする仕組みです。この仕組みでシステムを構築することで、情報漏洩の可能性は低くなります。一方で、一般的な機械学習システムの構築と比較して、連合学習システムは、システム構成が煩雑となり、開発や運用・保守に費やす工数が大きくなる傾向にあります。このような連合学習の欠点を、MLOpsと組み合わせることにより解消することで、セキュアかつメンテナンス性の高いシステム開発基盤の構築を目指しています。

2つ目は、ローカルRAGの評価と精度向上の研究です。

RAG(Retrieval Augmented Generation)とは、データベースから関連情報を検索し、その情報を基に生成AIが回答を生成する技術です。

OpenAI社のChatGPTやGoogle社のGeminiなどLLM(Large language Models)を用いたクラウドサービスが一般的となり、ビジネスシーンでもこれらのAIサービスを利用することで業務を効率化することが増えてきましたが、RAGの回答生成AIとして外部サービスのLLMを使用することには情報漏洩のリスクが生じます。本研究では、外部サービスの生成AIの代わりにローカルな環境でオープンソースの商用利用可能なLLMモデルを使用することで、外部サービス使用による情報漏洩リスクの無い環境でLLMを利用することを目指します。

また、特に日本語を取り扱う場合に、RAGシステムの精度を評価するための研究に取り組み、精度の高いRAGシステムの開発手法を模索しています。

昨今ビジネスを進めるにあたり、情報漏洩のリスクに配慮しつつAIを利活用することは、あらゆる業界・分野で必要となっています。

連合学習とMLOpsの活用例としては、医療業界における様々な疾病や患者の症状のデータを使って医療診断を行うAIモデルの開発などが挙げられます。連合学習を使ったシステムでは、患者のデータ(機密情報)を病院・診療所などの医療機関の外に出さずに、複数の医療機関を通して連合学習されたAIモデルを各医療機関が使用することができます。また、そのAIモデルはMLOpsで統括されているため、効率的な開発・運用・保守を実現することができます。

ローカルRAGの例としては、社内文書を検索するチャットボットシステムなどが考えられます。ローカルRAGを活用したチャットボットシステムでは、一般的な企業で整備された社内文書に対する問い合わせをチャットボットが回答することにより業務効率化および省人化が見込めます。また、システムのユーザが問合せ時に誤って機密情報を入力したとしても、外部サービスを利用しないため情報漏洩の可能性はなく、ユーザが安心して、安全にシステムを利用することができます。

私たちは、AIモデルの開発やAIを利活用したシステム・サービスの利用の需要が今後も増え続けることを見据え、効率的かつセキュアにAIの開発や運用・保守を持続して行える未来(AIと共存・協力する未来)を目指して研究開発を行っています。

bottom of page