友田 陽大
← 実績一覧に戻る

生成AI音声チャットボット

RAG活用 | toC向けAI音声チャットボット

🏢

クライアント

店舗接客業界(toC向け商品説明・提案システム)

👤

私の役割

AIシステムアーキテクト・フルスタック開発者(RAGシステム設計からフロント実装まで一人で担当)

💭課題(Situation & Task)

店舗での営業マンリソース不足。大量のドキュメント(PDF、Excel)を活用した自動応答システムが必要でしたが、既存のチャットボットでは精度が低く、音声対応も不十分でした。

詳細:

店舗でのtoC接客において、営業マンが全ての顧客対応をするには限界がありました。膨大な商品カタログ(PDF)、仕様書(Excel)から正確な情報を即座に回答する必要がありましたが、既存のチャットボットでは「PoCレベル」で終わり、実用に耐える精度とレスポンス速度が実現できませんでした。また、音声対応が必須でしたが、文字起こし→AI応答→音声合成の一連の処理が遅く(5秒以上)、ユーザー体験が悪化していました。さらに、顧客の個人情報を扱うため、セキュアなセッション管理が必須でした。

🔧技術選定の理由(Rationale)

  • RAG + pgvector:従来のキーワード検索では不可能だった「意味的に類似した情報」の高精度抽出を実現

  • AWS Bedrock(Claude/Titan):高品質な自然言語生成。商品説明の「自然さ」と「正確さ」を両立

  • 並列処理(asyncio):音声処理(文字起こし・音声合成)のI/Oバウンド処理を並列化し、体感速度を70%改善

  • JWT認証:ステートレスなセッション管理で、個人情報保護とスケーラビリティを両立

  • PostgreSQL + pgvector:RDBの信頼性とベクトル検索の高速性を兼ね備えたアーキテクチャ

実施したこと(Action)

  • RAGシステムの精度向上:チャンク分割戦略の最適化、埋め込みモデルの選定、検索クエリの調整を繰り返し、回答精度を90%以上に到達

  • 音声処理の並列化:文字起こしと音声合成を並列実行し、体感レスポンス時間を5秒→1.5秒に短縮

  • 「実用レベル」の追求:PoCで終わらせず、エラーハンドリング、フォールバック処理、ユーザーフィードバック機能を実装

  • 動画ストリーミング機能:音声だけでは伝わりにくい商品説明を、動画で視覚的に補完

  • セキュリティ対策:JWT認証、HTTPSによる通信暗号化、個人情報のマスキング処理を実装

  • CI/CD パイプラインの構築:GitHub Actions で自動テスト・リンター(ESLint/Prettier/Flake8)・脆弱性診断(npm audit/pip-audit)を実行。AIモデルの精度検証も自動化し、デグレードを防止

詳細:

RAGシステムの精度向上では、チャンク分割戦略(セマンティックチャンキング vs 固定長チャンキング)、埋め込みモデル(OpenAI vs AWS Titan Embeddings)、検索クエリの調整(Top-K、類似度閾値)を徹底的に実験。最終的にAWS Titan Embeddingsとセマンティックチャンキングの組み合わせで回答精度90%以上を達成しました。音声処理の並列化では、Pythonのasyncioを活用し、文字起こし(Whisper API)と音声合成(Polly)を並列実行。体感レスポンス時間を5秒→1.5秒に短縮し、実用レベルのユーザー体験を実現しました。

🔧技術選定の理由

  • pgvector + RAG:大量ドキュメントからの高精度な情報抽出

  • AWS Bedrock:Claude/Titanモデルによる高品質な応答生成

  • 並列処理:音声処理(文字起こし・音声合成)の高速化

  • JWT認証:セキュアなセッション管理とプライバシー保護

担当領域

  • 要件定義・基本設計
  • フロントエンド開発(React)
  • バックエンド開発(Python/Flask)
  • AI/RAGシステム設計・実装
  • インフラ構築(AWS/Terraform)
  • セキュリティ設計(JWT認証)

使用技術

Python
Flask
React
TypeScript
Tanstack Query
zod
AWS Bedrock
AWS ECS
Terraform
PostgreSQL
pgvector
Docker
JWT
RAG
GitHub Actions
ESLint
Prettier
Flake8
npm audit
pip-audit

🎯成果

  • 🎯営業マンのリソース不足を解消
  • 🎯高精度なドキュメント検索・応答を実現(回答精度90%以上)
  • 🎯音声処理の並列化により、レスポンス速度を70%改善(5秒→1.5秒)
  • 🎯実用レベルのAI接客システムを構築(PoCで終わらせない)
  • 🎯セキュアなセッション管理により、安全なユーザー体験を提供
  • 🎯店舗スタッフの業務負荷を50%削減
  • 🎯CI/CD による品質保証とAI精度検証の自動化:GitHub Actions でコード品質・脆弱性診断・AIモデル精度検証を実行し、デグレードを防止

同様の課題はありませんか?

あなたのビジネス課題も、最新の技術で解決できるかもしれません。
まずは30分、無料技術相談で状況をお聞かせください。

無料技術相談を予約する

※ プロジェクト単位(請負)・技術顧問、どちらも対応可能です