はてぶ・Qiita・Zennのトレンド記事を紹介
RAG(Retrieval-Augmented Generation)は、検索と生成AIを組み合わせた技術です。大量の情報から必要なデータを抽出し、AIが自然な文章を生成します。
Embedding modelの「内在的な双曲性」を利用したRAG精度の向上と階層矛盾検知の可能性 - Spicescode Tech Blog 🔖 41
スパイスコード CTO の櫻木です (X: https://x.com/ysrhspyoshi). スパイスコードは,「ロカルメ・オーダー」 order.localmet.com という AI Agent を内包した ERP サービスを開発・提供しているスタートアップです. 前回
RAGとAgentic Searchの戦争を 終わらせに来た!!! 🔖 62
インフルエンサー「RAGは所詮 先の時代の敗北者じゃけェ」 初学者「今までRAGをやってきた僕はまるで…バカじゃないですか!!? 時間がもったいだいっ!!!!」 ってなってると聞いたので、そもそもの誤解と実態について纏めたいと思う。勢いあまってアカウント作ったまま放置してたZen
RAGとAgentic Searchの戦争を 終わらせに来た!!! 🔖 62
インフルエンサー「RAGは所詮 先の時代の敗北者じゃけェ」初学者「今までRAGをやってきた僕はまるで…バカじゃないですか!!? 時間がもったいだいっ!!!!」ってなってると聞いたので、そもそもの誤解と実態について纏めたいと思う。勢いあまってアカウント作ったまま放置してたZen
【海外記事紹介】Karpathy氏「RAGはもう古い」—LLMが自動管理する永続的知識ベースの衝撃 🔖 24
4月4日、元Tesla AI責任者でOpenAI創設メンバーのAndrej Karpathy氏が「LLM Wiki」と題したGistを公開した。 RAGの根本的問題を解決する革新的アプローチ Karpathy氏が提案したのは、従来のRAG(Retrieval-Augmented
異常を説明し行動を導くAI:LLM×RAGによる説明性の付加とアクションレコメンドモデルを解説 🔖 4
Insight Edgeのデータサイエンティストの山科です。 今回は、画像に対する異常検知結果をLLMで解釈させることに加えて、RAGを組み込むことでアクション提案まで行う手法について検証を行いましたので、その結果について記載したいと思います。 なお、本内容は先日開催された言語処
RAGの最適化手法が多すぎて迷子になったので、整理したら全体像が見えた 🔖 5
なぜRAGを学んだかRAGという技術を知り、検索の仕組みにもこうした手法が使われていることに興味を持ったのがきっかけ。自分でもRAGを活用した検索アプリを作ってみたいと思った。とりあえず、基礎から応用まで網羅してるRAGの教材を読み込んだ。ボリュームはかなりあった。読む前の
【AWS】FrontierAgentsで実現するAIOps【FrontierAgent】 🔖 1
はじめに前回の記事ではAWSのSecurityAgentとDevOpsAgentのセットアップについて解説しましたが、この記事ではより実践的な活用方法を解説します。SecurityAgentによるGitHubのプルリクエスト(PR)のセキュリティレビューや、設計書のレ...
【消費トークン1/12】コーディングエージェントにRAGは罠だった。「検索」ではなく「コンパイル」するDAGツールを作った話 🔖 28
はじめに Claude Code や Cursor といった,Coding Agent ツールに思った通りのコードを書かせるために,ドキュメントやルールをせっせと生産する時代になったわけですが,ドキュメントが増えれば増えるほど,AI は正しいドキュメントを探すためにたくさんの T
【消費トークン1/12】コーディングエージェントにRAGは罠だった。「検索」ではなく「コンパイル」するDAGツールを作った話 🔖 28
はじめにClaude Code や Cursor といった,Coding Agent ツールに思った通りのコードを書かせるために,ドキュメントやルールをせっせと生産する時代になったわけですが,ドキュメントが増えれば増えるほど,AI は正しいドキュメントを探すためにたくさんの T
【消費トークン1/12】コーディングエージェントにRAGは罠だった。「検索」ではなく「コンパイル」するDAGツールを作った話 🔖 28
はじめにClaude Code や Cursor といった,Coding Agent ツールに思った通りのコードを書かせるために,ドキュメントやルールをせっせと生産する時代になったわけですが,ドキュメントが増えれば増えるほど,AI は正しいドキュメントを探すためにたくさんの T
【消費トークン1/12】コーディングエージェントにRAGは罠だった。「検索」ではなく「コンパイル」するDAGツールを作った話 🔖 28
はじめにClaude Code や Cursor といった,Coding Agent ツールに思った通りのコードを書かせるために,ドキュメントやルールをせっせと生産する時代になったわけですが,ドキュメントが増えれば増えるほど,AI は正しいドキュメントを探すためにたくさんの T
文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か 🔖 26
Sakana AI(サカナAI)は2026年2月末、LLM(大規模言語モデル)に独自情報を反映させるための新たな手法「Doc-to-LoRA」を発表した。情報を即座にモデルに反映させられるのが特徴だ。Sakana AIのRujikorn Charakorn(ルジコーン・チャラコー
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は超長文をLLMが理解できるようにするための手法、「SRLM」について紹介します。https://arxiv.org/pdf/2603.15653 サマリーLLMの性能は日々向上していますが、超長文に対しては
gemini embedding 2 で "資料単位のナレッジ化" が容易に!?OCRできない見た目の知識をRAG化する 🔖 48
2026年3月、Google から gemini-embedding-2-preview が登場しました。これは テキスト・画像・動画・音声・PDF を単一の埋め込み空間にマッピングできる、マルチモーダル embedding モデルです。 これを見て、個人的にかなり大きいと感じた
RAGの文書検索でも「サブエージェント」を活用する手法 🔖 2
本記事では、RAGの性能を高めるための「SPD-RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ企業向けに開発しているスタートアップです。 この記事は何この記事は、RAGの精度を上げるための手
米国で話題のRAGのセキュリティ脅威についてまとめてみた 🔖 282
はじめに こんばんは、mirukyです。 前回の記事「コーディングが楽になったからこそ気をつけるべきセキュリティ」では、AIコーディング時代のセキュリティリスクについてまとめました。 今回は、あの記事の中では深く触れられなかったRAG(Retrieval-Augmented Ge
米国で話題のRAGのセキュリティ脅威についてまとめてみた 🔖 282
はじめにこんばんは、mirukyです。前回の記事「コーディングが楽になったからこそ気をつけるべきセキュリティ」では、AIコーディング時代のセキュリティリスクについてまとめました。今回は、あの記事の中では深く触れられなかったRAG(Retrieval-Augmente...
【Python+ローカルLLM】AIコーディングエージェントをRAGに組み合わせてみた 🔖 32
はじめに 「社内ドキュメントに自然言語で質問できたら便利じゃないか?」 「しかも、コードの書き方まで聞けたら最高じゃないか?」 そんな欲張りな発想から生まれたのが Django-RAG (Ver.2) です。 以前投稿した Agentic Coder の記事では、ローカルLLMで
BigQuery AI関数だけでRAGを構築する ― Embedding生成から類似検索まで 🔖 32
はじめに BigQuery の AI 関数(AI.EMBED・AI.SIMILARITY・VECTOR_SEARCH)を使えば、外部のベクトルDBや追加インフラなしで RAG(Retrieval-Augmented Generation)を構築できます。 以前は CREATE M
PDFをマルチモーダル画像解析してRAGの精度を検証 🔖 6
PDFのRAG(Retrieval-Augmented Generation:検索拡張生成)精度を上げるため、PDFをマルチモーダル画像解析する方法[1]を検証してみました。 準備RAGフレームワークLlamaIndexのTypeScript版と、OpenAIのgpt-5-
PDFをマルチモーダル画像解析してRAGの精度を検証 🔖 6
PDFのRAG(Retrieval-Augmented Generation:検索拡張生成)精度を上げるため、PDFをマルチモーダル画像解析する方法[1]を検証してみました。 準備RAGフレームワークLlamaIndexのTypeScript版と、OpenAIのgpt-5-
RAGで足りなくなったので Agentic Search を調べてみた 🔖 46
はじめに 「なんでそこにあるデータを見てくれないかなぁ(泣)」…RAGを自作した人なら、一度はこう思ったことがあるのではないでしょうか。 私自身、社内情報検索用のチャットボットをRAGで構築しましたが、回答精度がなかなか上がりませんでした。チャンクサイズを調整し、ハイブリッド検索
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGの検索の結果をメモリに蓄積していき、次以降の検索を高速かつ、高精度に実現するための手法「GAM-RAG」について紹介します。https://arxiv.org/pdf/2603.01783 サマリー
GraphRAGを実際に構築して分かった「使うほど賢くなるAI」の仕組み 🔖 56
はじめに ─ 「AIに文書を読ませる」だけでは足りなかった 最近、「社内の文書をAIに読ませて質問に答えさせる」という仕組みを耳にする機会が増えました。いわゆる RAG(Retrieval Augmented Generation) です。 これ、確かに便利なんです。マニュアルや
Claude Code が RAG を捨てた理由 -「Agentic Search」という選択肢 🔖 94
先日、YouTube で公開された技術チャンネル The Pragmatic Engineer のインタビュー動画(2026年3月公開)を見ていて、興味深い話を耳にしました。ゲストは Claude Code の中心的な開発者である Boris Cherny 氏。動画全体では Cl
【RAG ベストプラクティス探索】Reranker用のモデル比較とコスト削減実験 🔖 2
はじめに: Reranker何使う?問題ELYZAで機械学習エンジニアのインターンをしている見目です。本記事では、RAG システムにおける Reranker のモデル選定の考え方と、LLM を用いた Reranker のコスト削減手法をご紹介します。Rerankerとは、E
社内規程RAGの精度を73.3% → 100%に改善した話 🔖 42
RAGの精度を73%から100%に引き上げた、実録・チャンキング戦略とデータ前処理の工夫
以前、MCPサーバーとしてRAGを構築する記事を書きました。 PostgreSQL + pgvector + multilingual-e5-large という構成で、MCP経由でベクトル検索できるRAGサーバーです。このMCP RAGサーバーは、気に入ってはいたのですが、Pos
CosenseのRAGをCloudflare AI Search (Auto Rag)を使って爆速で作ってみる 🔖 2
経緯自前でRAGを実装するとなると、それなりの工数や実装、環境構築が必要になります。今となっては、一昔前のような単純なキーワード検索は避けたい場面も多く、そうした場合に手っ取り早いのがエージェンティックサーチだと思います。つまり、MCPやツールコールによって外部データを検索し、
以前、MCPサーバーとしてRAGを構築する記事を書きました。https://zenn.dev/mkj/articles/30eeb69bf84b3fPostgreSQL + pgvector + multilingual-e5-large という構成で、MCP経由でベクトル検
政策議事録をLLMで分析する設計:RAG(ベクトル検索)で精度が出なかった理由と多段階圧縮 🔖 41
政策議事録をLLMで分析する設計:RAG(ベクトル検索)で精度が出なかった理由と多段階圧縮 この記事で得られること 政治・政策領域という特殊なドメインで、LLMを使ったテキスト分析をプロダクションに載せるまでの設計判断 「ドメインエキスパートの暗黙知」をシステムに変換するときに直
政策議事録をLLMで分析する設計:RAG(ベクトル検索)で精度が出なかった理由と多段階圧縮 🔖 41
政策議事録をLLMで分析する設計:RAG(ベクトル検索)で精度が出なかった理由と多段階圧縮 この記事で得られること政治・政策領域という特殊なドメインで、LLMを使ったテキスト分析をプロダクションに載せるまでの設計判断「ドメインエキスパートの暗黙知」をシステムに変換すると
階層的 RAG (Hierarchical RAG) の実装 🔖 3
はじめにシンプルなベクトル検索から一歩踏み込んで、 階層的 RAG (Hierarchical RAG) を実装してみました。 ベクトル検索だけでは物足りないと感じる場合、精度向上の一つの選択肢になるはずです。今回 HHKB (Happy Hacking Keyboard)
階層的 RAG (Hierarchical RAG) の実装 🔖 3
はじめにシンプルなベクトル検索から一歩踏み込んで、 階層的 RAG (Hierarchical RAG) を実装してみました。 ベクトル検索だけでは物足りないと感じる場合、精度向上の一つの選択肢になるはずです。今回 HHKB (Happy Hacking Keyboard)
The Pragmatic Summit 2026 🔖 39
San Franciscoで開催されたThe Pragmatic Summit に参加してきた. Pragmatic Engineeringは元UberのEMのGergely Oroszによるエンジニアでは最も有名なニュースレターの一つ.毎週業界の流れやテクノロジー関連のニュース
最近盛り上がっている「RAG不要論」をご存知でしょうか。本記事では、RAG不要論を検証した論文について、ざっくり解説します。株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は
ABEMAのリアルタイム基盤紹介 | CyberAgent Developers Blog 🔖 64
システムアーキテクチャ ABEMAでは、リアルタイムプロトコルを各マイクロサービスで個別に実装するのではなく、WebSocket、SSE、Polling をサポートするリアルタイムゲートウェイを別途配置する方式を採用しています。これにより、各マイクロサービスはリアルタイム通信方式
【2026年版】日本語RAGのEmbeddingモデル、結局どれが最強なのか?6構成で2000問ベンチマークした 🔖 22
こんにちは、株式会社FP16の二宮です。最近 RAG(Retrieval-Augmented Generation)のEmbeddingモデル選びで悩んでいたので、6つの構成を2000問で比較ベンチマークしてみました。「ruri-v3って本当に最強?」「ハイブリッド検索って意
【2026年版】日本語RAGのEmbeddingモデル、結局どれが最強なのか?6構成で2000問ベンチマークした 🔖 22
こんにちは、株式会社FP16の二宮です。最近 RAG(Retrieval-Augmented Generation)のEmbeddingモデル選びで悩んでいたので、6つの構成を2000問で比較ベンチマークしてみました。「ruri-v3って本当に最強?」「ハイブリッド検索って意
生成 AI による仕様書作成とレビューの考え方 | CyberAgent Developers Blog 🔖 435
ジャンプTOON ソフトウェアエンジニアの國師 (@ronnnnn_jp) です。 この記事では、仕様書の作成・レビューに生成 AI を活用するための実践的なアプローチを紹介します。 目次 生成 AI による開発効率の変化 LLM の特徴と制約 コンテキスト情報の整備 手順や制約
なぜ、Claude Codeは、RAGを捨ててAgentic Searchを選んだのか? 🔖 359
ちょっと前のことですが、Claude Codeの開発者でありAnthropicのエンジニアでもあるBoris Cherny氏が、「初期のClaude CodeではRAG+ローカルベクターDBを使っていたが、最終的にAgentic Searchの方が圧倒的に良いと分かった」 という
人間は意図、AIは実装:Codexが導く「要件を伝えるだけ」のAI駆動開発ワークフロー | CyberAgent Developers Blog 🔖 219
はじめに 特に、OpenAIのCodexに代表される「大規模なコードコンテキストを理解するAIモデル」のポテンシャルを最大限に引き出すため、各フェーズで使用するプロンプト、AIの予想出力、そしてコンテキスト管理の方法を具体的に紹介します。 この記事で学べること Codex等のコー
もうレビューは読まなくていい ― Bright Data × RAGで"全レビュー読破AI"を作った話 🔖 2
はじめにAmazonで少し高めの買い物をするとき、多くの人がレビューを参考にすると思います。でも、人気商品だとレビューが 数百件〜数千件 あるのは当たり前。全部読むのは現実的に不可能です。結果として、こんな経験をしたことはないでしょうか。星の平均だけ見て買った...
【LLM】社内文書をセキュアに検索!OllamaとOpen WebUIで構築する完全無料・RAG環境 🔖 159
今回は、これらをDocker Composeひとつで一撃で立ち上げるハンズオン形式で紹介します。 アーキテクチャ概要 今回構築するスタックは以下の通りです。すべてDockerコンテナとして稼働します。 Ollama: Llama 3やPhi-3などの高性能LLMをローカルで動かす
RAGを丁寧に解説(無料で使えるGemini,Obsidianを活用して自分の秘書を作る)|takeshy 🔖 235
はじめに生成AI(ChatGPTやGeminiやClaude)の中でよく話題にされる技術はMCPとRAGです。MCPは前回記事に書いたのでそちらを参照してください。 「RAG」という言葉を聞いたことはありますか?単語自体ではなく意味で検索する仕組みのことです。 難しそうに聞こえる
RAGの精度は入力構造で決まる|なぜテキストChunkingでは限界に到達するのか 🔖 28
はじめに|RAGは検索以前に、もう壊れている 多くのRAGは、検索やEmbeddingの改善以前に、「入力データの時点で精度の上限が決まっている」。 にもかかわらず私たちは、検索精度・Rerank・評価指標ばかりに目を向けてきた。 だが実際には、RAGに渡されるドキュメントはすで
コンテキストエンジニアリングの歴史:RAGの過去から現在をたどる 🔖 27
こんにちは、Algomatic AXカンパニー所属の大塚です。 本日は、LLMアプリケーション開発に欠かせない技術となったRAG(Retrieval-Augmented Generation:検索拡張生成) について、その誕生から最新動向までを論文とともに振り返っていきたいと思い
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、多段階のRAGで最初に入力した質問の大事なキーワードを、忘れないようにする手法「ActiShade」について紹介します。https://arxiv.org/pdf/2601.07260複雑な質問に回答する際に
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、多段階のRAGで最初に入力した質問の大事なキーワードを、忘れないようにする手法「ActiShade」について紹介します。https://arxiv.org/pdf/2601.07260複雑な質問に回答する際に