はてぶ・Qiita・Zennのトレンド記事を紹介
AIエージェントは、AI技術を使って自律的にタスクを実行するプログラムです。チャットボットや自動応答システムなどで活用されています。
AIエージェントの「できる」と「任せられる」の間にある壁 🔖 1
2026年に入り、AIエージェントの性能競争はかつてない熱を帯びています。ベンチマークの数字だけを見れば『万能』に近づいているようですが、いざ業務フローに組み込むと、最後まで仕事をやり遂げてくれないもどかしさに直面するケースが増えています。なぜ、単発のタスクでは優秀なAIが、一
AIエージェント開発のコア概念が掴める100行のコード 🔖 87
AIエージェントって、実質なんなんだろう?ただプロンプトを呼ぶのと何が違うのかな MastraやLangChainっていうフレームワークの存在は知っているけど、何ができるかわからない Claude CodeやCodexは使っているが、中身がどうなっているかまったく想像できない な
AIエージェントの「スキル」の品質低下を防ぐ? テストと検証機能を強化 🔖 39
Anthropicは2026年3月、AI(人工知能)アシスタント「Claude」向けAgent Skillsの作成ツール「skill-creator」の大幅な機能強化を発表した。 Agent Skillsは、ユーザーの指示やメタデータ、スクリプト、テンプレートなどをひとまとめにし
無料で読めるAIエージェントの実践ガイド、Googleが公開 基礎から本番実装まで学べる 🔖 341
Googleは2026年2月26日(米国時間)、AIエージェントの開発と本番運用に関する開発者向けの5つのガイドを無償公開した。これらのガイドは、同社とデータサイエンスコミュニティーのKaggleが2025年11月に共同で実施した、5日間の研修プログラム「5-Day AI Age
MCP vs Skills論争に決着をつける試み。AIエージェントの「拡張手段」を実装・設計・セキュリティで徹底比較する 🔖 1
はじめにこんばんは、mirukyです。「MCPはもう死んだ」「Skillsが新しい標準だ」、、などなど。ニーチェ?ここ数週間、特に英語圏のX(旧Twitter)やHacker Newsでこの手の議論が絶えません。2026年4月2日に投稿された下記の記事は、特に話...
本番環境のAIエージェント開発を「10倍」高速化――「Claude Managed Agents」発表 🔖 50
米Anthropicは4月8日(現地時間)、本番運用可能なAIエージェントを構築、運用するためのAPI群「Claude Managed Agents」のパブリックβ版を公開した。エージェントを制御する「ハーネス」とエージェントの稼働環境の開発を「10倍」高速化し、数日で完了させる
はじめに最近、Claude Codeに関する情報に触れる機会があり、その中で「AIエージェント」という概念について学びました。これまで単なるチャットツールという認識が強かったのですが、より自律的にタスクを実行する仕組みであることを知り、AIエージェントでできることや実...
AIエージェントの成功率をどう引き上げるか。Long-running taskにおけるスケーリング則と検証器の役割 🔖 4
こんにちは!Ai Workforce事業部FDEの恩田(さいぺ)です。 AIエージェントの進化も凄まじく、どんどん長時間のタスクをこなせるようになっています。この分野のベンチマークの第一人者であるMETRでも、最新のClaude Opus 4.6で10時間のタスクが50%の確率で
AIコーディングエディタ「Cursor 3」リリース。AIエージェントを中心に新たに構築 🔖 19
AIコーディングエディタ「Cursor」の開発元であるAnysphereは、Cursorの最新版となる「Cursor 3」リリースを発表しました。 CursorはVisual Studio Code(VS Code)のフォークを基にAIコーディング機能を統合したAIコードエディタ
AIエージェントが機密データを漏洩する5つの実例 — RBACでは防げない構造的欠陥 🔖 25
実例1: EchoLeak — Microsoft 365 Copilot(CVE-2025-32711、CVSS 9.3) 攻撃者が細工したメールを送るだけで、被害者のM365データが外部サーバに流出。ゼロクリック。 Copilotが受信メール(外部データ)を読み込んだ後、その
AIエージェント開発の新標準「ADLC」を読み解く — IBM×Anthropicのガイドへの共感と、本番運用からの実践的フィードバック 🔖 24
AIエージェント開発の新標準「ADLC」を読み解く — IBM×Anthropicのガイドへの共感と、本番運用からの実践的フィードバック はじめに AIエージェントのPoCや検証は多くの現場で行われるようになりましたが、「本番環境で安定して運用する」となると、途端にハードルが上が
Claude Agent SDK でつくる!対話型AIエージェント開発 🔖 7
この本では、Claude Agent SDK (Python) を用いて、Claude Code方式の「ヒアリング → 深掘り → 成果物を出す」対話型ワークフローを持つAIエージェントを開発していきます。つくりながら学ぶことを重視し、最小限のコードでSDKを動かすところから始め
“GPUなし”ノートPCで動くLLMで、ローカルAIエージェントを自作する 🔖 41
はじめに 前回の記事では、業務用ノートPCでローカルLLMを動かし、モデルごとの性能を比較しました。GPU非搭載のマシンでも動かせるモデルがあるとわかったところで、次に気になったのは「じゃあ何に使えるのか」です。 チャットで質問に答えさせるだけなら、クラウドのAPIを使えば済みま
AIエージェントが機密データを漏洩する5つの実例 — RBACでは防げない構造的欠陥 🔖 25
実例1: EchoLeak — Microsoft 365 Copilot(CVE-2025-32711、CVSS 9.3)攻撃者が細工したメールを送るだけで、被害者のM365データが外部サーバに流出。ゼロクリック。Copilotが受信メール(外部データ)を読み込んだ...
ハーネスエンジニアリングを極めたら、IssueからAIエージェントが動き、人間の役割は要件定義だけになった 🔖 335
2ヶ月で21体のAIエージェントによる自律開発パイプラインを構築した。GitHub Issueに要求を書いて寝れば、朝にはマージレディのPRが上がっている。本記事では、2026年2〜3月に何を作り、何が動き、何がまだ動いていないのかを記す。 出発点は、2月時点で既に 57万行 に
AIエージェントのHuman-in-the-Loop評価を深化させる - LayerX エンジニアブログ 🔖 117
宣伝 LayerXでは2026/04/11~26開催の技術書典20でLayerX TeckBook 2を発売します。そちらにも記事を寄稿していますので、もし良ければご一読いただけると幸いです。 techbookfest.org はじめに LayerX Ai Workforce事業
ハーネスエンジニアリングを極めたら、IssueからAIエージェントが動き、人間の役割は要件定義だけになった 🔖 335
2ヶ月で21体のAIエージェントによる自律開発パイプラインを構築した。GitHub Issueに要求を書いて寝れば、朝にはマージレディのPRが上がっている。本記事では、2026年2〜3月に何を作り、何が動き、何がまだ動いていないのかを記す。出発点は、2月時点で既に 57万行 に
AIエージェントのHuman-in-the-Loop評価を深化させる 🔖 117
本記事はAIエージェントのHuman-in-the-Loopを定量評価するための手法やビジネス価値を検討します。AIエージェントによる業務効率化やソフトウェア開発自動化が進むに従って、AIエージェントのアウトプットを人間が確認してアクションすることが増えていると思います。こう
Ubieにおける一年間のセキュリティ分析AIエージェントの運用 🔖 22
Ubie社内でセキュリティ分析に利用できる生成AIエージェントを開発・運用をはじめておよそ1年が経ちました。よい区切りではあるので、セキュリティ分析における生成AI利用について得られた知見などをまとめたいと思います。 前提:「セキュリティ分析」とは? まず、セキュリティアラートと
Ubieにおける一年間のセキュリティ分析AIエージェントの運用 🔖 22
Ubie社内でセキュリティ分析に利用できる生成AIエージェントを開発・運用をはじめておよそ1年が経ちました。よい区切りではあるので、セキュリティ分析における生成AI利用について得られた知見などをまとめたいと思います。 前提:「セキュリティ分析」とは?まず、セキュリティアラー
Ubieにおける一年間のセキュリティ分析AIエージェントの運用 🔖 22
Ubie社内でセキュリティ分析に利用できる生成AIエージェントを開発・運用をはじめておよそ1年が経ちました。よい区切りではあるので、セキュリティ分析における生成AI利用について得られた知見などをまとめたいと思います。 前提:「セキュリティ分析」とは?まず、セキュリティアラー
Ubieにおける一年間のセキュリティ分析AIエージェントの運用 🔖 22
Ubie社内でセキュリティ分析に利用できる生成AIエージェントを開発・運用をはじめておよそ1年が経ちました。よい区切りではあるので、セキュリティ分析における生成AI利用について得られた知見などをまとめたいと思います。 前提:「セキュリティ分析」とは?まず、セキュリティアラー
ハーネスエンジニアリング入門 ── CLAUDE.mdの次に来るAIエージェント制御パラダイム 🔖 142
本稿では、AIエージェントの出力品質は「構造」で大きく変わるという前提のもと、CLAUDE.mdの次のパラダイムとして注目される「ハーネスエンジニアリング」の概念・構成要素・導入方法を、実運用の経験を交えて解説します。 なぜハーネスが必要になったのか 半年ほど前、筆者はCLAUD
AIエージェント導入で「セキュリティどうするの?」と聞かれたときの技術的な答え方 🔖 335
この記事を読んでほしい人 Claude Code / Cursor などのAIエージェントをチームに導入したいエンジニア 情シスから「セキュリティ面の対応は?」と聞かれて技術的に答えたい人 AIツール導入のセキュリティ面の検討材料を探している情シス担当 AIエージェント導入で必ず
Claude Codeのサブスクリプションで動くSlack常駐AIエージェントを作った 🔖 129
Max 20xのAPI換算価値は月$2,000超とする分析もあります(ksred.comの8ヶ月追跡データより)。月$100〜200でこれだけの使用量が得られるなら、サブスクリプションを活用しない手はないですよね。 ちなみに執筆時点(2026年3月27日)では、Claude Ma
エージェントが払う仕組み — AIエージェント決済の6層構造 🔖 7
はじめにこんにちは。Komlock labでブロックチェーンエンジニアをしている小原(@brto_0224)です。2026年3月、AIエージェントが自律的に支払いを行うためのインフラが一気に動き出しました。3月17日〜23日の1週間だけで、MastercardがBVNKの買
社内問い合わせをAIエージェント化して爆速で解決できるようにした 🔖 284
はじめに:社内問い合わせがじわじわ開発を削っていく ダイニーでは、飲食店舗から日々、運用サポートチームに問い合わせが寄せられます。そして、運用サポートチームだけでは解決できない技術的な問い合わせを開発チームへつなぐ"入口"が 社内問い合わせシステム です。 「会計がうまくいかない
ハーネスエンジニアリング ― AIエージェントが自律的に動ける開発環境の設計 🔖 216
ここからは、先進企業がこの考え方をどう実践しているかを掘り下げます。 先進企業の実践 OpenAI、Anthropic、Stripe。 規模もプロダクトも異なる3社ですが、実践には共通パターンがあります。 企業ごとではなく、テーマ別の横串で整理します。 エンジニアの役割の変化 A
AIエージェント導入で「セキュリティどうするの?」と聞かれたときの技術的な答え方 🔖 335
この記事を読んでほしい人Claude Code / Cursor などのAIエージェントをチームに導入したいエンジニア情シスから「セキュリティ面の対応は?」と聞かれて技術的に答えたい人AIツール導入のセキュリティ面の検討材料を探している情シス担当!本記事はAIエージ
Rails: 本質的に非決定論的なAIエージェントを決定論的なガードレールに変える試み(翻訳)|TechRacho by BPS株式会社 🔖 21
概要 元サイトの許諾を得て翻訳・公開いたします。 英語記事: Getting nondeterministic agent into deterministic guardrails | Arkency Blog 原文公開日: 2026年02月20日 原著者: Łukasz Re
Strands Agents + AG-UIで Human-in-the-Loop付きのAIエージェントを実現する - Taste of Tech Topics 🔖 22
こんにちは。データ分析エンジニアの木介です。 AIエージェントを導入し、業務の自動化を進めていくと、「重要な操作には人による承認を挟みたい」というケースが出てきます。 今回は、Strands Agentsのinterrupt機能とAG-UIプロトコルを組み合わせて、Human-i
社内問い合わせをAIエージェント化して爆速で解決できるようにした 🔖 284
はじめに:社内問い合わせがじわじわ開発を削っていくダイニーでは、飲食店舗から日々、運用サポートチームに問い合わせが寄せられます。そして、運用サポートチームだけでは解決できない技術的な問い合わせを開発チームへつなぐ"入口"が 社内問い合わせシステム です。「会計がうまくいかない
Strands Agents + AG-UIで Human-in-the-Loop付きのAIエージェントを実現する 🔖 22
こんにちは。データ分析エンジニアの木介です。 AIエージェントを導入し、業務の自動化を進めていくと、「重要な操作には人による承認を挟みたい」というケースが出てきます。 今回は、Strands Agentsのinterrupt機能とAG-UIプロトコルを組み合わせて、Human-i
【Microsoft Copilot Studio】AIエージェント内製化ロードマップ:出発点から最初の1本まで 🔖 1
最近、Microsoft Copilot Studioに関するご相談をいただく機会が増えています。 「Microsoft環境が前提なので、まずはCopilot Studioでエージェントを構築していきたい」 「エージェント構築〜運用を内製化し、継続的に展開できる体制を整えたい」
1Passwordが人間とAIエージェントのアイデンティティを統一管理する「Unified Access 」発表 🔖 91
パスワードマネージャ「1Password」を提供している1Password社は、IDとパスワードやパスキーを用いた人間のアイデンティティだけでなく、AIエージェントが用いるシークレットなどの管理も1Passwordに統合することで、人間とAIエージェントのアイデンティティ管理を統
AIエージェント自作のための基礎知識 - 誰かの役に立てばいいブログ 🔖 246
世は大 AI 時代ということで、調べ事や開発に様々な AI を利用するようになりました。 AI 失業だの SaaS is dead だのと騒がしいですが、そういうのは今日は置いておきます。 AI を使うのも良いですけど、せっかくソフトウェアエンジニアをやっているのですから、自分で
Claude Code / CursorのHooksで実装した AIエージェントの3層プロンプトインジェクション対策 - 弁護士ドットコム株式会社 Creators’ blog 🔖 109
Claude Code / Cursor の Hooks で実装した AI エージェントの 3 層プロンプトインジェクション対策 こんにちは、クラウドサインで CRE をしている藤谷です。 CRE は「Customer Reliability Engineering」の略で、お客
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第137回)。 今回は研究アイデアを入力するだけで国際会議レベルの学術論文を生成するオープンソースAI「AutoResearchClaw」や、映像の細部まで理解するMeta開発
VS Codeチームは週次リリースをどう実現したのか AIエージェント活用で見えた6つのポイント 🔖 26
VS Codeチームは週次リリースをどう実現したのか AIエージェント活用で見えた6つのポイント:Deep Insider Brief ― 技術の“今”にひと言コメント VS Codeが月次リリースから週次リリースへ移行するためにエージェントをどう活用しているのか。エージェントを
AIエージェントがコマンドラインでブラウザを自動操作できる「Browser Use CLI 2.0」リリース。Chrome DevToolsへの接続などで操作速度が2倍に 🔖 203
AIエージェントがコマンドラインでブラウザを自動操作できる「Browser Use CLI 2.0」リリース。Chrome DevToolsへの接続などで操作速度が2倍に 人間やAIエージェントがコマンドラインから指示することでWebブラウザを操作できるオープンソースのPytho
AIエージェントに「楽をさせる」設計 — 全部AIにやらせる、が最適解とは限らない 🔖 2
最近、AIエージェントのデモや講演を見る機会が増えました。「業務プロセスを全てAIエージェントが自律的に実行します!」「エージェント同士が対話し、複雑なタスクを自動で完了します!」すごい。本当にすごい。ワクワクするし、本当にそういう未来が訪れるのだろうなと感じます。...
コーディングAIエージェントの支援を受けてソフトウェアを開発する手法「エージェントエンジニアリング」とは? 🔖 23
AIにコードを書かせること自体はすでに珍しくありませんが、最近は書いたコードを自分で実行し、その結果を見ながら修正まで進めるAIツールも登場しています。こうしたAIの支援を受けながらソフトウェア開発を進める考え方が「エージェントエンジニアリング」です。ウェブ開発者のサイモン・ウィ
AIエージェントが「最初から戦力になる」リポジトリ設計 — AGENTS.md・ディレクトリ構造・バリデーション戦略の実践ガイド 🔖 200
はじめに — 同じCursorを使っているのに、なぜ10倍の差がつくのかこんな経験、ないでしょうか。チームの隣の席の人が、CursorやCopilotで爆速開発している。同じツールを使っているのに、自分のプロジェクトだと全然うまくいかない。AIが的外れなコードを吐く。...
「AIっぽい」の正体は文体じゃない — 全業務をAIエージェントで回して気づいたこと 🔖 43
どれも、相手の状況を考えて取捨選択するプロセス——つまり先ほど定義した「思考」——が抜けています。全部に共通するのは、誰の思考も通っていない出力だということです。 AIは——少なくともここで定義した意味では——思考しません。咀嚼も判断も責任も、AIのプロセスには含まれていません。
この記事のまとめ: GitHub Copilotのカスタムエージェント機能を使い、5体のAIにスクラムチームを組ませて実際にアプリを開発させた実験の全容と、やってみて感じた可能性・課題をまとめています。 AIの賢さとツールが洗練されてきました Opus4.6やGPT-5.3-Co