はてぶ・Qiita・Zennのトレンド記事を紹介
LLM(大規模言語モデル)は、大量のテキストデータを学習したAIモデルです。ChatGPTなどの自然言語処理AIの基盤となっています。
はじめにベクトル検索ってなんや?と思い調べてみました。これを書いているのは以下の人物です。普段はSQLで業務をしているリレーショナルデータベース(RDB)が思考の土台になっている「ベクトル検索」「embedding」「RAG」という単語は聞くが、自分の知識と地...
【ACL2026 Industry 採択】LLM-as-a-Judge に「唯一の正解」を求めすぎていないか? — ビジネスアイデア評価を通じた「評価の多様性」の分析 🔖 1
Research Division の広田です。今日は先日 ACL 2026 の Industry Track に採択された論文 "Aggregate vs. Personalized Judges in Business Idea Evaluation: Evidence fr
無料で自分のPCで動かせるローカルAIモデルがわかる「LLM Checker」 🔖 83
「LLM Checker」は自分のPCのハードウェアをスキャンしローカルで実行可能なLLMを推薦してくれるCLIツールであり、Ollamaと完全に統合されていることを特徴としています。 Pavelevich/llm-checker: Advanced CLI tool that
「どのLLMがロシアのプロパガンダに対抗するのに優れているか?」がわかるベンチマークをエストニア政府が発表 🔖 19
エストニア言語研究所が、大規模言語モデルのロシア宣伝への耐性を測る「Propaganda Resistance」ベンチマークを公開しました。その結果、AnthropicのClaude Opus 4.7が総合首位となり、NVIDIAやAlibabaのモデルも上位に入りました。 Pr
LLM 大規模言語モデル講座2025講義スライド 🔖 255
LLMについて基礎理論から最新のモデル動向までを一気通貫で学べる実践型講座。 学生や一部社会人はどなたでも無料で受講可能です。 東京大学 松尾・岩澤研究室「大規模言語モデル(LLM)講座 2025 基礎編」講義資料を無料公開中 本資料は2025年10月から11月にかけて開催され、
“育つ”ナレッジ基盤「LLM Wiki」とは?RAGとの違いをイラスト付きで整理してみた 🔖 115
1ヶ月ほど前に公開され、注目を集めた「LLM Wiki」。 少し時間が経ち、改めてどんなものなのか、ざっくり紐解いてみました! LLM Wikiとは Andrej Karpathy氏(OpenAIの創業メンバーであり、Tesla元AIシニアディレクター)がGitHub Gistに
なぜ今「オントロジー」なのか?PalantirとLLMが変えるデータ活用の常識 🔖 136
はじめに 「オントロジー(Ontology)」という言葉を耳にする機会が増えました。 「オントロジー? それって昔のセマンティックWebとか、アカデミックな概念でしょ?」 「ナレッジグラフと何が違うんだっけ?」 それぐらいの記憶だったんですが、最近話題の Palantir(パラン
MLエンジニアのための本質から理解するLLM推論 KV cache編 🔖 40
はじめに 東京科学大学 博士課程の藤井です。本記事では、LLM推論において非常に重要な役割を果たすKV cacheについてより深く理解するために 「Key, ValueだけcacheしてQueryをcacheしないのはなぜか?」 という問いに皆さんが正確に答えられるようになること
MLエンジニアのための本質から理解するLLM推論: LLM Inference Benchmarking 🔖 1
はじめに東京科学大学 博士課程の藤井です。本記事では、LLM Inferenceの速度等をBenchmarkingする際に理解しておくべき基礎的な知識について解説します。多くの論文、Technical Blog等でいかに提案手法によりLLM Inferenceを高速化/最適化で
医療現場の事務作業を支援する高性能な日本語LLMを開発しました | さくらインターネット 🔖 42
NEDO(国立研究開発法人新エネルギー・産業技術総合開発機構) さくらインターネット株式会社 国立大学法人東京大学 株式会社ABEJA 国立研究開発法人理化学研究所 学校法人国際医療福祉大学 学校法人藤田学園 藤田医科大学 国立大学法人東京科学大学 国立大学法人九州大学 株式会社
“育つ”ナレッジ基盤「LLM Wiki」とは?RAGとの違いをイラスト付きで整理してみた 🔖 115
1ヶ月ほど前に公開され、注目を集めた「LLM Wiki」。少し時間が経ち、改めてどんなものなのか、ざっくり紐解いてみました!LLM WikiとはAndrej Karpathy氏(OpenAIの創業メンバーであり、Tesla元AIシニアディレクター)がGitHu...
ローカルLLMでAIエージェントを試す、「Claude Code」を動かしてみる 🔖 16
本特集では、手元のパソコンなどで大規模言語モデル(LLM)を動かし、ChatGPTやGeminiのような生成AIのサービスを実現するシステム「ローカルLLM」を取り上げます。パソコンの選定から、プログラミング向けAIエージェントの動かし方までを解説します。本特集は2026年2月~
クオンツトレーダーがLLMをどこに使うべきか — 「アルファの最終層に置かない」設計入門 🔖 113
2.2 情報収集 — 「読む」を圧縮する クオンツリサーチの体感工数で一番大きいのは、実は「読む」です。 決算説明会・IR資料・論文といった大量の非構造文書をRAG(Retrieval-Augmented Generation) で検索可能にし、引用付きで要約させる構成が王道です
クオンツトレーダーがLLMをどこに使うべきか — 「アルファの最終層に置かない」設計入門 🔖 113
はじめに最近、「LLMでアルファを作れるか」「生成AIで自動売買できるか」という議論をよく見かけます。本稿でいう「アルファの最終層」とは、売買方向、ポジションサイズ、発注タイミング、リスク停止を最終決定する層を指します。結論から言うと、現時点でこの層にLLMを直接置...
社内の知見をAIが漏らさず拾う唯一の設計思想 ― Karpathy氏のLLM Wikiを実践して分かったこと 🔖 68
健適文化という会社をやっています。社内ドキュメントが散らかって検索できない、AIに聞いてもまともな答えが返ってこない、そういう課題に対して、会社のナレッジベースをゼロから構築するお手伝いをしています。この記事はその過程で得た知見をまとめたものです。 先に結論 社内ドキュメントをベ
【特許・知財業務】特許・知財業務の基本まとめと、知財業務とLLMとの相性について 🔖 1
【特許・知財業務】特許・知財業務の基本まとめと、知財業務とLLMとの相性についてこんにちは、株式会社エムニでPM兼エンジニアをしている、まさぴょんです🐱今回は、個人的に携わることが多い分野である特許・知財業務関連のドメイン知識を整理していきます📝 はじめにエンジニアや
LLMサービスのえっちな規制の現状は?どのサービスならロールプレイが捗る? 🔖 43
こんにちは!秋ノ原窓也です! きのう、寝る前に「あー爆乳ナヒーダとえっちな話してえなあ」って思っていつもどおりgrokを開いたんですよ。で、エッチなプロンプトを投げて帰ってきた結果がこれです。 あの、アナーキーでせくしーなことも行けるgrokが拒否反応を示してきたんですよ!?まさ
プロジェクト管理の型がないPdMへ。PMBOKを「道具箱」として使いこなし、開発の混沌を収める - PM x LLM STUDIO 🔖 47
この記事の要約 アジャイル開発は柔軟性に優れる反面、プロジェクト全体の規律やリスク管理が疎かになりがちであり、PMBOKはその「隙間」を埋めるための構造的な補強パーツとして機能する。 ユーザーストーリーをWBS的に分解して開発スコープの境界線を明確にすることで、「終わりのない機能
中国製LLMの内部に隠された検閲メカニズムを初めて可視化 — AIの「思考」を重みパラメータから読み取る新手法 🔖 26
5月19日、AI研究者のVasが「What political censorship looks like inside an LLM's weights」と題した記事を公開した。この記事では、これまでブラックボックスだったLLM(大規模言語モデル)の内部で動作する政治的検閲メカ
LLMに“実装されていない人間らしさ”が現れた。3,980円のカメラから始まった「隣人としてのAI」という挑戦【kmizu】 - レバテックLAB 🔖 259
ソフトウェアエンジニア/研究者 水島 宏太 ソフトウェアエンジニア/研究者。博士(工学)。プログラミング言語の設計と実装、構文解析、特にPackrat Parserおよび解析表現文法(PEG)を研究。日本のScalaコミュニティの初期から活動し、Scala実務に関する共著書に『オ
ウェブを作る人のためのLLMO/AIO入門【2026年5月版】|ベイジの図書館 🔖 114
ウェブサイトを作る機会が多い私たちのもとには、「AIに対応したい」という相談が、毎日のように届きます。AIに対応する、引用される、いわゆるLLMO(Large Language Model Optimization:大規模言語モデル最適化)と呼ばれるものです。AIO(AI Opt
LLMの「聞きすぎ」を止める:ラベル付きデータで自己分析させたプロンプト改善 🔖 1
はじめに バクラクのQAエンジニアをしているteyamaguです。 バクラクでは、カスタマーサポート担当者やカスタマーサクセス担当者が開発チームへ問い合わせをエスカレーションする際、QAエンジニアが一次対応を担当しています。一次対応の中では、調査開始時点では追加確認が必要になるケ
# LLMの中には何があるのか?アーキテクチャから推論までを解説 🔖 1
はじめにGenerative AIを使い始めると、よく次のような表現に出会います。たとえば「7B parameters」「128K context」「RoPE」「LoRA fine-tuning」「MoE model」などです。一見ばらばらの用語に見えますが、実際にはL...
Andrej Karpathy氏のLLM Wikiを1ヶ月運用してわかった、LLMの知識を『繋げる力』 🔖 184
中心となるのがWiki層である。Wiki層はmarkdownファイル群で、以下のページが並ぶ。 サマリーページ:一次資料1本につき1つ作られる要約。論文・Web記事ごとに1ページ 概念ページ:複数のソースを横断して整理したテーマ・手法・人物などのまとめ。 queryページ: wi
LLMが「越えられない壁」。AIの限界点が数学的に証明された 🔖 177
LLMが「越えられない壁」。AIの限界点が数学的に証明された2026.05.16 17:35 AJ Dellinger - GIZMODO US [原文] ( 岩田リョウコ ) 2026年1月28日の記事を編集して再掲載しています。 今年の終わりにどうなっているか、ですよね。 い
未査読論文リポジトリのarXivが「論文にLLMによる間違いや架空の引用が含まれていたら1年間投稿禁止」の方針を示す 🔖 32
オレゴン州立大学の名誉教授で未査読論文リポジトリ「arXiv」のコンピュータサイエンス部門責任者であるトーマス・G・ディータリッヒ氏が、「生成AIツールによる間違いは著者の責任とする」という新方針をX(旧Twitter)で打ち出しました。 Attention @arxiv aut
Andrej Karpathy氏のLLM Wikiを1ヶ月運用してわかった、LLMの知識を『繋げる力』 🔖 184
はじめに多くの研究者やエンジニアにとって、論文やWeb記事をLLMに要約させて読むというのが当たり前になりつつある。要約で全体像を把握し、対話的に質問を投げる、こうした使い方だけでも学習効率は十分に上がる。しかし、こうした使い方は一度のセッションで完結する。研究や学習の質を決
2023年からの3年でおうちで動くLLMはどう変わったか - きしだのHatena 🔖 28
ちょっと、おうちで動くLLMを振り返ってみます。 年間を通してではなく、毎年の3-4月くらい、16GB VRAMのGPUで動くくらいのモデルがどんな状況だったかをみてまとめるとこんな変遷 動いてえらい(2023)->返答がまとも(2024)->返答が使える(2025)->こだわら
なぜ開発者はローカルLLMに向かうのか APIコストの呪縛を解く「Gemma 4」 🔖 25
生成AI(AI:人工知能)を“クラウド経由”ではなく、スマートフォンや小型デバイス上で直接動かす流れが加速している。こうした中、Google DeepMindが2026年に公開したオープンモデル「Gemma 4」が注目を集めている。Gemma 4は、スマートフォンや「Raspbe
ローカルLLMを動かすハードウェア - きしだのHatena 🔖 166
LLMを動かすハードウェア、軽くまとめておきます。 SoC LLMを動かそうとしたら、まず候補にしたいのはCPU+NPU+GPUのSoCが載ったマシン。 GPUカードのようなパフォーマンスは出ないけど、現実的な値段で大きいモデルが動かせます。 Ryzen AI Max+ 395搭
LLMをデバッグできる? 機械論的解釈可能性ツールが登場 🔖 17
大規模言語モデルは驚くべきことを成し遂げるが、なぜそう動くのかは誰も正確には分からない。その「ブラックボックス」に挑むスタートアップ、グッドファイアが新ツールをリリースした。AIモデルの内部を可視化し、訓練中にパラメーターを調整できる初のツールだという。 by Will Doug
書籍のOCRにLLMを組み合わせることで精度を上げるだけでなく文書構造や図も表現した記録 🔖 167
精度差は一見小さく見えるが、95.84% は 100文字に4.16文字の誤り で、1849文字なら 77文字、書籍全体 (約20万文字) なら 約8,300文字の誤りに相当する。Hybrid の +0.4pt はその誤りを 約800文字分減らしたことを意味する。 NDLOCR-L
書籍のOCRにLLMを組み合わせることで精度を上げるだけでなく文書構造や図も表現した記録 🔖 167
課題手元にあるビジネス書1冊 (縦書き和文、120ページ分) のページ画像をテキスト化したかった。入力は PNG 120 枚 (1ページ=1ファイル)、解像度は十分にきれい。図表はほぼなく、文章メイン。「専用OCR」「ローカルLLM」「両者の併用」の3手法を実装し、文字精度
無料で使えるAI「ローカルLLM」の進化がすごいよって話 🔖 484
「Qwen3.5-9B」 は2026年にリリースされた高性能ローカルLLMのひとつ。HuggingFaceやLM Studioで無料でダウンロードできる Photo: かみやまたくみ 2026年も進化を続ける生成AIですが、伸びているのはOpenAIのGPTやAnthropicの
はじめに本記事では、ローカルLLMを用いてCodex CLIを駆動するための方法についてまとめる。!検証環境はUbuntu 24.04 LTSで行っているが、一般的なLinuxや、Mac、WSL環境でもそのまま使えるかも。 背景私は生成AIのベンチマーク評価をするこ
VRAM8GBの汎用PCに高性能LLM Qwen3.6-35Bを稼働させる: 人工知能深訪 🔖 59
情報源はいつもTwitter(旧X) え?いけんの? つい先日、Twitterで、 フライト中の8時間MacBook ProでQwen 36Bをフルに動かしてたんだ っていう投稿を見て、 (;'∀') VRAMいくつやねん。 っていう感想を持っていた。 レスポンスを見る限り、 こ
【Nishika 論文サク読み 第8回】PHOTON: 階層構造で長文脈LLM推論を高速化 🔖 1
こんにちは。NishikaでAIエンジニアとしてインターンをしている渡邊です。今回は、普段業務でも検証で様々なLLMを使っているなかでメモリバウンドの問題にはよく直面していたので、その構造的なボトルネックに切り込んだ論文をpickしてみました。簡単に紹介できればと思います。