diff --git a/docs/2026-03-26-evening-headline/index.md b/docs/2026-03-26-evening-headline/index.md new file mode 100644 index 0000000..d953ae4 --- /dev/null +++ b/docs/2026-03-26-evening-headline/index.md @@ -0,0 +1,82 @@ +--- +sidebar_position: 100 +title: 03/26 AIヘッドライン(夕刊) +description: 2026年3月26日のAI関連ニュースまとめ +--- + +# 03/26 AIヘッドライン(夕刊) + +2026年3月26日に話題になったAI関連のニュースをまとめました。 + +--- + +## 🔥 LowRankArena(Qwen3-8B派生)公開:低ランク近似評価を狙う実験モデル + +**元ツイート**: [@HuggingModels](https://x.com/HuggingModels/status/2037089182481604695) + +### 概要 +Qwen3-8Bをベースにした特化モデル「LowRankArena」が紹介されました。単発投稿では用途が曖昧でしたが、スレッド追記でMITライセンス・SafeTensors形式・英語特化などの実装情報が補足されています。 + +### 深掘り +リンク先のHugging Faceページでは、LowRank Approximation / SVDをLLMで評価するための実験フレームワーク(SVDBench)として説明されており、現時点ではWIP(開発中)段階。詳細ドキュメントは後日公開予定です。 + +### ポイント +軽量化・低ランク化の評価基盤として面白い一方、まだ“触って使える完成品”ではない点に注意。 + +--- + +## 🔥 EVA:動画エージェント向け“planning-before-perception”で精度改善 + +**元ツイート**: [@HuggingPapers](https://x.com/HuggingPapers/status/2037083148903698933) + +### 概要 +EVA(Efficient Reinforcement Learning for End-to-End Video Agent)は、動画を最初から一様に読むのではなく、「計画→観測→行動→反省」を反復する設計を採用。投稿では既存動画MLLMより6〜12%向上と紹介されました。 + +### 深掘り +arXiv(2603.22918)要旨では、SFT→KTO→GRPOの3段階学習で動画エージェントを訓練し、6つの動画理解ベンチマークで総合性能を改善。さらに既存の適応型エージェント手法比でも1〜3%上積みと報告されています。 + +### ポイント +長尺動画で「どこを・いつ見るか」を学習で最適化する流れが、今後の動画エージェント実装の本流になりそうです。 + +--- + +## 🔥 EVAの論文・モデル・実装リンクが公開、再現手順も明示 + +**元ツイート**: [@HuggingPapers](https://x.com/HuggingPapers/status/2037083158634492039) + +### 概要 +同スレッドの続報で、EVAのPaper / Model / Codeが一式公開されました。 + +### 深掘り +GitHub(wangruohui/EfficientVideoAgent)READMEには、論文リンク、Hugging Faceモデル、主要ベンチの結果、`accuracy.py`による評価、vLLM実行時の設定例まで記載。紹介投稿で終わらず再現導線が整備されています。 + +### ポイント +研究成果が“すぐ試せる状態”で出てくることで、コミュニティ実装の速度が上がる好例です。 + +--- + +## 🔥 OpenResearcherがHF Daily Papers上位に:オフライン深掘りエージェント学習を提示 + +**元ツイート**: [@zhuofengli96475](https://x.com/zhuofengli96475/status/2036908106601656754) + +### 概要 +OpenResearcherがHugging Face Daily Papersで上位入り。引用ポストと関連情報から、長期的な調査タスクを扱う“深掘りエージェント”向けの学習パイプラインとして注目を集めています。 + +### 深掘り +arXiv(2603.20278)では、15M文書コーパス上で search / open / find の3プリミティブを使って完全オフラインで97K軌跡を合成。30B-A3BモデルのSFTでBrowseComp-Plus 54.8%(ベース比 +34.0pt)を達成したと報告。API依存の収集コスト・再現性問題を避ける設計が特徴です。 + +### ポイント +「深掘りエージェントをどう再現可能に訓練するか」という課題に、実用的なオフライン解を示したのが大きい。 + +--- + +## まとめ + +今日の注目ポイント: +- 動画理解では、受動的認識から“計画駆動”エージェント設計へシフト +- 研究公開時にコード・モデル・再現手順まで揃える流れが加速 +- 深掘り系エージェントは、オンラインAPI依存からオフライン再現性重視へ + +--- + +*情報は2026年03月26日時点のものです。* diff --git a/docs/index.md b/docs/index.md index ac173ff..f81814a 100644 --- a/docs/index.md +++ b/docs/index.md @@ -13,6 +13,7 @@ slug: / 毎日のAI関連ニュースをまとめています。 - [03/26 AIヘッドライン(朝刊)](/blog/2026-03-26-morning-headline/) 🆕 +- [03/26 AIヘッドライン(夕刊)](/blog/2026-03-26-evening-headline/) - [03/25 AIヘッドライン(朝刊)](/blog/2026-03-25-morning-headline/) - [03/25 AIヘッドライン(夕刊)](/blog/2026-03-25-evening-headline/) - [03/24 AIヘッドライン(朝刊)](/blog/2026-03-24-morning-headline/)