2026年4月22日水曜日

16 件 — 🔴 3 重大 , 🟡 7 重要 , 🟢 6 注目

🤖 モデル (2)

🟢 🤖 モデル 2026年4月22日 · 2 分で読めます

MathNet：47カ国から30,676問のオリンピック問題、最新モデルもまだ追いつかず

MITチームがMathNetを発表しました。47カ国17言語から集めた30,676問のオリンピック数学問題のマルチモーダルベンチマークです。Gemini-3.1-Proは78.4%、GPT-5は69.3%を達成し、埋め込みモデルは数学的に同等の問題を見つける際に大きな困難を示します。

🟢 🤖 モデル 2026年4月22日 · 3 分で読めます

xAI音声テキスト変換APIが一般提供開始：25言語に対応しベータを卒業

エディトリアルイラスト：マイクと音波のストリームがGrok APIを通じて25言語の文字起こしに変換される

xAIは音声テキスト変換（STT）APIがベータ段階を経て一般提供（GA）に移行したと発表しました。このサービスは25言語をサポートし、バッチモードとストリーミングモードの両方を提供し、ウェイトリストなしで利用可能です。先行してGAとなったGrok Voice Agent APIと合わせ、音声スタック全体が完成しました。

📦 オープンソース (1)

🟢 📦 オープンソース 2026年4月22日 · 2 分で読めます

WorldDB：ベクターデータベースと世界グラフを融合したAIエージェント向けメモリエンジン

エディトリアルイラスト：オントロジーで結ばれたベクターデータベースとノードグラフがエージェントのメモリを構成する

WorldDBはベクターデータベースとネストされた世界グラフおよびオントロジーを組み合わせたAIエージェント向けの新しいメモリエンジンです。書き込み時に知識を調整し、エージェントメモリの矛盾を防止し、LongMemEval-sベンチマークで96.40%の精度を達成しています。

⚖️ 規制 (1)

🟡 ⚖️ 規制 2026年4月22日 · 3 分で読めます

EUがAIによるフェイクニュースとディープフェイク影響活動への公募を開始

編集イラスト：割れた画面とロボットアームのある正義の天秤、EUのAIフェイクニュースとの戦い

欧州委員会は操作的なAIコンテンツに対抗する共同研究フレームワーク構築のため、600万ユーロのDIGITAL-2026-BESTUSE-AWARENESS公募を開始しました。この公募は2025年11月に発表された欧州民主主義の盾の実施措置で、申請締め切りは2026年10月1日です。

🤝 エージェント (5)

🔴 🤝 エージェント 2026年4月22日 · 4 分で読めます

Google ReasoningBank：再トレーニング不要でエージェントが経験から学習、WebArena成功率+8.3%

GoogleはReasoningBankを発表しました。言語モデルの再トレーニングなしに、AIエージェントが自身の成功と失敗から学習できる記憶フレームワークです。WebArenaベンチマークで成功率8.3%向上、SWE-Bench-Verifiedで4.6%向上し、タスクあたり約3ステップを削減します。

🔴 🤝 エージェント 2026年4月22日 · 4 分で読めます

OpenAIがCodexをエンタープライズへ拡大：Codex Labsプログラムと週間400万アクティブユーザー

編集イラスト：AIエンティティと企業の高層ビル、コード画面が広がる未来都市の景観

OpenAIはCodex Labsプログラムを開始し、Accenture・Deloitte・KPMGとの戦略的提携を通じて、Codexエージェントを世界の大企業に展開します。このツールは週間400万アクティブユーザーを達成し、コンサルタント向け認定資格と消費量ベースのエンタープライズパッケージを提供しています。

🟡 🤝 エージェント 2026年4月22日 · 3 分で読めます

Agent-World：中国人民大学発、AIエージェント進化のためのスケーラブルな環境合成フレームワーク

エディトリアルイラスト：AIエージェントの学習のために風景や都市を含む動的環境が自動生成される

Agent-Worldは中国人民大学が開発した新しい研究フレームワークで、AIエージェントのトレーニング用に数千種類の多様な環境を自動生成します。手作業によるベンチマーク作成を動的なシナリオに置き換え、エージェントと環境の共進化を通じた進化的学習を可能にします。

🟡 🤝 エージェント 2026年4月22日 · 3 分で読めます

Gemini Deep ResearchがMCP統合、協調的プランニング、2つの新バージョンを取得

編集イラスト：Deep Researchエージェント用のモジュール式サーバーとデータフローを持つロボットシルエット

GoogleはGemini APIに2つの新しいDeep Researchエージェントバージョン——deep-research-preview-04-2026とdeep-research-max-preview-04-2026——をリリースしました。MCPサーバー統合、協調的プランニング、ビジュアライゼーション、ストリーミング応答を備えています。この動きはGeminiをChatGPT Deep ResearchとPerplexity Deep Researchの真剣な競合として位置づけます。

🟡 🤝 エージェント 2026年4月22日 · 3 分で読めます

マルチエージェントシステム調査：古典的パラダイムから大規模基盤モデルが切り拓く未来へ

エディトリアルイラスト：通信中の相互接続されたAIエージェントが古典的パラダイムと現代のLLM時代を橋渡しする

新しいarXivサーベイ論文は、古典的なマルチエージェントシステム文献と現代のLLMエージェントスタックを包括的に橋渡ししています。本論文は、協調メカニズム、通信プロトコル、創発的行動における低レベルの状態交換からセマンティック推論へのパラダイムシフトを明らかにしています。

🔧 ハードウェア (1)

🔴 🔧 ハードウェア 2026年4月22日 · 3 分で読めます

Googleが第8世代TPUチップを発表：エージェント型AI時代に向けた2つの専用バリアント

エディトリアルイラスト：エージェント型AIワークロードのトレーニングと推論向けの第8世代2種類のTPUチップ

GoogleはCloud Next '26カンファレンスにて、第8世代TPUチップを2つの専用バリアントとして発表しました。モデルのトレーニング向けのTPU 8tと、エージェント型推論向けのTPU 8iです。自律型AIエージェントとマルチステップ推論を主用途として設計された初めての世代となります。

🏥 実践 (3)

🟡 🏥 実践 2026年4月22日 · 3 分で読めます

Claude CoworkがAmazon Bedrockに登場——組織全体向けのAI

編集イラスト：エンタープライズチーム向けAWS Bedrock環境でデスクトップ上のClaude Coworkアプリケーション

AWSとAnthropicはAWSアカウント内でAmazon Bedrockを通じてClaude Coworkデスクトップアプリケーションを実行できるようにします。データはユーザーの管理下に留まり、モデルはそれで訓練されず、IAMとCloudTrailとの統合でエンタープライズレベルの監査を提供します。支払いは既存のAWS契約を通じて行われます。

🟢 🏥 実践 2026年4月22日 · 2 分で読めます

HolmesGPTとCNCFツールが1件0.04ドルでKubernetesアラートを自動診断

編集イラスト：アラートと自動診断のためのロボットアームを持つKubernetesダッシュボード

STCLab SREチームがReActパターンとCNCFツールを備えたHolmesGPTを使用してKubernetesアラートを自動診断しています。コストは1回の調査で0.04ドル、約40%のアラートが自律的に解決され、最重要な教訓：質の高いrunbookがモデル選択よりも重要です。

🟢 🏥 実践 2026年4月22日 · 2 分で読めます

オンデバイス精神科AI：Gemma・Phi・Qwenがデータをクラウドに送らずに動作

編集イラスト：精神科AIアプリとローカルニューラルネットワークを持つモバイルデバイス

Eranga Bandaraが率いる研究者たちが、DSM-5準拠の精神科評価のためにGemma・Phi-3.5-mini・Qwen2をローカルで統合するモバイルアプリを発表しました。システムはデータをクラウドに送らず、軍、司法システム、遠隔医療などの機密性の高いコンテキストを対象としています。

🛡️ セキュリティ (3)

🟡 🛡️ セキュリティ 2026年4月22日 · 3 分で読めます

DESPITEベンチマーク：LLMはロボットの計画は得意だが安全ではない

編集イラスト：迷宮の中でルートを計画するロボット、脆弱なデジタルセキュリティシールド

新しいDESPITEベンチマークが23の言語モデルを12,279のロボット計画タスクで評価しました。結果：最高の計画立案者は0.4%のケースでのみ失敗しますが、28.3%の危険な計画を生成します。計画能力と安全性は直交する能力であり、モデルのスケーリングでは安全上の欠陥は解決されません。

🟡 🛡️ セキュリティ 2026年4月22日 · 3 分で読めます

HuggingFaceマニフェスト：オープンソースがAIサイバーセキュリティの基盤

編集イラスト：AI安全の基盤としてオープンソースのブロックで埋められた壊れたデジタルシールド

HuggingFaceはマニフェストを発表し、Margaret Mitchell、Yacine Jernite、Clem Delangueと17名の共著者が、クローズドAIシステムがサイバーセキュリティの単一障害点であると主張しています。Anthropic Mythosへの回答であり、監査可能なログと人間の監督を備えた半自律エージェントを求めています。

🟢 🛡️ セキュリティ 2026年4月22日 · 2 分で読めます

GitHub CodeQLが宣言的なサニタイザーとバリデーターを取得、QLコード不要

編集イラスト：8つのプログラミング言語のロックでコードを脆弱性から守るデジタル要塞

GitHubはCodeQL 2.25.2でYAMLを通じたサニタイザーとバリデーターの宣言的定義を有効にし、QLコードを書く必要がなくなりました。8つの言語（C/C++、C#、Go、Java/Kotlin、JS/TS、Python、Ruby、Rust）をサポートし、QL専門家なしでチームが静的セキュリティ分析を行えるようになります。

← 前日翌日 →