2026年4月23日木曜日

20 件 — 🔴 2 重大 , 🟡 12 重要 , 🟢 6 注目

🤖 モデル (3)

🟡 🤖 モデル 2026年4月23日 · 3 分で読めます

GoogleがGemini Embedding 2のGA版を発表：5つのモダリティを統一埋め込み空間に対応した初のマルチモーダル埋め込みモデル

Googleはgemini-embedding-2モデルの一般提供（GA）を発表しました。このモデルはテキスト、画像、動画、音声、PDFの5つのモダリティを単一の埋め込みベクトル空間にマッピングします。モデルは2026年3月10日からプレビュー版で提供されており、現在はGemini APIを通じてすべてのユーザーに公開されています。

🟡 🤖 モデル 2026年4月23日 · 2 分で読めます

Microsoft AutoAdapt：30分・4ドルでLLMを専門ドメインに自動適応

Microsoft Researchが、汎用言語モデルを医療・法律・インシデント対応などの専門ドメインに自動適応させるフレームワークAutoAdaptを発表しました。システムはRAGとファインチューニングを自律的に選択し、ハイパーパラメータを最適化して、追加コスト約4ドルで約30分でタスクを完了します。

🟢 🤖 モデル 2026年4月23日 · 3 分で読めます

アップルがICLR 2026でMANZANOを発表——画像理解と生成のトレードオフを解消する統合マルチモーダルモデル

アップルの研究グループはICLR 2026カンファレンスで、画像理解能力と画像生成品質の長年にわたるトレードオフを解決する統合マルチモーダルフレームワーク「MANZANO」を発表しました。このモデルは、理解のための連続的な埋め込みと生成のための離散トークンを生成するハイブリッドビジョントークナイザーを使用し、共有エンコーダと2つの特化アダプターを組み合わせることで、単一モデルが両タスクを担当する際に生じる性能損失を低減します。

📦 オープンソース (2)

🟡 📦 オープンソース 2026年4月23日 · 2 分で読めます

AppleがICLR 2026でParaRNNを発表：非線形RNNの並列学習で665倍の高速化を実現

Appleは今週リオデジャネイロで開催されているICLR 2026カンファレンスで5本の機械学習研究論文を発表しました。最注目はParaRNN——非線形リカレントニューラルネットワークの並列学習を可能にする手法で、逐次的アプローチと比べて665倍の高速化を達成し、RNNを数十億パラメータ規模に拡張してTransformerと競合できるようにします。

🟡 📦 オープンソース 2026年4月23日 · 2 分で読めます

Linux FoundationがRGAFガイドを公開：35のオープンソースツールで責任あるAIを実現

Linux Foundation AI & Dataは、9つの責任あるAIの次元を通じてRGAF（Responsible Generative AI Framework）を実装する方法を示す実践ガイドを公開しました。35の具体的なオープンソースツールのカタログとNIST AI RMF、EU AI法、ISO/IEC 42001、OECD原則への準拠が含まれています。

🤝 エージェント (6)

🔴 🤝 エージェント 2026年4月23日 · 3 分で読めます

Google DeepMindがエンタープライズAIのためにトップ5のコンサルティングファームと提携

Google DeepMindは、現在組織の25%しかAIを本番環境に実装できていないという現状を打開するため、世界トップ5のコンサルティングファーム——アクセンチュア、ベイン、BCG、デロイト、マッキンゼー——とパートナーシップを締結し、エンタープライズAIトランスフォーメーションを加速させます。

🔴 🤝 エージェント 2026年4月23日 · 3 分で読めます

OpenAI、ChatGPTにWorkspace Agentsを導入：エンタープライズチーム向けCodex駆動エージェント

OpenAIはWorkspace Agentsを発表しました。ChatGPTインターフェースに直接統合されたCodex駆動のAIエージェントです。エージェントはクラウドで実行され、複雑なワークフローを自動化し、クロスアプリセキュリティを重視した接続ツールを通じてエンタープライズチームの作業スケールを支援します。

🟡 🤝 エージェント 2026年4月23日 · 3 分で読めます

AWSがBedrock、Neptune、Mem0を通じた企業全体のAIエージェントメモリアーキテクチャを公開

AWSは、Amazon Bedrock、NeptuneグラフDBおよびMem0フレームワークを組み合わせて、企業全体のAIエージェントに永続的なメモリを提供するアーキテクチャを公開しました。これはセッション間およびユーザー間でのコンテキスト損失という問題を解決するものです。

🟡 🤝 エージェント 2026年4月23日 · 2 分で読めます

Amazon Bedrock AgentCoreがマネージドハーネスを導入：わずか3つのAPI呼び出しで動作するエージェントを展開

Amazonは、Bedrock AgentCore向けのマネージドエージェントハーネスを発表しました。これによりオーケストレーションインフラを自分で書くことなく、わずか3つのAPI呼び出しで完全に動作するエージェントを展開できます。ハーネスには開発ライフサイクル全体をカバーするAgentCore CLIと、コーディングアシスタント向けプレビルドスキルが付属しており、4つのAWSリージョンでプレビュー段階で利用できます。

🟢 🤝 エージェント 2026年4月23日 · 3 分で読めます

ArXiv SWE-chat——本番環境でのAIコーディングエージェントとの実際のやり取りのデータセット

ArXivで「SWE-chat」が公開されました。これは、本番環境でAIコーディングエージェントとユーザーが行った実際のいわゆる「ワイルド」なやり取りのデータセットです。GitHubのIssueベースの合成ベンチマークではなく、このデータセットは開発者が日常業務において自律型システムを実際に使用する方法——何を要求するか、エージェントの提案にどう反応するか、エージェントがどこで失敗するか——を記録しており、より精密な評価とエージェント設計の的を絞った改善への道を開きます。

🟢 🤝 エージェント 2026年4月23日 · 3 分で読めます

OSWorld研究：コンピュータ操作AIエージェントはタスクの繰り返しで頻繁に失敗する

新しい研究により、一度タスクを成功裏に実行したコンピュータ操作AIエージェントが、同一タスクの繰り返し試行で失敗する可能性があることが明らかになりました。主な原因は、実行の確率的性質、タスク仕様の曖昧さ、エージェント自体の行動のばらつきという3つです。

🔧 ハードウェア (2)

🟡 🔧 ハードウェア 2026年4月23日 · 3 分で読めます

NVIDIAとGoogle Cloudが共同インフラ上でエージェンティックAIとフィジカルAIの協力を発表

NVIDIAとGoogle CloudはNVIDIAのGPUインフラとGoogle Cloudプラットフォームを組み合わせ、ロボティクス、自律型システム、エージェントの分野でエージェンティックAIとフィジカルAIのワークロードを加速する共同協力を発表しました。

🟢 🔧 ハードウェア 2026年4月23日 · 3 分で読めます

Gemma 4がNVIDIA Jetson Orin Nano Superでローカル動作するVision Language Agentとして実証

NVIDIAとHuggingFaceは、Gemma 4がNVIDIA Jetson Orin Nano Super（8GBメモリ）上でVision Language Agent（VLA）として完全にローカルで動作するデモを披露しました。カメラ使用の自律判断から音声認識とTTSを含む完全なパイプライン処理まで、クラウド依存なしにすべてが実行されます。

🏥 実践 (5)

🟡 🏥 実践 2026年4月23日 · 3 分で読めます

AWSとNVIDIA Parakeet-TDTが1分あたり0.00005ドルで25言語の文字起こしを実現

AWSの機械学習ブログでは、NVIDIAのオープンソースモデルParakeet-TDT-0.6B-v3をクラウドで低コストの多言語音声文字起こしに使用する方法が解説されています。このモデルは自動検出付きで25のヨーロッパ言語をカバーし、AWS Batchとの組み合わせでSpotインスタンスでは1分あたりわずか0.00005ドル、オンデマンドg6.xlarge GPUでは0.00011ドルで処理できます。スケールゼロポリシーと、バッファリングされたストリーミングによる10時間以上の音声録音の処理にも対応しています。

🟡 🏥 実践 2026年4月23日 · 3 分で読めます

AWS SageMakerが生成AIモデルを自動ベンチマークし最適な推論設定を提供

Amazon SageMaker AIが、NVIDIA AIPerf ツールを使って様々なGPU設定で生成AIモデルを自動的にベンチマークする機能に対応しました。数週間にわたる手動テストを排除し、コスト・レイテンシ・スループットでランク付けされた推奨設定を提供します。

🟡 🏥 実践 2026年4月23日 · 2 分で読めます

GitHub CopilotのVS CodeでBYOKが利用可能に：AnthropicやGemini、OpenAIの独自キーを接続できるように

GitHubは、Copilot BusinessおよびEnterpriseユーザーがVS CodeでAnthropicやGoogle、OpenAI、OpenRouter、Azureなどの主要プロバイダーの独自APIキーを持ち込めるようにしました。BYOKモデルはCopilot Chatやカスタムエージェント内で機能し、料金は選択したプロバイダーに直接請求され、Copilotのクォータは消費されません。

🟡 🏥 実践 2026年4月23日 · 3 分で読めます

GitHub Copilot for Jiraがカスタムエージェント、カスタムブランチルール、コードレビュー通知を追加

GitHubはAtlassianのJira向けCopilotクラウドエージェントの最新アップグレードで、AIとプロジェクト管理の統合を大幅に深める機能を発表しました。タスク追跡システムとしてJiraを使用するチームは、カスタムエージェントの定義、ルールでのAtlassianカスタムフィールドの使用、スペース別のカスタムブランチルールの設定、Jira内でのコードレビューリクエスト通知の受信が可能になり、GitHubとプロジェクト管理ツール間の開発フローを連結します。

🟢 🏥 実践 2026年4月23日 · 2 分で読めます

OpenAI、米国の認定臨床医に無料ChatGPTアクセスを提供

OpenAIは、米国の認定医師、看護師、薬剤師に無料のChatGPTアクセスを提供するプログラムを開始しました。プログラムは臨床文書作成、患者ケアのワークフロー、医学研究に重点を置き、米国医療機関との提携を通じた認証が行われます。

🛡️ セキュリティ (1)

🟡 🛡️ セキュリティ 2026年4月23日 · 3 分で読めます

OpenAI、個人データの検出と編集のためのオープンウェイトモデル「Privacy Filter」を公開

OpenAIは、テキスト内の個人識別情報（PII）を最先端の精度で検出・編集するオープンウェイトモデルを公開しました。このモデルはOpenAIの珍しいオープンウェイトリリースであり、組織はクラウドに機密データを送信することなくローカルで実行できます。

✨ 注目トピック (1)

🟢 ✨ 注目トピック 2026年4月23日 · 2 分で読めます

Google PhotosのAuto Frame、3Dモデルと拡散技術でフレームを拡張

Google PhotosがAuto Frame機能を追加しました。2D写真を3Dシーンとして解釈し、幾何学とカメラパラメータを推定した後、潜在拡散モデルを使用して元のフレーム外のコンテンツを生成し、別の構図を実現します。

← 前日翌日 →