Sentence Transformers v5.4がマルチモーダル埋め込みおよびリランカーモデルのサポートを追加
HuggingFaceのSentence TransformersライブラリはバージョンM5.4を取得し、マルチモーダル埋め込みおよびリランカーモデルを導入しました。ユーザーはテキスト、画像、オーディオ、ビデオを共通の埋め込み空間にマッピングし、クロスモーダル類似性を計算できるようになりました — 異なるタイプのコンテンツ検索の統合です。
10 件 — 🔴 2 重大 , 🟡 4 重要 , 🟢 4 注目
Amazonは、エンタープライズ組織向けのAIエージェント、ツール、エージェントスキルの一元的なカタログであるAWS Agent Registryのプレビュー版を公開しました。このシステムはホスト場所(AWS、他のクラウド、オンプレミス)を問わずエージェントをインデックス化し、キーワードとセマンティック検索の組み合わせに加えてIAMベースのアクセス制御を使用します。
AmazonはBedrock AgentCore Runtimeに3つの新しいMCP機能を追加しました — elicitation(ユーザーからの構造化された入力要求)、sampling(クライアントからのLLM補完要求)、プログレス通知です。ステートフルセッションは隔離されたmicrovM内で最大8時間続き、エージェントとクライアント間の双方向通信を可能にします。
AmazonはReactアプリ向けのBrowserLiveViewコンポーネントを発表しました。これは、AIエージェントがブラウザセッションで何をしているかをリアルタイムで表示します。ストリーミングはAmazon DCVプロトコル経由でAWSからユーザーのブラウザに直接送信され、レイテンシを最小化するためにアプリケーションサーバーをバイパスします。
AmazonはBedrock内のファウンデーションモデルライフサイクル管理の公式ガイドを公開しました。モデルは現在3つの明確に定義されたフェーズ(Active、Legacy、End-of-Life)を持ち、廃止予定の6か月前に通知があり、2026年2月以降はLegacyフェーズで少なくとも3か月の拡張アクセス期間が提供されます。
Microsoft Researchの第5回年次Future of Work調査によると、AIは職場でのコラボレーションを根本的に変えていますが、恩恵は不均等です。AIへの露出度が高い職種における若年層(22〜25歳)の雇用は16%減少し、40%の米国従業員は'workslop'——洗練されているが不正確なAI生成コンテンツ——を受け取っています。
Google ResearchはConvApparelを発表しました — 衣料品購入のコンテキストで4,000以上のマルチターン会話を含む新しいデータセットで、LLMベースのユーザーシミュレーターがどれほど現実的かを測定するために設計されています。調査によると、SFTおよびICLアプローチは単純なプロンプティングを大きく上回り、「顕著な分布外汎化」を示しています。