📦 オープンソース

38 件

🟢 📦 オープンソース 2026年5月23日 · 4 分で読めます

Kedro:バージョン1.2.0が@experimentalデコレータとLangGraphエージェントstarterをGenAIパイプライン向けに提供

編集イラスト:LangGraphオーケストレーションとMermaid図を持つパイプラインノード

Linux Foundation AIプロジェクトのKedroがKedro-Viz 12.3.0とともにバージョン1.2.0をリリースしました。新しい@experimentalデコレータは開発中のAPIのマーキングを可能にし、starterプロジェクトsupport-agent-langgraphはLangGraphオーケストレーションとLangfuse/Opikプロンプト管理ツールとの統合を実証します。Kedro-VizはMermaidダイアグラムとノードプレビューの拡張性を獲得し、パイプラインデバッグが向上します。

🟡 📦 オープンソース 2026年5月21日 · 2 分で読めます

Stability AI:Stable Audio 3.0がオープンウェイトモデルと最大6分の生成機能を引っさげて登場

Editorial illustration: Stability AI Stable Audio 3オープンウェイトモデルファミリー、6分生成とインペインティングに対応

Stability AIは2026年5月20日、4つのオーディオモデル(Small SFX、Small、Medium、Large)からなるStable Audio 3.0をリリースしました。うち3つはオープンウェイトでHugging Faceで公開されています。最大の変更点は最大6分間のオーディオ生成(前バージョンは47秒まで)、オーディオインペインティング、因果継続、LoRAファインチューニングのサポートで、全モデルがライセンスデータのみで学習したと述べられています。

🟢 📦 オープンソース 2026年5月20日 · 2 分で読めます

LangChain:エージェントを修正するエージェント——LangSmith Engineの構築方法

Editorial illustration:

LangChainはLangSmith Engine技術詳解を発表しました——本番AIエージェントのエラーを分析し具体的な修正を提案する自律メタエージェントです。Engineはエラー検出、評価器生成、回帰テストをエンドツーエンドで自動化します。

🟡 📦 オープンソース 2026年5月19日 · 2 分で読めます

PyTorch: ExecuTorch MLX DelegateがApple Silicon GPUでモデル推論を3〜6倍高速化

Editorial illustration: PyTorchチームがExecuTorch MLX Delegateを公開――Apple MLXフレームワークを活用してApple Silicon GPUでの推論を3〜6倍高速化

PyTorchチームが実験的なExecuTorch MLX Delegateを公開しました。Apple MLXフレームワークとMetal GPUカーネルを活用して、Apple Siliconチップ上で3〜6倍のスループット向上を実現するバックエンドです。Llama 3.2・Qwen 3・Phi-4 mini・Whisper・Voxtralのリアルタイムストリーミング文字起こしに対応します。

🟢 📦 オープンソース 2026年5月19日 · 2 分で読めます

GitHub: Copilot Spaces APIが一般提供開始

Editorial illustration: GitHubがCopilot Spaces REST APIの一般提供を発表――チームがコンテキスト対応AIワークスペースをプログラムで作成・管理できるようになった

GitHubはCopilot SpacesのREST APIの一般提供を発表し、チームがコンテキスト対応AIワークスペースをプログラムで作成・設定・削除できるようになりました。新しいインターフェースは、手動ワークフローに依存せずに多数のSpacesを管理する組織に特に有用です。

🟡 📦 オープンソース 2026年5月18日 · 4 分で読めます

arXiv:2605.15041 CAST フレームワーク:事例ベースキャリブレーション LLM ツール使用が BFCLv2 で +5.85pp、推論長を26%削減

Editorial illustration: LLM agent s case library prikazom i tool call validation indicators.

CAST は、Renning Pang、Tian Lan、Leyuan Liu、Piao Tong、Sheng Cao、Xiaosong Zhang による2026年5月14日付 arXiv 論文で、LLM ツール使用のための事例ベースキャリブレーションフレームワークを導入しています。このアプローチは、強化学習のための構造化情報として過去の実行トラジェクトリを扱います。BFCLv2 ベースラインと比較して最大 +5.85パーセントポイントの実行精度向上と、平均推論長の26%削減を達成しています。

🟢 📦 オープンソース 2026年5月18日 · 5 分で読めます

arXiv:2605.15706 微分可能エージェント混合:動的ルーティングによるエージェント起動で9ベンチマーク中SOTA達成

Editorial illustration: neural network routing graf s LLM agentima i sparse activation indicator-ima.

微分可能エージェント混合(Differentiable Mixture-of-Agents)は、Xingjian Wu、Junkai Lu、Siyu Yan、Xiangfei Qiu、Jilin Hu、Chenjuan Guo、Bin Yangが2026年5月15日に発表したarXiv論文で、マルチエージェントLLM協調のための微分可能なルーティング・メカニズムを提案しています。固定トポロジーに代わり、推論ステップごとにエージェントを動的に選択・起動し、予測エントロピーの自己監視による外部アノテーション不要のテスト時適応で9ベンチマーク中SOTAを達成しています。

🟢 📦 オープンソース 2026年5月18日 · 4 分で読めます

arXiv:2605.15100 デュアルディメンション一貫性:5つのベンチマークで精度を維持しながらトークン消費量を10倍以上削減

Editorial illustration: paralelni reasoning paths s confidence score badge-ovima i pruning ikonom.

デュアルディメンション一貫性は、Rongman Xu、Yifei Li、Tianzhe Zhao、Yanrui Wu、Bo Li、Hang Yan による2026年5月14日付 arXiv 論文で、推論時スケーリングの効率性を扱っています。このフレームワークは信頼度加重ベイズプロトコルとトレンド対応階層型プルーニングを組み合わせています。5つのベンチマークを通じて、強力なベースラインと比較してトークン消費量を10倍以上削減しながら、精度を維持または向上させることを実証しています。

🟢 📦 オープンソース 2026年5月18日 · 4 分で読めます

arXiv:2605.15015 Small Private LM:教育評価設計において競争力のある結果を達成し、ヒューマン・イン・ザ・ループの導入を推奨

Editorial illustration: učionica scena s small LM ikonama, Bloom's taxonomy piramidom i human reviewer prikazom.

「教育評価設計のチームメンバーとしての小型プライベート言語モデル」は、Chris Davis Jaldi、Anmol Saini、Shan Zhang、Noah Schroeder、Cogan Shimizu、Eleni Ilkou による2026年5月14日付 arXiv 論文です。教育評価問題の生成における小型モデルと大型代替モデルの系統的比較を実施しています。小型モデルはプライバシー上の利点を伴いながら競争力のある結果を達成していますが、著者らはモデルベースの評価に系統的な不一致があることを強調し、ヒューマン・イン・ザ・ループアプローチを推奨しています。

🟢 📦 オープンソース 2026年5月18日 · 3 分で読めます

arXiv:2605.15109 トラバーサルコンテキスト:エージェント型 GraphRAG は真のプロベナンスのために訪問済み・未引用エンティティを記録しなければならない

Editorial illustration: knowledge graph s istaknutim traversal pathom i citation badge anotacijama uz uncited node-ove.

「近傍が重要な理由」は、Riccardo Terrenzi、Maximilian von Zastrow、Serkan Ayvaz の著者による2026年5月14日付 arXiv 論文です(IJCAI-ECAI 2026 GENAIK・NORA 合同ワークショップに採択)。著者らは、エージェント型 GraphRAG システムは引用忠実性をトラジェクトリレベルの問題として扱うべきであると主張しています。真のプロベナンスは引用済みの証拠だけでなく、モデルの推論に影響を与えた訪問済み・未引用のエンティティも対象とします。

🟢 📦 オープンソース 2026年5月18日 · 3 分で読めます

xAI SDK Python v1.13.0:prepare_extension() により生成クリップシリーズのバッチビデオ拡張が可能に

Editorial illustration: serija video frameova s batch processing ikonom i xAI SDK kod snippet vizualizacijom.

xAI SDK Python v1.13.0 が2026年5月16日にリリースされました(コミット作成者 @double-di、PR #141)。バッチビデオ拡張のための新しい prepare_extension() メソッドが追加されています。この機能は v1.10.0 で導入されたビデオ API を拡張し、バッチ処理機能を追加します。開発者は各クリップを個別に順次処理する代わりに、一度の呼び出しで一連のクリップの拡張処理を準備できるようになりました。

🟢 📦 オープンソース 2026年5月16日 · 3 分で読めます

arXiv:2605.15132 APWA:並列エージェントワークフローの分散アーキテクチャ — クロス通信なしの非干渉サブ問題

編集用イラスト:干渉のない並列サブブランチを持つ分散エージェントアーキテクチャ。

APWA分散型並列エージェントワークフローアーキテクチャは、Evan Rose、Tushin Mallick、Matthew D. Laws、Cristina Nita-Rotaru、Alina Opreaが2026年5月15日にarXivで公開した新しいマルチエージェントシステムアーキテクチャ論文です。エージェントワークフローをクロス通信なしに独立したリソース上で実行できる非干渉サブ問題に分解します。APWAは従来のシステムが完全に失敗するタスクでスケールできることを示しています。

🟢 📦 オープンソース 2026年5月16日 · 4 分で読めます

arXiv:2605.14968 GraphFlow:形式的に検証可能なビジュアルワークフローを通じて臨床パイロット完了率97.08%を達成

Editorial illustration: 検証チェックとコントラクトアノテーションを持つワークフロー図。

GraphFlowは、MedFlow Inc.のDrewry H. Morris V、Luis Valles、Reza Hosseini Ghomiが2026年5月15日にarXivで発表した信頼性の高いエージェントAI向けの新しいビジュアルワークフローシステムです。このシステムは、正式に検証可能な図表仕様アプローチを通じて累積エラー問題(90%の単ステップ信頼性を持つ10ステッププロセスは35%しか成功しない)に対処します。3つのサイトを通じた1年間の臨床パイロットで、初期プロトタイプを使用して8,728回のワークフロー実行を97.08%の完了率で行いました。

🟡 📦 オープンソース 2026年5月15日 · 3 分で読めます

arXiv:2605.15040 Orchard: オープンソースのエージェントフレームワークが 3 つの専用レシピで SWE-bench Verified 67.5% を達成

編集イラスト:3 列のレシピ列とサンドボックスランタイムアイコンを持つエージェントフレームワークの図。

Orchard は、Baolin Peng、Wenlin Yao および 12 名の共著者が 2026 年 5 月 14 日に arXiv で発表した新しいオープンソースのエージェントモデリングフレームワークです。このフレームワークは、軽量な環境レイヤーと 3 つの専用トレーニングレシピ(SWE ソフトウェアエンジニアリング、GUI ビジョン言語、Claw 個人アシスタント)を組み合わせています。Orchard-SWE バリアントは RL トレーニング後に SWE-bench Verified で 67.5% を達成し、コーディングエージェント向けの最先端オープンソースソリューションとなっています。

🟡 📦 オープンソース 2026年5月15日 · 3 分で読めます

LangChain: Labs自律エージェント研究プログラム——パートナーにHarvey、NVIDIA、Prime Intellect、Fireworks、Baseten

編集イラスト:エージェントフィードバックループとパートナーブランドアイコンを持つ研究ラボ。

LangChain Labsは2026年5月14日にHarrison Chaseが発表した新しい応用研究プログラムで、運用データ——本番トレース、ユーザーフィードバック、評価結果——からエージェントを自律的に改善することを目指しています。LangSmithがトレースシグナル収集のバックボーンとして機能します。初期パートナーにはHarvey(法律AI)、NVIDIA(GPU/インフラ)、Prime Intellect(分散コンピュート)、Fireworks(推論)、Baseten(デプロイメント)が含まれます。

🟡 📦 オープンソース 2026年5月14日 · 2 分で読めます

LangChain: LangSmith Engineはエージェントのデバッグを自動化します——エラークラスタリング、根本原因分析、PRと評価器の推奨

編集イラスト:根本原因分析とPRアイコンを持つエージェントトレースクラスター。

LangSmith Engineは、2026年5月13日にLangChainが発表した新しいプラットフォームで、AIエージェントの本番フィードバックループを自動化します。エンジンは本番実行のトレースデータを分析し、パターン別にエラーをクラスタリングし、コード内の根本原因を特定し、具体的なプルリクエスト提案と評価器定義を生成します。目標は手動デバッグから継続的な自動改善への移行です。

🟡 📦 オープンソース 2026年5月14日 · 2 分で読めます

PyTorch: バージョン2.12はデバイス非依存のtorch.accelerator.Graph、MX量子化、100倍高速なlinalg.eighをもたらします

編集イラスト:CUDAとXPUアクセラレータに分散された計算グラフとPyTorchロゴ。

PyTorch 2.12は2026年5月13日にリリースされたPyTorchフレームワークの新しい本番バージョンで、2,926件のコミットと457名のコントリビューターを含みます。主な機能:CUDA・XPU・サードパーティバックエンドに対応したデバイス非依存APIであるtorch.accelerator.Graph、torch.exportでのMicroscaling MX量子化(MXFP4/6/8)のサポート、cuSolverを介したCUDA上で最大100倍高速なlinalg.eigh、CUDA Graphs内でのtorch.condサポートです。TorchScriptは正式に削除されました。

🟡 📦 オープンソース 2026年5月13日 · 2 分で読めます

LangChain: LangGraph Delta Channels が増分チェックポイントで長時間実行エージェントのストレージを 41 倍削減

エディトリアルイラスト:ストレージ指標インジケーターを持つデルタノードで圧縮されたデータストリーム。

LangGraph Delta Channels は 2026 年 5 月 12 日に発表された LangChain の新しい状態更新メカニズムで、長時間実行エージェントでのストレージの O(N²) 爆発問題を解決します。各ステップでのフルスナップショットの代わりに Delta Channels は増分変更を記録し、50 ステップごとに定期的なスナップショットを取ります。ベンチマークでは 41 倍のストレージ削減を示しており、この更新は Deep Agents v0.6 と LangGraph v1.2 に搭載されます。

🟡 📦 オープンソース 2026年5月13日 · 2 分で読めます

PyTorch: ExecuTorch が Arm Cortex-A・Cortex-M・Ethos-U85 NPU でエッジ AI 推論に対応

エディトリアルイラスト:Arm チップとニューラルネットワーク図形を持つエッジデバイス。

ExecuTorch on Arm は 2026 年 5 月 12 日に発表された PyTorch Foundation の新しいイニシアティブで、ExecuTorch ランタイムを Arm Cortex-A・Cortex-M CPU および Ethos-U NPU アクセラレーターに拡張します。OPT-125M トランスフォーマーと MobileNetV2 モデルが Raspberry Pi 5 と 256 MAC ユニットを持つ Ethos-U85 で動作し、Arm Education リポジトリはエッジ AI デプロイメントの実践ラボを提供します。

🟡 📦 オープンソース 2026年5月7日 · 2 分で読めます

AMD: vLLM-ATOMプラグインがvLLMコードを変更せずにInstinct最適化を提供

Editorial illustration: vLLM-ATOMプラグインがvLLMコードを変更せずにInstinct最適化を提供

AMDがvLLM-ATOMをリリース。ソースコードを変更せずにInstinct GPU最適化をvLLM本番フレームワークに統合するオープンソースプラグインだ。Pythonのentry_pointsで自動的に有効化され、Kimi-K2.5やDeepSeek V3/R1を含むdenseおよびMoEモデルをサポート。AITERカーネルでfused MoEとflash attentionを実現する。

🔴 📦 オープンソース 2026年5月6日 · 2 分で読めます

Allen Institute: MolmoAct 2 はGPT-5・Gemini 2.5 Proを上回る初のオープンソースロボティクス基盤モデル

編集イラスト:実験室でFrankaアームの二腕ロボットが箱を開けており、オープンソースのMolmoAct 2基盤モデルを象徴している

MolmoAct 2 は Allen Institute for AI が 5 月 5 日に公開したオープンソースのロボティクス基盤モデルです。具身推論ベンチマークで 63.8/100 を達成し、GPT-5 および Gemini 2.5 Pro を上回ります。推論速度は 37 倍向上し、バイマニュアル能力を内蔵した初の基盤モデルです。

🟢 📦 オープンソース 2026年4月30日 · 2 分で読めます

IBM Granite 4.1:15Tトークンで訓練されたオープンソース3B/8B/30B Apache 2.0モデルファミリー、密な8Bモデルが32B MoEに匹敵

編集イラスト:オープンウェイトライセンスのシンボルとして開いた本を持つ花崗岩のブロック

IBMは2026年4月29日、HuggingFaceブログにGranite 4.1モデルファミリーの構築詳細を公開しました。Apache 2.0ライセンスのもと3B、8B、30Bの密なバリアントが提供されています。5段階パイプライン戦略で約15Tトークンを訓練し、GRPO+DAPOロスを使用した4段階RLを採用。Granite 4.1-8B Instructはほとんどのベンチマークで前世代のGranite 4.0-H-Small(32B-A9B MoE)に匹敵または上回るパフォーマンスを示し、密なモデルが同じアクティベーションバジェットでMoEの品質に到達できることを示しています。

🟡 📦 オープンソース 2026年4月29日 · 2 分で読めます

Marco-MoE:パラメータの5%のみ有効化するオープンソース多言語MoEが、3〜14倍のアクティブパラメータを持つDenseモデルを上回る

編集イラスト:様々な言語グリフを持つエキスパートモジュールが中央ルーターを囲む星座

Marco-MoEは、JiangとZhaoらのチームが2026年4月28日に発表した新しいオープンソースのスパースMixture-of-Expertsモデルファミリーです。各トークンで総パラメータの約5%のみを有効化し、DenseモデルからUpcyclingで5兆トークン訓練されています。Instruct版はアクティブパラメータが3〜14倍多いDense競合モデルを上回り、重み・データセット・レシピはすべて公開されています。

🟡 📦 オープンソース 2026年4月28日 · 3 分で読めます

OpenAIがPrivacy Filterを発表:15億パラメーター、Apache 2.0ライセンス、128Kコンテキスト、1回のスキャンで8カテゴリーのPIIを検出しSOTA達成

ソフトウェアフィルターによって文書の機密部分が自動的に隠される様子を、抽象的なレイヤーとカテゴリーラベルで表現したスタイライズされた図。

OpenAIはPrivacy Filterを発表しました——15億パラメーター(アクティブ5000万)、128,000トークンコンテキスト、Apache 2.0ライセンスのオープンソースPII検出器。1回のフォワードパスで8カテゴリーのPIIを検出し、PII-Masking-300kベンチマークでSOTAを達成。多言語対応。

🟢 📦 オープンソース 2026年4月28日 · 4 分で読めます

ONNX v1.21.0リリース、Opset 26を導入:新しいCumProdとBitCastオペレーター、2ビット型サポート、Python 3.14フリースレッディング実験

新しいオペレーターと2ビットテンソルの数字表示が強調された階層的なニューラルネットワークグラフの抽象的なイラスト。Opset 26バージョンを象徴。

Linux Foundation AI & Data Foundationは2026年4月27日、ONNX v1.21.0をリリースしました——CumProdとBitCastオペレーターを含むOpset 26、2ビット型サポート、実験的なPython 3.14フリースレッディング、整数除算の一貫性改善、コンパイラーセキュリティ強化を導入しています。

🟡 📦 オープンソース 2026年4月24日 · 3 分で読めます

Google DeepMind Decoupled DiLoCo:地理的に分散したデータセンター間のAI訓練ネットワーク帯域幅を20倍削減

編集イラスト:オープンソースツール — open-source

Google DeepMindがDecoupled DiLoCo、AIモデル訓練のための分散アーキテクチャを発表しました。8つのデータセンター間で必要なネットワーク帯域幅を198 Gbpsから0.84 Gbpsに削減し、高障害率シナリオでのグッドプットを27%から88%に改善しています。

🟡 📦 オープンソース 2026年4月24日 · 3 分で読めます

vLLMがDeepSeek V4を統合:KVキャッシュ8.7倍削減で標準GPUに100万トークンコンテキストを実現

エディトリアルイラスト:vLLM DeepSeek V4圧縮——KVキャッシュモジュール

vLLMはDeepSeekと同日、V4-ProとV4-Flashモデルの完全統合を発表しました。100万トークンコンテキストでV3.2比8.7倍のKVキャッシュ削減を達成。スパースアテンションと積極的な圧縮の組み合わせにより、標準GPUハードウェアでのサービング提供が可能になりました。

🟢 📦 オープンソース 2026年4月24日 · 2 分で読めます

Allen AI:OlmoEarthエンベディングがわずか60ピクセルでF1スコア0.84の地景セグメンテーションを実現

編集イラスト:オープンソースツール — open-source

Allen Institute for AIがOlmoEarth Studioを発表しました。衛星画像エンベディング用に3サイズのモデル(Nano、Tiny、Base)を提供しています。わずか60個のラベル付きピクセルで地景セグメンテーションのF1スコア0.84を達成し、変化検出とPCA可視化もサポートしています。

🟡 📦 オープンソース 2026年4月23日 · 2 分で読めます

AppleがICLR 2026でParaRNNを発表:非線形RNNの並列学習で665倍の高速化を実現

エディトリアルイラスト:オープンソースツール — open-source

Appleは今週リオデジャネイロで開催されているICLR 2026カンファレンスで5本の機械学習研究論文を発表しました。最注目はParaRNN——非線形リカレントニューラルネットワークの並列学習を可能にする手法で、逐次的アプローチと比べて665倍の高速化を達成し、RNNを数十億パラメータ規模に拡張してTransformerと競合できるようにします。

🟡 📦 オープンソース 2026年4月23日 · 2 分で読めます

Linux FoundationがRGAFガイドを公開:35のオープンソースツールで責任あるAIを実現

エディトリアルイラスト:オープンソースツール — open-source

Linux Foundation AI & Dataは、9つの責任あるAIの次元を通じてRGAF(Responsible Generative AI Framework)を実装する方法を示す実践ガイドを公開しました。35の具体的なオープンソースツールのカタログとNIST AI RMF、EU AI法、ISO/IEC 42001、OECD原則への準拠が含まれています。

🟢 📦 オープンソース 2026年4月22日 · 2 分で読めます

WorldDB:ベクターデータベースと世界グラフを融合したAIエージェント向けメモリエンジン

エディトリアルイラスト:オントロジーで結ばれたベクターデータベースとノードグラフがエージェントのメモリを構成する

WorldDBはベクターデータベースとネストされた世界グラフおよびオントロジーを組み合わせたAIエージェント向けの新しいメモリエンジンです。書き込み時に知識を調整し、エージェントメモリの矛盾を防止し、LongMemEval-sベンチマークで96.40%の精度を達成しています。

🟡 📦 オープンソース 2026年4月21日 · 3 分で読めます

Allen Institute BAR:モジュール型後処理トレーニングとMoEがOLMo 2 7Bの数学スコアを7.8ポイント向上

モジュール型MoEシステムを示す編集用イラスト。ルーターコンポーネントが各エキスパートにクエリを振り分けています

BAR(Branch-Adapt-Route)は、Allen Institute for AIが提案した新しいモジュール型後処理トレーニング手法です。数学、コード、ツール使用、安全性といった分野のエキスパートを独立してトレーニングし、統合されたMixture-of-Expertsモデルに結合できます。OLMo 2 7Bでの結果:平均スコア49.1、数学で+7.8ポイント、コードで+4.7ポイントのベースライン比改善を達成しました。

🟡 📦 オープンソース 2026年4月21日 · 3 分で読めます

AMD FLy:トレーニング不要のSpeiculative DecodingでLlama-3.3-405Bを5.21倍高速化、精度99%超

Speculative Decodingの編集用イラスト——ドラフトモデルがトークンを提案し、ターゲットモデルが並列で検証しています

AMD FLyは、ドラフトトークンをセマンティックに受け入れることでLlama-3.3-405Bで4.80〜5.21倍、Llama-3.1-70Bで2.74倍の高速化を実現する新しいトレーニング不要のSpeculative Decoding手法です。99%超の精度を維持しながら、追加のモデルトレーニングは不要です。

🔴 📦 オープンソース 2026年4月18日 · 3 分で読めます

Google Gemma 4:4つのオープンモデル、31B denseがArena 3位、Apache 2.0ライセンス

Gemma 4はGoogleの新世代オープンモデルで、モバイル向けE2B、エッジデバイス向けE4B、38億アクティブパラメータの26B MoE、および31B denseの4バリエーションがあります。31Bはオープンモデルのアリーナランキングで3位につけ、自身の20倍のパラメータを持つモデルを超えると言われています。26B MoEは6位。すべてのモデルはマルチモーダル(テキスト・画像・動画・音声)で、140言語をサポートし、最大256Kトークンのコンテキストを持ち、Apache 2.0ライセンスで公開されています。

🟢 📦 オープンソース 2026年4月17日 · 2 分で読めます

HuggingFace:マルチモーダル埋め込みおよびリランカーモデルのトレーニングガイド

HuggingFaceはSentence Transformersライブラリを使用してマルチモーダル埋め込みとリランカーモデルをファインチューニングするための詳細なガイドを発表しました。焦点はテキストと画像を共通の埋め込み空間に統合し、異種データ全体のセマンティック検索を可能にすることです。主な用途はドキュメント、テーブル、画像、スキャンの混合を処理するRAGシステムです。

🟢 📦 オープンソース 2026年4月17日 · 2 分で読めます

HuggingFace:Claude Code向けTransformers-to-MLX skillがApple SiliconへのAI支援モデル移植を実現

HuggingFaceは、Claude CodeをApple Silicon向けMLX-LMプラットフォームへのTransformersモデル移植に使用する15,000語のTransformers-to-MLX skillを公開しました。skillにはLLM幻覚の問題を排除する結果を独立して検証するテストハーネスが含まれており、AIエージェントがプルリクエスト数を10倍に増やすオープンソースプロジェクトの増大する課題に対応しています。

🟢 📦 オープンソース 2026年4月16日 · 2 分で読めます

LangChain:Deep Agentを使ってドキュメントを自己テストさせた方法

LangChainはDeep Agentを使ったドキュメントの自動テストシステムを構築し、ドキュメント内の古くなったコード例を防止します。システムは複数のスキルを使ってインラインコードスニペットをスタンドアロンのテストファイルに移行し、GitHub Actionsで実行し、検証済みのスニペットを再生成することで、ドキュメントが常にAPIの実際の状態を反映するようにします。

🟡 📦 オープンソース 2026年4月10日 · 2 分で読めます

Waypoint-1.5:AIが一般的なRTX 3090でインタラクティブな720p世界を生成

Overworldが発表したWaypoint-1.5は、RTX 3090やApple Silicon MacなどコンシューマーGPU上で720p/60fpsの解像度でインタラクティブな仮想環境を生成するリアルタイム動画ワールドモデルです。モデルは前バージョンの約100倍のデータで訓練され、HuggingFace上でオープンソースとして利用可能です。