📦 오픈소스

38 개 뉴스

🟢 📦 오픈소스 2026년 5월 23일 · 3 분 읽기

Kedro:버전 1.2.0, GenAI 파이프라인을 위한 @experimental 데코레이터와 LangGraph 에이전트 starter 제공

편집 일러스트: LangGraph 오케스트레이션 브리지와 Mermaid 다이어그램이 있는 파이프라인 노드

Linux Foundation AI 프로젝트 Kedro가 Kedro-Viz 12.3.0과 함께 버전 1.2.0을 출시했습니다. 새로운 @experimental 데코레이터는 개발 중인 API 표시를 가능하게 하며, starter 프로젝트 support-agent-langgraph는 LangGraph 오케스트레이션 및 Langfuse/Opik 프롬프트 관리 도구와의 통합을 시연합니다. Kedro-Viz는 파이프라인 디버깅 개선을 위해 Mermaid 다이어그램과 노드 미리보기 확장성을 획득했습니다.

🟡 📦 오픈소스 2026년 5월 21일 · 2 분 읽기

Stability AI: Stable Audio 3.0, 개방 가중치 모델과 최대 6분 생성 지원 출시

Editorial illustration: Stability AI Stable Audio 3 개방 가중치 모델 시리즈, 6분 생성과 인페인팅 지원

Stability AI는 2026년 5월 20일 Stable Audio 3.0을 출시했습니다. 4개의 오디오 모델(Small SFX, Small, Medium, Large) 시리즈로, 이 중 3개는 개방 가중치이며 Hugging Face에서 바로 이용 가능합니다. 가장 큰 변화는 최대 6분 오디오 생성(이전 버전은 47초), 오디오 인페인팅, 인과적 연속, LoRA 파인튜닝 지원이며, 모든 모델이 라이선스 데이터로만 학습됐다고 밝혔습니다.

🟢 📦 오픈소스 2026년 5월 20일 · 2 분 읽기

LangChain:에이전트를 수정하는 에이전트 — LangSmith Engine의 구축 방법

Editorial illustration:

LangChain이 LangSmith Engine 기술 상세를 발표했습니다 — 프로덕션 AI 에이전트의 오류를 분석하고 구체적인 수정 방안을 제안하는 자율 메타 에이전트입니다. Engine은 오류 감지, 평가기 생성, 회귀 테스트를 엔드투엔드로 자동화합니다.

🟡 📦 오픈소스 2026년 5월 19일 · 1 분 읽기

PyTorch: ExecuTorch MLX Delegate가 Apple Silicon GPU에서 모델 추론을 3~6배 가속

Editorial illustration: PyTorch 팀이 ExecuTorch MLX Delegate를 공개――Apple MLX 프레임워크를 활용해 Apple Silicon GPU에서 추론을 3~6배 가속

PyTorch 팀이 실험적인 ExecuTorch MLX Delegate를 공개했습니다. Apple MLX 프레임워크와 Metal GPU 커널을 활용해 Apple Silicon 칩에서 3~6배의 처리량 향상을 제공하는 백엔드입니다. Llama 3.2·Qwen 3·Phi-4 mini·Whisper·Voxtral 실시간 스트리밍 전사를 지원합니다.

🟢 📦 오픈소스 2026년 5월 19일 · 2 분 읽기

GitHub: Copilot Spaces API 일반 제공 개시

Editorial illustration: GitHub가 Copilot Spaces REST API의 일반 제공을 발표――팀이 컨텍스트 인식 AI 작업 공간을 프로그래밍 방식으로 생성하고 관리 가능

GitHub는 Copilot Spaces의 REST API 일반 제공을 발표해 팀이 컨텍스트 인식 AI 작업 공간을 프로그래밍 방식으로 생성·구성·삭제할 수 있게 되었습니다. 새로운 인터페이스는 수동 워크플로우에 의존하지 않고 다수의 Spaces를 관리하는 조직에 특히 유용합니다.

🟡 📦 오픈소스 2026년 5월 18일 · 3 분 읽기

arXiv:2605.15041 CAST 프레임워크: 사례 기반 보정 LLM 도구 사용으로 BFCLv2 +5.85pp 달성 및 추론 길이 26% 감소

Editorial illustration: LLM agent s case library prikazom i tool call validation indicators.

CAST는 Renning Pang, Tian Lan, Leyuan Liu, Piao Tong, Sheng Cao, Xiaosong Zhang이 저술한 2026년 5월 14일 arXiv 논문으로 LLM 도구 사용을 위한 사례 기반 보정 프레임워크를 소개합니다. 이 접근 방식은 강화 학습을 위한 구조화된 정보로 과거 실행 궤적을 처리합니다. BFCLv2 기준선 대비 최대 +5.85 퍼센트 포인트 실행 정확도 향상과 평균 추론 길이 26% 감소를 달성합니다.

🟢 📦 오픈소스 2026년 5월 18일 · 4 분 읽기

arXiv:2605.15706 미분 가능한 에이전트 혼합: 동적 라우팅 에이전트 활성화로 9개 벤치마크 SOTA 달성

Editorial illustration: neural network routing graf s LLM agentima i sparse activation indicator-ima.

미분 가능한 에이전트 혼합(Differentiable Mixture-of-Agents)은 Xingjian Wu, Junkai Lu, Siyu Yan, Xiangfei Qiu, Jilin Hu, Chenjuan Guo, Bin Yang이 2026년 5월 15일 발표한 arXiv 논문으로, 멀티 에이전트 LLM 협업을 위한 미분 가능한 라우팅 메커니즘을 제안합니다. 고정 토폴로지 대신 추론 단계별로 에이전트를 동적으로 선택하고 활성화하며, 외부 주석 없는 예측 엔트로피 자기 지도 학습을 통한 테스트 시간 적응으로 9개 벤치마크에서 SOTA를 달성합니다.

🟢 📦 오픈소스 2026년 5월 18일 · 3 분 읽기

arXiv:2605.15100 이중 차원 일관성: 다섯 가지 벤치마크에서 정확도를 유지하면서 토큰 소비 10배 이상 감소

Editorial illustration: paralelni reasoning paths s confidence score badge-ovima i pruning ikonom.

이중 차원 일관성은 Rongman Xu, Yifei Li, Tianzhe Zhao, Yanrui Wu, Bo Li, Hang Yan이 작성한 2026년 5월 14일 arXiv 논문으로 추론 시 스케일링 효율성을 다룹니다. 이 프레임워크는 신뢰도 가중 베이즈 프로토콜과 트렌드 인식 계층적 가지치기를 결합합니다. 다섯 가지 벤치마크에서 강력한 기준선과 비교하여 토큰 소비를 10배 이상 줄이면서 정확도를 유지하거나 향상시키는 것을 실증합니다.

🟢 📦 오픈소스 2026년 5월 18일 · 3 분 읽기

arXiv:2605.15015 소형 프라이빗 LM: 교육 평가 설계에서 경쟁력 있는 결과 달성 및 휴먼 인 더 루프 권장

Editorial illustration: učionica scena s small LM ikonama, Bloom's taxonomy piramidom i human reviewer prikazom.

「교육 평가 설계의 팀원으로서의 소형 프라이빗 언어 모델」은 Chris Davis Jaldi, Anmol Saini, Shan Zhang, Noah Schroeder, Cogan Shimizu, Eleni Ilkou가 저술한 2026년 5월 14일 arXiv 논문입니다. 교육적으로 일치된 평가 문제 생성에서 소형 모델과 대형 대안을 체계적으로 비교했습니다. 소형 모델은 프라이버시 혜택과 함께 경쟁력 있는 결과를 달성하지만, 저자들은 모델 기반 평가에 체계적인 불일치가 있음을 강조하고 휴먼 인 더 루프 접근 방식을 권장합니다.

🟢 📦 오픈소스 2026년 5월 18일 · 3 분 읽기

arXiv:2605.15109 순회 컨텍스트: 에이전트 GraphRAG는 진정한 출처 추적을 위해 방문했지만 인용하지 않은 엔티티를 기록해야 합니다

Editorial illustration: knowledge graph s istaknutim traversal pathom i citation badge anotacijama uz uncited node-ove.

「이웃이 중요한 이유」는 Riccardo Terrenzi, Maximilian von Zastrow, Serkan Ayvaz가 저술한 2026년 5월 14일 arXiv 논문입니다(IJCAI-ECAI 2026 GENAIK·NORA 공동 워크숍 채택). 저자들은 에이전트 GraphRAG 시스템이 인용 충실도를 궤적 수준의 문제로 다루어야 한다고 주장합니다. 진정한 출처 추적은 인용된 증거뿐만 아니라 모델 추론에 영향을 미친 방문했지만 인용되지 않은 엔티티도 포함합니다.

🟢 📦 오픈소스 2026년 5월 18일 · 2 분 읽기

xAI SDK Python v1.13.0: prepare_extension()으로 생성된 클립 시리즈의 배치 비디오 확장 지원

Editorial illustration: serija video frameova s batch processing ikonom i xAI SDK kod snippet vizualizacijom.

xAI SDK Python v1.13.0이 2026년 5월 16일에 출시되었습니다(커밋 작성자 @double-di, PR #141). 배치 비디오 확장을 위한 새로운 prepare_extension() 메서드가 추가되었습니다. 이 기능은 v1.10.0에서 도입된 비디오 API를 확장하여 배치 처리 기능을 추가합니다. 개발자는 이제 각 클립을 순차적으로 처리하는 대신 한 번의 호출로 일련의 클립에 대한 확장을 준비할 수 있습니다.

🟢 📦 오픈소스 2026년 5월 16일 · 3 분 읽기

arXiv:2605.15132 APWA: 병렬 에이전트 워크플로를 위한 분산 아키텍처 — 크로스 통신 없는 비간섭 하위 문제

편집용 일러스트레이션: 간섭 없는 병렬 하위 분기를 가진 분산 에이전트 아키텍처.

APWA 분산형 병렬 에이전트 워크플로 아키텍처는 Evan Rose, Tushin Mallick, Matthew D. Laws, Cristina Nita-Rotaru, Alina Oprea가 2026년 5월 15일에 arXiv에 발표한 새로운 멀티 에이전트 시스템 아키텍처 논문입니다. 에이전트 워크플로를 크로스 통신 없이 독립적인 리소스에서 실행되는 비간섭 하위 문제로 분해합니다. APWA는 기존 시스템이 완전히 실패하는 작업에서도 확장됩니다.

🟢 📦 오픈소스 2026년 5월 16일 · 3 분 읽기

arXiv:2605.14968 GraphFlow: 형식적으로 검증 가능한 시각적 워크플로를 통해 임상 파일럿 완료율 97.08% 달성

Editorial illustration: 검증 체크와 계약 주석이 있는 워크플로 다이어그램.

GraphFlow는 MedFlow Inc.의 Drewry H. Morris V, Luis Valles, Reza Hosseini Ghomi가 2026년 5월 15일에 arXiv에 발표한 신뢰할 수 있는 에이전트 AI를 위한 새로운 시각적 워크플로 시스템입니다. 이 시스템은 형식적으로 검증 가능한 다이어그램 사양 접근 방식을 통해 복합 오류 문제(90% 단계별 신뢰성을 가진 10단계 프로세스는 35%만 성공)를 해결합니다. 3개 사이트를 통한 1년간의 임상 파일럿에서 초기 프로토타입을 사용하여 8,728번의 워크플로 실행을 97.08% 완료율로 수행했습니다.

🟡 📦 오픈소스 2026년 5월 15일 · 2 분 읽기

arXiv:2605.15040 Orchard: 오픈소스 에이전트 프레임워크가 세 가지 전문 레시피로 SWE-bench Verified 67.5% 달성

편집 일러스트: 세 개의 레시피 열과 샌드박스 런타임 아이콘이 있는 에이전트 프레임워크 다이어그램.

Orchard는 Baolin Peng, Wenlin Yao 및 12명의 공동 저자가 2026년 5월 14일 arXiv에 발표한 새로운 오픈소스 에이전트 모델링 프레임워크입니다. 이 프레임워크는 경량 환경 레이어와 세 가지 전문 훈련 레시피(SWE 소프트웨어 엔지니어링, GUI 비전 언어, Claw 개인 어시스턴트)를 결합합니다. Orchard-SWE 변형은 RL 훈련 후 SWE-bench Verified에서 67.5%를 달성하여 코딩 에이전트 분야의 최첨단 오픈소스 솔루션이 되었습니다.

🟡 📦 오픈소스 2026년 5월 15일 · 2 분 읽기

LangChain: Labs 자율 에이전트 연구 프로그램——파트너 Harvey, NVIDIA, Prime Intellect, Fireworks, Baseten

편집 일러스트: 에이전트 피드백 루프와 파트너 브랜드 아이콘이 있는 연구실.

LangChain Labs는 Harrison Chase가 2026년 5월 14일 발표한 새로운 응용 연구 프로그램으로, 운영 데이터——프로덕션 트레이스, 사용자 피드백, 평가 결과——에서 에이전트를 자율적으로 개선하는 것을 목표로 합니다. LangSmith가 트레이스 신호 수집의 백본으로 기능합니다. 초기 파트너에는 Harvey(법률 AI), NVIDIA(GPU/인프라), Prime Intellect(분산 컴퓨트), Fireworks(추론), Baseten(배포)이 포함됩니다.

🟡 📦 오픈소스 2026년 5월 14일 · 2 분 읽기

LangChain: LangSmith Engine은 에이전트 디버깅을 자동화합니다——오류 클러스터링, 근본 원인 분석, PR 및 평가기 추천

편집 일러스트: 근본 원인 분석과 PR 아이콘이 있는 에이전트 트레이스 클러스터.

LangSmith Engine은 2026년 5월 13일 LangChain이 발표한 새로운 플랫폼으로, AI 에이전트의 프로덕션 피드백 루프를 자동화합니다. 엔진은 프로덕션 실행의 트레이스 데이터를 분석하고, 패턴별로 오류를 클러스터링하며, 코드에서 근본 원인을 진단하고, 구체적인 풀 리퀘스트 제안과 평가기 정의를 생성합니다. 목표는 수동 디버깅에서 지속적인 자동화 개선으로의 전환입니다.

🟡 📦 오픈소스 2026년 5월 14일 · 2 분 읽기

PyTorch: 버전 2.12는 디바이스 독립적 torch.accelerator.Graph, MX 양자화, 100배 빠른 linalg.eigh를 도입합니다

편집 일러스트: CUDA와 XPU 가속기에 분산된 계산 그래프와 PyTorch 로고.

PyTorch 2.12는 2026년 5월 13일에 출시된 PyTorch 프레임워크의 새로운 프로덕션 버전으로, 2,926개의 커밋과 457명의 기여자를 포함합니다. 주요 기능: CUDA, XPU 및 서드파티 백엔드를 위한 디바이스 독립적 API인 torch.accelerator.Graph, torch.export에서 Microscaling MX 양자화(MXFP4/6/8) 지원, cuSolver를 통한 CUDA에서 최대 100배 빠른 linalg.eigh, CUDA Graphs 내 torch.cond 지원입니다. TorchScript는 공식적으로 제거되었습니다.

🟡 📦 오픈소스 2026년 5월 13일 · 2 분 읽기

LangChain: LangGraph Delta Channels가 증분 체크포인트로 장기 실행 에이전트 스토리지를 41배 절감

에디토리얼 일러스트: 메모리 스토리지 지표가 있는 델타 노드로 압축된 데이터 흐름.

LangGraph Delta Channels는 2026년 5월 12일에 발표된 LangChain의 새로운 상태 업데이트 메커니즘으로, 장기 실행 에이전트의 O(N²) 스토리지 폭발 문제를 해결합니다. 각 단계에서 전체 스냅샷 대신 Delta Channels는 증분 변경을 기록하고 50단계마다 주기적으로 스냅샷을 저장합니다. 벤치마크에서 41배 스토리지 절감을 보여주며, 이 업데이트는 Deep Agents v0.6과 LangGraph v1.2에 포함됩니다.

🟡 📦 오픈소스 2026년 5월 13일 · 2 분 읽기

PyTorch: ExecuTorch가 Arm Cortex-A·Cortex-M·Ethos-U85 NPU 엣지 AI 추론으로 확장

에디토리얼 일러스트: Arm 칩과 신경망 그래픽이 있는 엣지 디바이스.

ExecuTorch on Arm은 2026년 5월 12일에 발표된 PyTorch Foundation의 새로운 이니셔티브로, ExecuTorch 런타임을 Arm Cortex-A·Cortex-M CPU와 Ethos-U NPU 가속기로 확장합니다. OPT-125M 트랜스포머와 MobileNetV2 모델이 Raspberry Pi 5와 256 MAC 유닛의 Ethos-U85에서 실행되며, Arm Education 저장소는 엣지 AI 배포를 위한 실습 랩을 제공합니다.

🟡 📦 오픈소스 2026년 5월 7일 · 2 분 읽기

AMD: vLLM-ATOM 플러그인, vLLM 코드 수정 없이 Instinct 최적화 제공

Editorial illustration: vLLM-ATOM 플러그인, vLLM 코드 수정 없이 Instinct 최적화 제공

AMD가 소스 코드를 전혀 수정하지 않고 vLLM 프로덕션 프레임워크에 Instinct GPU 최적화를 통합하는 오픈소스 플러그인 vLLM-ATOM을 공개했다. Python entry_points를 통해 자동으로 활성화되며, Kimi-K2.5 및 DeepSeek V3/R1을 포함한 dense 및 MoE 모델을 지원한다. AITER 커널로 fused MoE와 flash attention을 구현한다.

🔴 📦 오픈소스 2026년 5월 6일 · 2 분 읽기

Allen Institute: MolmoAct 2, GPT-5와 Gemini 2.5 Pro를 능가하는 최초의 오픈소스 로보틱스 파운데이션 모델

편집 일러스트: 실험실에서 Franka 암 양팔 로봇이 상자를 열고 있으며, 오픈소스 MolmoAct 2 파운데이션 모델을 상징합니다

MolmoAct 2는 Allen Institute for AI가 5월 5일에 공개한 오픈소스 로보틱스 파운데이션 모델입니다. 구현 추론 벤치마크에서 63.8/100을 달성해 GPT-5와 Gemini 2.5 Pro를 능가하고, 추론 속도를 37배 향상시켰으며, 양손 협조 능력을 내장한 최초의 기반 모델입니다.

🟢 📦 오픈소스 2026년 4월 30일 · 2 분 읽기

IBM Granite 4.1:15T 토큰으로 학습된 오픈 소스 3B/8B/30B Apache 2.0 모델 패밀리, 밀집 8B 모델이 32B MoE에 필적

편집 일러스트:오픈 가중치 라이선스의 상징으로 펼쳐진 책과 화강암 블록

IBM은 2026년 4월 29일 HuggingFace 블로그에 Granite 4.1 모델 패밀리 구축 세부 사항을 공개했습니다. Apache 2.0 라이선스의 3B, 8B, 30B 밀집 변형이 제공됩니다. 약 15T 토큰으로 5단계 파이프라인 전략을 통해 학습했으며, GRPO+DAPO 손실을 사용한 4단계 RL을 채택했습니다. Granite 4.1-8B Instruct는 대부분의 벤치마크에서 이전 세대 Granite 4.0-H-Small(32B-A9B MoE)에 필적하거나 이를 능가하며, 밀집 모델이 동일한 활성화 예산으로 MoE 품질에 도달할 수 있음을 보여줍니다.

🟡 📦 오픈소스 2026년 4월 29일 · 2 분 읽기

Marco-MoE: 파라미터 5%만 활성화하는 오픈소스 다국어 MoE, 활성 파라미터 3~14배 많은 Dense 모델 능가

편집 일러스트: 다양한 언어 글리프를 가진 전문가 모듈 성단이 중앙 라우터를 둘러싼 모습

Marco-MoE는 Jiang, Zhao 등의 팀이 2026년 4월 28일 발표한 새로운 오픈소스 스파스 Mixture-of-Experts 모델 패밀리입니다. 토큰당 총 파라미터의 약 5%만 활성화하며, Dense 모델에서 업사이클링하여 5조 토큰 학습되었습니다. Instruct 버전은 활성 파라미터가 3~14배 많은 Dense 경쟁 모델을 능가하며, 가중치·데이터셋·레시피가 모두 공개되었습니다.

🟡 📦 오픈소스 2026년 4월 28일 · 3 분 읽기

OpenAI Privacy Filter 발표: 15억 파라미터, Apache 2.0, 128K 컨텍스트, 단일 스캔으로 8개 PII 카테고리 감지하여 SOTA 달성

소프트웨어 필터를 통해 문서의 민감한 부분이 자동으로 숨겨지는 스타일화된 이미지, 추상적 레이어와 카테고리 레이블로 표현.

OpenAI가 Privacy Filter를 발표했습니다——15억 파라미터(5000만 활성), 128,000 토큰 컨텍스트, Apache 2.0 라이선스의 오픈소스 PII 감지기. 단일 전방 패스로 8개 PII 카테고리를 감지하며 PII-Masking-300k 벤치마크에서 SOTA를 달성하고 다국어를 지원합니다.

🟢 📦 오픈소스 2026년 4월 28일 · 3 분 읽기

ONNX v1.21.0 출시, Opset 26 도입: 새로운 CumProd와 BitCast 연산자, 2비트 타입 지원 및 Python 3.14 자유 스레딩 실험

새로운 연산자와 2비트 텐서의 숫자 표시가 강조된 계층적 신경망 그래프의 추상적 일러스트. Opset 26 버전을 상징.

Linux Foundation AI & Data Foundation이 2026년 4월 27일 ONNX v1.21.0을 출시했습니다——CumProd와 BitCast 연산자가 포함된 Opset 26, 2비트 타입 지원, 실험적 Python 3.14 자유 스레딩, 정수 나눗셈 일관성 및 컴파일러 보안 개선을 도입합니다.

🟡 📦 오픈소스 2026년 4월 24일 · 3 분 읽기

Google DeepMind Decoupled DiLoCo:지리적으로 분산된 데이터센터 간 AI 훈련 네트워크 대역폭 20배 절감

편집 일러스트:오픈소스 도구 — open-source

Google DeepMind가 AI 모델 훈련을 위한 분산 아키텍처인 Decoupled DiLoCo를 발표했습니다. 8개 데이터센터 간에 필요한 네트워크 대역폭을 198 Gbps에서 0.84 Gbps로 줄이고, 높은 오류율 시나리오에서 굿풋을 27%에서 88%로 개선합니다.

🟡 📦 오픈소스 2026년 4월 24일 · 3 분 읽기

vLLM, DeepSeek V4 통합으로 KV 캐시 8.7배 감소: 표준 GPU에서 100만 토큰 컨텍스트 실현

에디토리얼 일러스트: vLLM DeepSeek V4 압축——KV 캐시 모듈

vLLM은 DeepSeek과 같은 날 V4-Pro 및 V4-Flash 모델의 완전한 통합을 발표했습니다. 100만 토큰 컨텍스트에서 V3.2 대비 KV 캐시가 8.7배 감소했습니다. 희소 어텐션과 적극적인 압축의 조합으로 표준 GPU 하드웨어에서의 서빙이 가능해졌습니다.

🟢 📦 오픈소스 2026년 4월 24일 · 2 분 읽기

Allen AI:OlmoEarth 임베딩, 단 60픽셀로 F1 점수 0.84의 지형 분할 달성

편집 일러스트:오픈소스 도구 — open-source

Allen Institute for AI가 위성 이미지 임베딩을 위한 세 가지 크기의 모델(Nano, Tiny, Base)을 갖춘 OlmoEarth Studio를 출시했습니다. 이 모델들은 단 60개의 레이블된 픽셀만으로 지형 분할에서 F1 점수 0.84를 달성하며, 변화 감지와 PCA 시각화도 지원합니다.

🟡 📦 오픈소스 2026년 4월 23일 · 2 분 읽기

Apple, ICLR 2026에서 ParaRNN 공개: 비선형 RNN 병렬 학습으로 665배 속도 향상

에디토리얼 일러스트: 오픈소스 도구 — open-source

Apple은 이번 주 리우데자네이루에서 열리는 ICLR 2026 학회에서 5편의 머신러닝 연구 논문을 발표했으며, 그 중 가장 주목받는 것은 ParaRNN입니다. ParaRNN은 비선형 순환 신경망의 병렬 학습을 가능하게 하는 방법으로, 순차적 방식 대비 665배 빠른 속도를 달성하여 RNN을 수십억 파라미터 규모로 확장해 트랜스포머와 경쟁력을 갖추게 합니다.

🟡 📦 오픈소스 2026년 4월 23일 · 2 분 읽기

Linux Foundation, 35개 오픈소스 도구를 담은 RGAF 책임 AI 가이드 공개

에디토리얼 일러스트: 오픈소스 도구 — open-source

Linux Foundation AI & Data는 9가지 책임 AI 차원을 통해 RGAF(책임 있는 생성형 AI 프레임워크)를 구현하는 방법을 보여주는 실용 가이드를 발표했습니다. 35개의 구체적인 오픈소스 도구 카탈로그와 NIST AI RMF, EU AI법, ISO/IEC 42001, OECD 원칙과의 일치가 포함되어 있습니다.

🟢 📦 오픈소스 2026년 4월 22일 · 2 분 읽기

WorldDB: 벡터 데이터베이스와 세계 그래프를 결합한 AI 에이전트용 메모리 엔진

에디토리얼 일러스트: 온톨로지로 연결된 벡터 데이터베이스와 노드 그래프가 에이전트의 메모리를 구성한다

WorldDB는 벡터 데이터베이스와 중첩된 세계 그래프 및 온톨로지를 결합한 AI 에이전트용 새로운 메모리 엔진입니다. 쓰기 시 지식을 조율하고 에이전트 메모리의 모순을 방지하며 LongMemEval-s 벤치마크에서 96.40%의 정확도를 달성합니다.

🟡 📦 오픈소스 2026년 4월 21일 · 3 분 읽기

Allen Institute BAR: 모듈식 사후 훈련과 MoE로 OLMo 2 7B 수학 점수 7.8점 향상

라우터 컴포넌트가 각 전문가에게 쿼리를 위임하는 모듈식 MoE 시스템을 보여주는 편집 삽화

BAR(Branch-Adapt-Route)는 Allen Institute for AI에서 제안한 새로운 모듈식 사후 훈련 방법으로, 수학, 코드, 도구 사용, 안전성 등 각 분야 전문가를 독립적으로 훈련하고 통합 Mixture-of-Experts 모델로 결합할 수 있습니다. OLMo 2 7B에서의 결과: 평균 점수 49.1점, 기준 재훈련 대비 수학 +7.8점, 코드 +4.7점 향상을 달성했습니다.

🟡 📦 오픈소스 2026년 4월 21일 · 2 분 읽기

AMD FLy: 훈련 없는 투기적 디코딩으로 Llama-3.3-405B 5.21배 가속, 정확도 99% 이상

투기적 디코딩의 편집 삽화——드래프트 모델이 토큰을 제안하고 타겟 모델이 병렬로 검증합니다

AMD FLy는 드래프트 토큰을 의미론적으로 수락하여 Llama-3.3-405B에서 4.80~5.21배, Llama-3.1-70B에서 2.74배 가속을 달성하는 새로운 훈련 불필요 투기적 디코딩 방법입니다. 99% 이상의 정확도를 유지하면서 추가적인 모델 훈련이 필요하지 않습니다.

🔴 📦 오픈소스 2026년 4월 18일 · 2 분 읽기

Google Gemma 4:오픈 모델 4종, 31B dense 아레나 3위, Apache 2.0 라이선스

Gemma 4는 Google의 새 세대 오픈 모델로 네 가지 변형으로 제공됩니다: 모바일용 E2B, 엣지 디바이스용 E4B, 38억 활성 파라미터를 가진 26B MoE, 그리고 31B dense. 31B는 오픈 모델 아레나 순위에서 3위를 차지했으며 자신보다 20배 큰 모델을 능가한다고 알려져 있고, 26B MoE는 6위입니다. 모든 모델은 멀티모달(텍스트, 이미지, 비디오, 오디오)이며 140개 언어를 지원하고 최대 256K 토큰의 컨텍스트를 가지며 Apache 2.0 라이선스로 출시됩니다.

🟢 📦 오픈소스 2026년 4월 17일 · 2 분 읽기

HuggingFace: 멀티모달 임베딩 및 리랭커 모델 훈련 가이드

HuggingFace는 Sentence Transformers 라이브러리를 통해 멀티모달 임베딩 및 리랭커 모델을 파인튜닝하는 자세한 가이드를 발표했습니다. 초점은 텍스트와 이미지를 공통 임베딩 공간에 통합하여 이기종 데이터에 걸친 의미적 검색을 가능하게 하는 것입니다. 주요 적용은 문서, 테이블, 이미지, 스캔 혼합물을 처리하는 RAG 시스템입니다.

🟢 📦 오픈소스 2026년 4월 17일 · 2 분 읽기

HuggingFace: Claude Code용 Transformers-to-MLX skill이 Apple Silicon 모델 포팅에 AI 지원 제공

HuggingFace는 Claude Code를 사용하여 Transformers 모델을 Apple Silicon용 MLX-LM 플랫폼으로 포팅하는 15,000단어의 Transformers-to-MLX skill을 공개했습니다. skill에는 LLM 환각 문제를 제거하는 결과를 독립적으로 검증하는 테스트 하네스가 포함되어 있으며, AI 에이전트가 풀 리퀘스트 수를 10배 늘리는 오픈소스 프로젝트의 증가하는 과제를 해결합니다.

🟢 📦 오픈소스 2026년 4월 16일 · 2 분 읽기

LangChain: Deep Agent를 활용해 문서가 스스로 테스트하게 만든 방법

LangChain이 문서의 오래된 코드 예제를 방지하기 위해 Deep Agent를 사용하는 자동화된 문서 테스트 시스템을 구축했습니다. 이 시스템은 다양한 스킬(skills)을 활용하여 인라인 코드 스니펫을 독립형 테스트 파일로 마이그레이션하고, GitHub Actions를 통해 실행하며, 검증된 스니펫을 재생성하여 문서가 항상 API의 실제 상태를 반영하도록 합니다.

🟡 📦 오픈소스 2026년 4월 10일 · 2 분 읽기

Waypoint-1.5: AI가 일반 RTX 3090에서 인터랙티브 720p 월드를 생성하다

Overworld가 Waypoint-1.5를 공개했습니다. 이는 RTX 3090 및 Apple Silicon Mac 같은 소비자용 GPU에서 720p/60fps 해상도로 인터랙티브 가상 환경을 생성하는 실시간 비디오 월드 모델입니다. 이 모델은 이전 버전보다 약 100배 많은 데이터로 훈련되었으며, HuggingFace에서 오픈 소스로 제공됩니다.