2026년 4월 22일 수요일

16 개 뉴스 — 🔴 3 중요 , 🟡 7 주목 , 🟢 6 흥미

🤖 모델 (2)

🟢 🤖 모델 2026년 4월 22일 · 2 분 읽기

MathNet: 47개국 30,676개 올림피아드 문제, 최신 모델도 여전히 뒤처져

편집 일러스트: 수학 기호와 47개국 지구본 조각이 있는 상호 연결된 노드

MIT 팀이 47개국 17개 언어에서 수집한 30,676개의 올림피아드 수학 문제가 있는 멀티모달 벤치마크 MathNet을 발표했습니다. Gemini-3.1-Pro는 78.4%, GPT-5는 69.3%를 달성하며, 임베딩 모델은 수학적으로 동일한 문제를 찾는 데 큰 어려움을 보입니다.

🟢 🤖 모델 2026년 4월 22일 · 2 분 읽기

xAI 음성-텍스트 변환 API 정식 출시: 25개 언어 지원으로 베타 졸업

에디토리얼 일러스트: 마이크와 음파 스트림이 Grok API를 통해 25개 언어의 전사본으로 변환된다

xAI가 음성-텍스트 변환(STT) API가 베타 단계에서 정식 출시(GA) 단계로 전환되었다고 발표했습니다. 이 서비스는 25개 언어를 지원하고 배치 및 스트리밍 모드를 제공하며 대기자 명단 없이 이용 가능합니다. 이전에 GA로 발표된 Grok Voice Agent API와 함께 완전한 음성 스택을 완성합니다.

📦 오픈소스 (1)

🟢 📦 오픈소스 2026년 4월 22일 · 2 분 읽기

WorldDB: 벡터 데이터베이스와 세계 그래프를 결합한 AI 에이전트용 메모리 엔진

에디토리얼 일러스트: 온톨로지로 연결된 벡터 데이터베이스와 노드 그래프가 에이전트의 메모리를 구성한다

WorldDB는 벡터 데이터베이스와 중첩된 세계 그래프 및 온톨로지를 결합한 AI 에이전트용 새로운 메모리 엔진입니다. 쓰기 시 지식을 조율하고 에이전트 메모리의 모순을 방지하며 LongMemEval-s 벤치마크에서 96.40%의 정확도를 달성합니다.

⚖️ 규제 (1)

🟡 ⚖️ 규제 2026년 4월 22일 · 2 분 읽기

EU, AI 허위정보와 딥페이크 영향력 캠페인 공모전 개최

편집 일러스트: 부서진 화면과 로봇 팔이 있는 정의의 저울, EU의 AI 허위정보 대항

유럽위원회가 조작적 AI 콘텐츠에 대응하는 공동 연구 프레임워크 구축을 위해 600만 유로 규모의 DIGITAL-2026-BESTUSE-AWARENESS 공모를 개설했습니다. 이 공모는 2025년 11월에 발표된 유럽 민주주의 방패의 실행 조치로, 신청 마감은 2026년 10월 1일입니다.

🤝 에이전트 (5)

🔴 🤝 에이전트 2026년 4월 22일 · 3 분 읽기

Google ReasoningBank: 재훈련 없이 경험에서 배우는 에이전트, WebArena 성공률 +8.3%

Google이 ReasoningBank를 발표했습니다. 언어 모델 재훈련 없이 AI 에이전트가 자신의 성공과 실패에서 학습할 수 있는 메모리 프레임워크입니다. WebArena 벤치마크에서 성공률 8.3% 향상, SWE-Bench-Verified에서 4.6% 향상, 작업당 약 3단계 감소를 달성했습니다.

🔴 🤝 에이전트 2026년 4월 22일 · 3 분 읽기

OpenAI, Codex를 엔터프라이즈로 확장: Codex Labs 프로그램과 주간 활성 사용자 400만 명

편집 일러스트: AI 엔티티와 기업 고층빌딩, 코드 화면이 펼쳐진 미래 도시 풍경

OpenAI가 Codex Labs 프로그램을 출시하고 Accenture, Deloitte, KPMG와 전략적 파트너십을 맺어 Codex 에이전트를 전 세계 대기업에 도입합니다. 이 도구는 주간 활성 사용자 400만 명을 달성했으며, 컨설턴트 인증 및 소비 기반 과금 엔터프라이즈 패키지를 제공합니다.

🟡 🤝 에이전트 2026년 4월 22일 · 2 분 읽기

Agent-World: 중국 런민대학교 발표, AI 에이전트 진화를 위한 확장 가능한 환경 합성 프레임워크

에디토리얼 일러스트: AI 에이전트 학습을 위해 풍경과 도시를 포함한 동적 환경이 자동으로 생성된다

Agent-World는 중국 런민대학교가 개발한 새로운 연구 프레임워크로, AI 에이전트 훈련을 위해 수천 가지 다양한 환경을 자동으로 생성합니다. 수작업으로 만든 벤치마크를 동적 시나리오로 대체하고 에이전트와 환경의 공진화를 통한 진화적 학습을 가능하게 합니다.

🟡 🤝 에이전트 2026년 4월 22일 · 3 분 읽기

Gemini Deep Research, MCP 통합·협업 계획·두 개의 새 버전 획득

편집 일러스트: Deep Research 에이전트를 위한 모듈식 서버와 데이터 흐름을 가진 로봇 실루엣

Google이 Gemini API에 두 가지 새로운 Deep Research 에이전트 버전——deep-research-preview-04-2026과 deep-research-max-preview-04-2026——을 출시했습니다. MCP 서버 통합, 협업 계획, 시각화, 스트리밍 응답을 갖추고 있습니다. 이 행보는 Gemini를 ChatGPT Deep Research와 Perplexity Deep Research의 진지한 경쟁자로 자리매김합니다.

🟡 🤝 에이전트 2026년 4월 22일 · 3 분 읽기

다중 에이전트 시스템 서베이: 고전적 패러다임부터 대형 기반 모델이 열어가는 미래까지

에디토리얼 일러스트: 통신 중인 상호 연결된 AI 에이전트들이 고전적 패러다임과 현대 LLM 시대를 연결하는 다리 역할을 한다

새로운 arXiv 서베이 논문이 고전적인 다중 에이전트 시스템 문헌과 현대 LLM 에이전트 스택을 포괄적으로 연결합니다. 이 논문은 조율 메커니즘, 통신 프로토콜, 창발적 행동에서의 패러다임 전환을 규명합니다. 저수준 상태 교환에서 의미론적 추론으로의 전환입니다.

🔧 하드웨어 (1)

🔴 🔧 하드웨어 2026년 4월 22일 · 3 분 읽기

구글, 8세대 TPU 칩 공개: 에이전트형 AI 시대를 위한 두 가지 특화 변형

에디토리얼 일러스트: 에이전트형 AI 워크로드의 학습과 추론을 위한 8세대 두 가지 특화 TPU 칩

구글은 Cloud Next '26 컨퍼런스에서 8세대 TPU 칩을 두 가지 특화 변형으로 공개했습니다. 모델 학습용 TPU 8t와 에이전트형 추론용 TPU 8i입니다. 자율형 AI 에이전트와 다단계 추론을 주요 사용 사례로 설계된 최초의 세대입니다.

🏥 실무 (3)

🟡 🏥 실무 2026년 4월 22일 · 2 분 읽기

Claude Cowork, Amazon Bedrock 도입——조직 전체를 위한 AI

편집 일러스트: 엔터프라이즈 팀을 위한 AWS Bedrock 환경에서 데스크톱의 Claude Cowork 애플리케이션

AWS와 Anthropic이 AWS 계정 내에서 Amazon Bedrock을 통해 Claude Cowork 데스크톱 애플리케이션을 실행할 수 있게 합니다. 데이터는 사용자 통제 하에 유지되고, 모델은 이를 훈련에 사용하지 않으며, IAM 및 CloudTrail과의 통합으로 엔터프라이즈 수준의 감사를 제공합니다. 비용은 기존 AWS 계약을 통해 지불됩니다.

🟢 🏥 실무 2026년 4월 22일 · 2 분 읽기

HolmesGPT와 CNCF 도구, 건당 0.04달러로 Kubernetes 경보 자동 진단

편집 일러스트: 경보와 자동 진단을 위한 로봇 팔이 있는 Kubernetes 대시보드

STCLab SRE 팀이 ReAct 패턴과 CNCF 도구를 갖춘 HolmesGPT로 Kubernetes 경보를 자동 진단합니다. 비용은 조사 건당 0.04달러, 약 40%의 경보가 자율적으로 해결되며, 가장 중요한 교훈: 양질의 runbook이 모델 선택보다 더 중요합니다.

🟢 🏥 실무 2026년 4월 22일 · 2 분 읽기

온디바이스 정신과 AI: Gemma, Phi, Qwen이 클라우드 데이터 전송 없이 작동

Eranga Bandara가 이끄는 연구자들이 DSM-5 준거 정신과 평가를 위해 Gemma, Phi-3.5-mini, Qwen2를 로컬로 조율하는 모바일 애플리케이션을 발표했습니다. 시스템은 클라우드에 데이터를 보내지 않으며, 군대, 사법 시스템, 원격 의료 등 민감한 맥락을 대상으로 합니다.

🛡️ 보안 (3)

🟡 🛡️ 보안 2026년 4월 22일 · 3 분 읽기

DESPITE 벤치마크: LLM은 로봇 계획에 능하지만 안전하지 않다

편집 일러스트: 미로에서 경로를 계획하는 로봇, 취약한 디지털 보안 방패

새로운 DESPITE 벤치마크가 23개 언어 모델을 12,279개 로봇 계획 작업으로 평가했습니다. 결과: 최고 계획자는 0.4% 케이스에서만 실패하지만 28.3%의 위험한 계획을 생성합니다. 계획 능력과 안전성은 직교 능력입니다——모델 스케일링으로 안전 결함이 해결되지 않습니다.

🟡 🛡️ 보안 2026년 4월 22일 · 3 분 읽기

HuggingFace 선언문: 오픈소스가 AI 사이버 보안의 기반

편집 일러스트: AI 보안의 기반으로 오픈소스 블록으로 채워진 부서진 디지털 방패

HuggingFace가 선언문을 발표했습니다. Margaret Mitchell, Yacine Jernite, Clem Delangue와 17명의 공동 저자가 폐쇄형 AI 시스템이 사이버 보안의 단일 실패 지점이라고 주장합니다. Anthropic Mythos에 대한 응답으로, 감사 가능한 로그와 인간 감독이 있는 반자율 에이전트를 촉구합니다.

🟢 🛡️ 보안 2026년 4월 22일 · 2 분 읽기

GitHub CodeQL, 선언적 새니타이저와 유효성 검사기 지원, QL 코드 불필요

편집 일러스트: 8개 프로그래밍 언어의 잠금장치로 코드를 취약점으로부터 보호하는 디지털 요새

GitHub이 CodeQL 2.25.2에서 YAML을 통한 새니타이저와 유효성 검사기의 선언적 정의를 가능하게 했습니다. QL 코드 작성이 필요 없습니다. 8개 언어(C/C++, C#, Go, Java/Kotlin, JS/TS, Python, Ruby, Rust)를 지원하여 QL 전문가 없이도 정적 보안 분석을 가능하게 합니다.

← 전날 다음 날 →