2026년 5월 6일 수요일

16 개 뉴스 — 🔴 2 중요 , 🟡 11 주목 , 🟢 3 흥미

← 전날 다음 날 →

🤖 모델 (4)

🔴 🤖 모델 2026년 5월 6일 · 2 분 읽기

OpenAI: GPT-5.5 Instant, 환각 감소와 함께 ChatGPT의 새 기본 모델로 지정

편집 일러스트: 파란 배경의 ChatGPT 인터페이스에 GPT-5.5 Instant가 새 기본 모델로 표시됨

GPT-5.5 Instant는 OpenAI가 2026년 5월 5일 발표한 새로운 ChatGPT 기본 모델입니다. 더 스마트하고 정확한 답변, 환각 감소, 향상된 개인화를 제공하며, 동시에 시스템 카드도 공개되었습니다.

🟡 🤖 모델 2026년 5월 6일 · 2 분 읽기

arXiv:2605.03871: EvoLM — 외부 감독 없이 자가 개선하는 언어 모델

편집 일러스트: 외부 감독 없이 점수와 개선 사항을 교환하는 피드백 루프 내의 두 언어 모델

EvoLM은 외부 감독을 제거하는 포스트 트레이닝 방법입니다——Qwen3-8B 루브릭 생성기는 RewardBench-2에서 GPT-4.1을 25.7% 앞서고 SkyWork-RM을 16% 초과하며, 훈련된 정책은 OLMo3-Adapt 벤치마크에서 69.3%를 달성합니다.

🟡 🤖 모델 2026년 5월 6일 · 2 분 읽기

Google: Gemini API File Search, 이미지와 텍스트의 멀티모달 검색으로 확장

편집 일러스트: Gemini API가 임베딩 모델을 통해 이미지와 텍스트를 공통 의미론적 검색으로 결합합니다

Google이 Gemini API의 File Search를 멀티모달 검색으로 확장하여 gemini-embedding-2 모델을 통해 이미지와 텍스트 문서의 기본 임베딩 및 검색을 가능하게 했습니다. 두 개의 새로운 grounding 필드와 Batch API를 위한 이벤트 기반 webhook 지원이 추가되었습니다.

🟡 🤖 모델 2026년 5월 6일 · 2 분 읽기

Microsoft Research: DroidSpeak, 미세 조정된 LLM 변형 간 KV 캐시 공유로 4배 더 높은 처리량 달성

편집 일러스트: 데이터 센터에서 여러 미세 조정된 LLM 변형 간의 KV 캐시 공유 다이어그램

Microsoft Research가 NSDI 2026에서 DroidSpeak를 발표했습니다. 이는 아키텍처가 동일한 미세 조정된 LLM 변형 간에 KV 캐시를 공유하는 시스템으로, 수십 개의 도메인 모델을 가진 엔터프라이즈 시나리오에서 최대 4배 더 높은 처리량을 달성하며 품질 저하는 최소화됩니다.

📦 오픈소스 (1)

⚖️ 규제 (2)

🤝 에이전트 (4)

🟡 🤝 에이전트 2026년 5월 6일 · 2 분 읽기

Anthropic: 금융 서비스용 에이전트 템플릿 10종 + Claude Opus 4.7, Vals AI Finance 벤치마크에서 64.37% 달성

편집 일러스트: 리서치와 운영 두 그룹으로 나뉜 금융 에이전트 아이콘이 있는 열 개의 추상 카드

Anthropic이 pitchbook 생성기, KYC 심사기, 월말 결산 도구 등 10종의 금융 서비스용 에이전트 템플릿을 공개했습니다. 템플릿은 Claude Cowork와 Claude Code의 플러그인으로 제공되며, Claude Opus 4.7은 Vals AI Finance 벤치마크에서 64.37%를 달성했습니다.

🟡 🤝 에이전트 2026년 5월 6일 · 2 분 읽기

arXiv:2605.03675: MEMTIER — 5계층 메모리 아키텍처로 장기 에이전트에 기억력 회복

편집 일러스트: 에피소드 JSONL에서 의미론적 데이터베이스까지 데이터 흐름으로 연결된 5개의 수평 메모리 계층

MEMTIER는 장기 자율 에이전트를 위한 5계층 메모리 아키텍처입니다——LongMemEval-S 벤치마크에서 Qwen2.5-7B를 사용하면 정확도가 0.050에서 0.382로 상승하고 72시간 운영 후에도 도구 실행 성공률이 더 이상 하락하지 않습니다.

🟡 🤝 에이전트 2026년 5월 6일 · 2 분 읽기

AWS: AgentCore Browser에 OS 수준 작업 추가——8개의 새로운 기본 기능

편집 일러스트: Amazon Bedrock AgentCore 환경에서 에이전트가 브라우저 경계 밖의 시스템 대화 상자를 클릭하고 있습니다

AWS가 5월 5일 Amazon Bedrock AgentCore Browser의 OS 수준 작업을 발표했습니다. 에이전트가 DOM 범위 밖에서 운영 체제의 기본 인터페이스와 상호 작용할 수 있게 합니다. 8개의 작업과 작업-스크린샷-반응 루프를 도입하며, 추가 설정 없이 사용 가능합니다.

🟢 🤝 에이전트 2026년 5월 6일 · 2 분 읽기

arXiv:2605.02503: DataClaw——탐색적 데이터 분석에서 AI 에이전트의 프로세스 품질을 측정하는 과정 중심 벤치마크

편집 일러스트: AI 에이전트가 중간 결과가 포함된 인터랙티브 노트북에서 탐색적 데이터 분석 단계를 안내하고 있습니다

DataClaw는 AI 에이전트가 탐색적 데이터 분석에서 어떻게 작업하는지 완전한 과정을 평가하는 새로운 벤치마크입니다. 최종 답변만이 아니라 잘못된 방법으로 올바른 결과에 도달하는 에이전트의 약점을 드러냅니다.

🔧 하드웨어 (1)

🏥 실무 (2)

💬 커뮤니티 (1)

🛡️ 보안 (1)

← 전날 다음 날 →