🏥 실무

100 개 뉴스

🟡 🏥 실무 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22681：CUSP 벤치마크, 프런티어 모델이 과학적 돌파구를 신뢰할 수 있게 예측하지 못함을 입증

CUSP 벤치마크는 4,700개 사건의 데이터베이스로 AI 모델이 과학적 돌파구를 예측하는 능력을 테스트합니다. 프런티어 모델（GPT-5, Claude Opus 4.7, Gemini 3 Pro）은 그럴듯한 연구 방향을 식별하지만 과도한 확신으로 결과와 시기를 체계적으로 추측합니다. 추가적인 마감 전 맥락은 도움이 되지 않습니다——한계는 정보적인 것이 아니라 구조적입니다.

🟡 🏥 실무 2026년 5월 23일 · 3 분 읽기

GitHub：2026년 Gartner 매직 쿼드런트——GitHub Copilot이 기업용 AI 코딩 에이전트에서 3년 연속 리더 선정

편집 일러스트: 사분면 매트릭스에서 Leader 섹터에 위치한 GitHub Copilot

Gartner가 2026년 기업용 AI 코딩 에이전트 매직 쿼드런트 보고서에서 GitHub를 리더로 선정했습니다——해당 카테고리가 존재한 이래 3년 연속입니다. GitHub Copilot은 현재 전 세계 140,000개 조직에서 사용되며, 평가에서는 단순 코드 생성이 아닌 코드부터 리뷰, 보안, 거버넌스까지 전체 SDLC를 아우르는 에이전트 워크플로가 강조되었습니다.

🟢 🏥 실무 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22337：Meta-Soft, 조합 가능한 메타 토큰과 학습 가능한 직교 기저로 KV 캐시 압축 도입

연구자들이 LLM 추론에서 동적 KV 캐시 압축을 위한 새로운 방법인 Meta-Soft를 제안했습니다. 이 방법은 학습 가능한 직교 기저 행렬과 선택기 네트워크를 사용해 긴 프롬프트에서 핵심 정보의 압축 표현인 소프트 메타 토큰을 합성합니다. 주의력 흐름 메커니즘이 삭제된 토큰의 의미 정보를 보존된 토큰으로 재분배하며, 대부분의 장문맥 벤치마크에서 기존 KV 캐시 퇴거 방법을 능가합니다.

🟢 🏥 실무 2026년 5월 23일 · 4 분 읽기

arXiv:2605.22664：WorkstreamBench, 금융 분야 엔드투엔드 스프레드시트 작업에서 LLM 에이전트를 테스트하고 프론티어 모델은 부진한 결과를 보입니다

편집 삽화: 수식이 있는 Excel 스프레드시트와 이를 분석하는 AI 에이전트

WorkstreamBench는 Thomson Yen이 이끄는 10명의 저자가 만든 새 벤치마크로, 금융 도메인에서 청구서, 보고서, 비용 분석 등 실제 Excel 및 스프레드시트 작업을 LLM 에이전트에 대해 테스트합니다. GPT-4o, Claude, Gemini를 비교했으나 어떤 모델도 전체 작업 세트를 신뢰할 수 있게 완료하지 못했으며, 이는 엔터프라이즈 금융을 위한 현재 에이전트 인프라에 구조적 결함이 있음을 나타냅니다.

🟢 🏥 실무 2026년 5월 23일 · 2 분 읽기

Anthropic Claude Code v2.1.150 — 사용자 변경 사항 없는 내부 인프라 패치

편집 삽화: 버전 번호와 내부 톱니바퀴가 표시된 Claude Code 터미널

Anthropic은 UTC 토요일 04:03에 Claude Code CLI 버전 v2.1.150을 출시했으며, v2.1.149로부터 불과 하루 만입니다. 이번 릴리스에는 사용자 향 변경 사항 없이 내부 인프라 개선만 포함되어 있습니다. Darwin, Linux, Windows의 ARM64 및 x64 아키텍처와 Linux musl 빌드에서 사용 가능합니다.

🟡 🏥 실무 2026년 5월 22일 · 2 분 읽기

arXiv:2605.21427：PALS — MoE 모델 전력 인식 LLM 서빙으로 +26.3% 에너지 효율 및 4-7배 QoS 위반 감소 달성

편집 일러스트：2605.21427：PALS — MoE 모델 전력 인식 LLM 서빙으로 +26.3% 에너지 효율 및 4-7배 QoS 위반 감소

연구자들은 2026년 5월 21일 arXiv 프리프린트 서버에 PALS를 공개했다. PALS는 GPU 전력 제어를 MoE 모델 LLM 서빙에 직접 통합하는 런타임 시스템이다. 경량 오프라인 전력-성능 모델과 피드백 컨트롤러를 활용해 처리량 목표에 따라 구성을 동적 최적화하며, 전력 제한 하에서 26.3% 에너지 효율 향상과 4-7배 QoS 위반 감소를 달성한다. API 변경이나 모델 재훈련 없이 vLLM에 통합되며, 데이터센터의 가장 큰 운영 병목 — GPU 클러스터 에너지 소비 — 을 직접 해결한다.

🟢 🏥 실무 2026년 5월 22일 · 3 분 읽기

CNCF：NetEase Games, Fluid 프리페칭 레이어로 Kubernetes LLM 콜드 스타트 30초 달성

편집 일러스트：NetEase Games, Fluid 프리페칭 레이어로 Kubernetes LLM 콜드 스타트 30초 달성

CNCF는 2026년 5월 21일 NetEase Games(저자 廖海峰·張翔)의 사례 연구를 공개했다. CNCF 인큐베이션 프로젝트 Fluid를 이용해 70B급 LLM 모델 로딩 시간을 S3 직접 접근 시의 42분에서 30초 미만으로 줄인 방법을 상세히 설명한다. 핵심은 팀 간 모델을 공유하는 Fluid 프리페칭 레이어와 콜드 스타트를 제거하는 사전 워밍 스케줄링이다. Kubernetes에서 대형 모델로 서버리스 LLM 추론을 운영하는 엔지니어를 위한 기술 사례 연구다.

🟡 🏥 실무 2026년 5월 21일 · 2 분 읽기

AWS: SageMaker AI에 OpenAI 호환 API 엔드포인트 도입

Editorial illustration: AWS SageMaker AI OpenAI 호환 API 엔드포인트, 자체 GPU 인프라로의 드롭인 교체 실현

AWS는 2026년 5월 20일 Amazon SageMaker AI의 실시간 추론 엔드포인트에서 OpenAI 호환 API를 제공한다고 발표했습니다. OpenAI SDK, LangChain, Strands Agents의 드롭인 대체재로 URL만 변경하면 됩니다. 엔드포인트는 /openai/v1 경로로 Chat Completions와 스트리밍을 지원하며, 인증은 AWS 자격증명에서 생성된 시간 제한 Bearer 토큰을 사용합니다.

🟡 🏥 실무 2026년 5월 21일 · 2 분 읽기

Google DeepMind: WeatherNext, 허리케인 멜리사의 5등급 도달을 5일 전에 예측

Editorial illustration: Google DeepMind WeatherNext가 허리케인 멜리사의 5등급 도달을 최초로 5일 전에 예측

Google DeepMind는 2026년 5월 19일, WeatherNext 모델이 80% 신뢰도로 허리케인 멜리사가 5등급에 도달할 것을 정확히 5일 전에 예측했다고 발표했습니다. 이는 현대 기상학에서 최초의 사례입니다. 모델은 50개의 병렬 시나리오 앙상블을 사용하며, 지난 시즌 미국 국가 허리케인 센터 평가에서 최상위 허리케인 예보 시스템으로 선정됐습니다.

🟢 🏥 실무 2026년 5월 19일 · 2 분 읽기

CNCF: Kubernetes 디버거가 접근 흔적을 삭제――보안 감사에 심각한 규정 준수 문제

Editorial illustration: CNCF가 kubectl debug 세션 종료 후 기록이 남지 않는 문제를 경고――PCI DSS 및 SOC 2 규정 준수에 대한 위협

CNCF는 Kubernetes 컨테이너 진단 도구인 kubectl debug가 세션 종료 후 어떠한 기록도 남기지 않는다고 경고합니다. 이로 인해 규제 대상 산업에서는 핵심 질문에 답할 수 없습니다. 누가 어떤 컨테이너를 얼마나 오래 열람했는지――이는 PCI DSS 및 SOC 2 감사 로그 요건을 직접적으로 위반합니다.

🟡 🏥 실무 2026년 5월 16일 · 2 분 읽기

GitHub: Copilot Memory가 모든 저장소에 걸쳐 커밋 스타일, PR 구조, 사용자 커뮤니케이션 기본 설정을 기억합니다

편집용 일러스트레이션: 저장소를 연결하는 메모리 아이콘이 있는 Copilot 인터페이스.

GitHub Copilot Memory 사용자 기본 설정은 2026년 5월 15일에 출시된 새로운 개인화 기능으로, Copilot이 저장소 에코시스템 전체에 걸쳐 사용자 설정을 기억할 수 있게 합니다. Copilot Memory는 커밋 메시지 스타일, PR 구조, 커뮤니케이션 기본 설정(격식체 vs 구어체 어조, 세부 수준)을 기록하고 사용자가 작업하는 모든 저장소에 일관되게 적용합니다. 이 기능은 Cursor 및 Codeium 적응형 기능과 경쟁하는 더 넓은 Copilot 개인화 레이어의 일부입니다.

🟡 🏥 실무 2026년 5월 16일 · 2 분 읽기

OpenAI: ChatGPT Personal Finance——미국 Pro 구독자가 금융 계좌를 안전하게 연결하여 AI 기반 인사이트를 얻습니다

Editorial illustration: AI 대화 표시와 은행 통합 아이콘이 있는 금융 대시보드.

ChatGPT Personal Finance는 2026년 5월 15일에 발표된 새로운 OpenAI 기능으로, 미국 Pro 구독자가 사용자의 구체적인 재무 상황, 목표 및 우선순위에 기반한 AI 기반 인사이트를 위해 금융 계좌를 안전하게 연결할 수 있게 합니다. 이 기능은 ChatGPT를 범용 채팅에서 개인화된 금융 어시스턴트 계층으로 확장하며, Google Finance와 Perplexity의 finance_search 도구(5월 13일 발표)와 직접 경쟁합니다.

🟡 🏥 실무 2026년 5월 16일 · 2 분 읽기

OpenAI + Databricks: GPT-5.5가 OfficeQA Pro 신기록 달성 후 엔터프라이즈 에이전트 워크플로에 통합

Editorial illustration: Databricks와 OpenAI 로고, GPT-5.5 아이콘 및 엔터프라이즈 에이전트 워크플로 표시.

OpenAI Databricks 통합은 2026년 5월 15일에 발표된 새로운 엔터프라이즈 에이전트 파트너십으로, 에이전트 워크플로 구축을 위해 GPT-5.5 모델을 Databricks 플랫폼에 도입합니다. 이 발표는 파트너 채널을 통한 GPT-5.5의 첫 번째 명시적 배포입니다——이 모델은 OfficeQA Pro 벤치마크에서 기록을 세웠으며 현재 Databricks Mosaic AI 런타임을 통해 엔터프라이즈 클라이언트에게 제공됩니다.

🟢 🏥 실무 2026년 5월 16일 · 3 분 읽기

AWS: Amazon Quick — deny-by-default와 ALLOW/DENY 규칙을 갖춘 S3 지식 베이스의 문서 수준 액세스 제어

편집용 일러스트레이션: 액세스 전 사용자 ID 확인을 위한 ACL 레이어가 있는 문서 데이터베이스.

Amazon Quick 문서 수준 액세스 제어는 Josh DeMuth이 2026년 5월 15일에 발표한 새로운 엔터프라이즈 RAG 보안 메커니즘입니다. 두 가지 구성 방법(안정적인 구조를 위한 중앙 집중식 JSON인 전체 ACL 파일과 문서 수준 메타데이터 파일)을 통해 Amazon Quick 내 S3 지식 베이스에 대한 문서 수준 ACL을 가능하게 합니다. 시스템은 deny-by-default를 사용하며 사용자 및 그룹 수준에서 ALLOW/DENY 규칙을 지원합니다(DENY가 항상 우선합니다).

🟡 🏥 실무 2026년 5월 15일 · 2 분 읽기

Amazon Lex: Assisted NLU LLM 모드가 추가 비용 없이 92% 의도 정확도와 84% 슬롯 해결률 달성

Amazon Lex Assisted NLU는 2026년 5월 14일 발표된 챗봇용 새로운 LLM 기반 모드로 기존 Lex NLU에 대형 언어 모델을 추가합니다. 평균 92% 의도 분류 정확도와 84% 슬롯 해결 정확도를 달성하고, 실제 배포에서 의도 분류 11~15% 개선, 폴백 응답 23.5% 감소를 보입니다. 두 가지 모드——기본 모드(모든 입력)와 폴백 모드(낮은 신뢰도 시)——가 표준 Lex 요금에 포함됩니다.

🟢 🏥 실무 2026년 5월 15일 · 2 분 읽기

GitHub Copilot Cloud Agent: 자동 모델 선택으로 토큰 배수에 10% 할인 적용

편집 일러스트: 회전하는 모델 아이콘과 할인 비율이 있는 AI 에이전트.

GitHub Copilot Cloud Agent 자동 모델 선택은 2026년 5월 14일 발표된 새로운 기능으로, 시스템 상태와 모델 성능 신호를 기반으로 작업에 최적의 모델을 자동으로 선택합니다. 자동 모드 사용자는 표준 모델 배수에 10% 할인을 받으며 주간 사용량 제한에서 제외됩니다. 이 기능은 수동 모델 선택의 필요성을 제거하고 주 마지막 전에 한도에 도달하는 기업 사용자들의 일반적인 불만에 대응합니다.

🟢 🏥 실무 2026년 5월 15일 · 2 분 읽기

IBM Consulting: Forward Deployed Units——6인 AI+인간 팀이 리야드 에어·네슬레·하이네켄에서 30인 팀 업무 수행

편집 일러스트: 워크스페이스에서 함께 일하는 6명의 팀원——인간과 AI 에이전트.

IBM Forward Deployed Units(FDUs)는 Mohamad Ali(IBM Consulting 수석 부사장)가 2026년 5월 14일 발표한 새로운 기업 컨설팅 모델입니다. 시니어 컨설턴트, 엔지니어, AI 에이전트로 구성된 6인 팀이 기존 30인 컨설팅 팀을 대체합니다. 일회성 프로젝트 방식 대신 지속적 참여를 도입합니다. 리야드 에어, 네슬레, 하이네켄, 피어슨에서 실제 배포됩니다.

🟢 🏥 실무 2026년 5월 15일 · 2 분 읽기

OpenAI: Sea Limited(Garena, Shopee)가 아시아 엔지니어링 팀을 통해 Codex를 배포합니다 — AI 네이티브 개발 사례 연구

편집 일러스트: 여러 모니터에 Codex CLI가 표시된 아시아 엔지니어링 팀의 모습.

OpenAI Sea Codex 사례 연구는 2026년 5월 14일에 발표된 엔터프라이즈 배포 기사로, Sea Limited(Garena와 Shopee 브랜드의 모회사) CPO가 아시아 엔지니어링 팀을 통한 OpenAI Codex 코딩 에이전트의 도입 전략을 설명합니다. Sea는 Codex를 AI 네이티브 소프트웨어 개발 도구로 위치시킵니다. 기존 관행을 가속화하는 개발 보조 도구가 아닌 워크플로의 근본적인 변화로 접근합니다.

🟡 🏥 실무 2026년 5월 14일 · 2 분 읽기

Perplexity: finance_search Agent API 도구, 단일 호출로 OHLCV·재무상태표·실적 트랜스크립트·애널리스트 추정치 반환

에디토리얼 일러스트: OHLCV 차트와 AI 에이전트 화살표가 있는 금융 데이터 대시보드.

Perplexity finance_search는 2026년 5월에 출시된 신규 Agent API 도구로, 상장 기업의 구조화된 금융 데이터를 반환합니다. 준실시간 가격, OHLCV 범위, 프리마켓·애프터아워스 데이터, 손익계산서, 재무상태표, 현금흐름, 실적 발표 트랜스크립트, SEC 공시, 애널리스트 추정치, ETF 구성 종목이 포함됩니다. 모델이 프롬프트를 기반으로 어떤 필드를 가져올지 자동으로 결정합니다.

🟢 🏥 실무 2026년 5월 14일 · 2 분 읽기

AWS: Pulse AI + Bedrock 파이프라인이 금융 문서를 위해 Nova Micro를 파인튜닝합니다——3시간에 1,000개 문서 처리

편집 일러스트: 자동화된 추출 파이프라인과 구조화된 데이터가 있는 금융 문서.

AWS Pulse AI + Amazon Bedrock 금융 문서 처리는 2026년 5월 13일 AWS가 발표한 새로운 엔터프라이즈 파이프라인 블루프린트입니다. 복잡한 금융 문서(SEC 제출 서류, 대차대조표, 감사 자료)에서의 Pulse AI 추출과 Amazon Nova Micro 모델 파인튜닝을 결합합니다. 이전에 여러 날의 처리가 필요했던 1,000개 문서 배치가 3시간 이내에 처리되었으며, 파인튜닝된 모델은 50% 기준선 대비 100% 수표 데이터 추출을 달성했습니다.

🟢 🏥 실무 2026년 5월 14일 · 2 분 읽기

CNCF：KubeStellar AI 에이전트, 91% 테스트 커버리지·63개 CI/CD 워크플로우로 81% PR 승인율 달성

에디토리얼 일러스트: AI 에이전트 아이콘과 CI/CD 파이프라인 화살표가 있는 Kubernetes 클러스터.

KubeStellar AI Agents는 KubeStellar Console의 수석 메인테이너 Andy Anderson이 2026년 5월 14일에 공개한 CNCF 블로그 게시물의 새로운 케이스 스터디입니다. 두 개의 병렬 AI 코딩 에이전트를 사용한 멀티클러스터 Kubernetes 대시보드가 82일 동안 81%의 PR 승인율을 달성했습니다. 인프라: 63개 CI/CD 워크플로우, 32개 나이틀리 테스트 스위트, 12개 샤드 상에서 91% 커버리지, 버그에서 머지까지 약 30분. Anderson은 AI 코드베이스 성숙도의 5단계를 정의합니다.

🟢 🏥 실무 2026년 5월 14일 · 2 분 읽기

GitHub: Copilot Cloud Agent REST API가 대규모 리팩토링, 리포지토리 설정, 주간 릴리스 준비에 개방됩니다

편집 일러스트: 자율 에이전트 아이콘과 REST API 엔드포인트가 있는 GitHub Actions 워크플로.

GitHub Copilot Cloud Agent REST API는 2026년 5월 13일 공개 미리보기로 발표된 새로운 개발자 엔드포인트로, 자율적인 Copilot 작업의 프로그래밍 방식 실행을 가능하게 합니다. 세 가지 주요 사용 사례: 많은 리포지토리에 걸친 코드 리팩토링/마이그레이션 팬아웃, 개발자 포털에서의 원클릭 리포지토리 초기화, 릴리스 노트가 포함된 자동 주간 릴리스 준비입니다. Copilot Business와 Enterprise 구독자가 이용 가능합니다.

🟡 🏥 실무 2026년 5월 13일 · 2 분 읽기

GitHub: Copilot Pro $10·Pro+ $39·신규 Max $100 플랜과 플렉스 크레딧 모델 도입

에디토리얼 일러스트: 개발자 인터페이스에서 기본 크레딧과 플렉스 크레딧 아이콘이 있는 구독 구조.

GitHub Copilot Flex Allotments와 Max 플랜은 2026년 5월 12일에 발표되어 2026년 6월 1일부터 적용되는 GitHub Copilot의 새로운 가격 구조입니다. Pro 티어는 월 $10에 $15 사용 크레딧, Pro+는 $39에 $70 크레딧, 신규 Max 플랜은 $100에 $200 크레딧을 제공합니다. 코드 완성과 다음 편집 제안은 모든 유료 플랜에서 무제한으로 유지됩니다.

🟡 🏥 실무 2026년 5월 13일 · 2 분 읽기

Perplexity: 4월 변경 로그로 Agent API에 Claude Opus 4.7, GPT-5.5, Grok 4.20 Reasoning 추가

편집 일러스트: 개발자 패널에서 API 엔드포인트, 모델 아이콘, 보안 키를 보여주는 개념도.

Perplexity 2026년 4월 변경 로그는 Agent API 플랫폼에 Claude Opus 4.7, GPT-5.5, Grok 4.20 Reasoning 모델을 추가하고, 네이티브 n8n 통합, AWS Marketplace SaaS 등록, 일회성 API 키 공개 보안 모델, OpenAI 호환 형식의 새 /v1/models 엔드포인트를 제공하는 업데이트 패키지입니다.

🟡 🏥 실무 2026년 5월 12일 · 2 분 읽기

Anthropic: Claude Code v2.1.139 — Agent View로 모든 세션 통합 표시 + /goal 명령으로 자율 작업 완료

Editorial illustration: Claude Code v2.1.139 — Agent View로 모든 세션 통합 표시 + /goal 명령으로 자율 작업 완료

Claude Code v2.1.139은 Anthropic CLI 에이전트의 새 버전으로, 리서치 프리뷰 단계에서 Agent View(활성, 차단, 완료된 모든 세션의 통합 목록)를 도입하고, Claude가 지정된 조건을 만족할 때까지 여러 단계에 걸쳐 자율적으로 작업하는 /goal 명령과 경과 시간, 단계 수, 토큰 소비량을 표시하는 패널을 추가했습니다.

🟡 🏥 실무 2026년 5월 12일 · 3 분 읽기

IBM: Red Hat AI Inference와 OpenShift Virtualization Service가 IBM Cloud에서 관리형 제품으로 출시

편집용 일러스트: 빨간색과 파란색 빛이 나는 엔터프라이즈 클라우드 인프라, 추론 워크로드를 실행하는 추상적인 서버, 하이브리드 VM 및 컨테이너 오케스트레이션.

IBM은 오늘 Red Hat AI Inference Service와 Red Hat OpenShift Virtualization Service를 IBM Cloud의 관리형 엔터프라이즈 제품으로 발표했습니다. 전자는 오픈소스 LLM(Granite, Llama, Mistral)을 위한 최적화된 서빙 환경을 자동 스케일링 및 SLA 보장과 함께 제공하며, 후자는 동일한 OpenShift 컨트롤 플레인 내에서 VM과 컨테이너를 함께 실행할 수 있게 합니다. 목표: 자체 Kubernetes 인프라 없이 오픈소스 AI를 사용하려는 기업 팀의 운영 부담을 줄이는 것입니다.

🟡 🏥 실무 2026년 5월 12일 · 3 분 읽기

OpenAI: DeployCo——2026년 1분기 실적 발표와 함께 공개된 새로운 독립 엔터프라이즈 AI 배포 조직

편집용 일러스트: 추상적인 AI 인프라 파이프라인과의 엔터프라이즈 컨설팅 악수, 배포 라이프사이클 시각화.

OpenAI는 화요일에 DeployCo(The Deployment Company)를 시작했습니다. 이는 기업들이 프로덕션에서 AI 애플리케이션을 구축하고 확장하는 것을 돕는 독립 조직입니다. 목표: 기반 모델 R&D와 지금까지 같은 OpenAI 팀에 있었던 엔터프라이즈 배포 컨설팅을 분리하여 운영 긴장을 해소하는 것입니다. DeployCo는 관리형 배포, 커스텀 평가, 출시 후 모니터링, 산업별 파인튜닝을 제공합니다.

🟡 🏥 실무 2026년 5월 11일 · 2 분 읽기

OpenAI: 기업이 조직 내 AI 구현을 확장하는 방법 가이드——실험에서 지속적인 비즈니스 영향으로

Editorial illustration: OpenAI 기업 가이드——실험에서 지속적인 비즈니스 영향으로의 AI 확장

OpenAI가 기업용 가이드 『How enterprises are scaling AI』를 발표하여 예비 실험에서 지속적인 비즈니스 영향까지의 경로를 설명했습니다. 가이드는 네 가지 핵심 기둥에 집중합니다: 조직 신뢰, 거버넌스 프레임워크, 워크플로 설계, 성장에 따른 품질 유지.

🟢 🏥 실무 2026년 5월 11일 · 1 분 읽기

Google: AI 기반 Finance가 유럽으로 확장——주식 요약, 포트폴리오 분석, AI 어시스턴트

Google Finance AI 기반 플랫폼이 이번 주 완전한 현지 언어 지원과 함께 유럽 시장으로 확장됩니다. 주식 및 시장 트렌드 AI 연구, 고급 시각화, 실시간 암호화폐 및 원자재 커버리지, 기업 실적 발표 전화의 실시간 녹취, 복잡한 금융 질문을 위해 전 세계적으로 사용 가능한 Deep Search가 새롭게 제공됩니다.

🟡 🏥 실무 2026년 5월 9일 · 2 분 읽기

Anthropic: Claude Code v2.1.136, 54개 수정 사항과 MCP OAuth 수정 및 hard-deny 규칙 도입

편집 일러스트: MCP OAuth 수정과 hard-deny 규칙이 표시된 Claude Code 터미널

Anthropic이 54개의 변경 사항을 포함한 Claude Code v2.1.136을 출시했습니다. 자동 모드에서 작업을 무조건 차단하는 새로운 settings.autoMode.hard_deny 규칙, 사용자를 매일 재로그인하게 만들던 MCP OAuth 경쟁 조건 수정, 그리고 확장 사고에서의 API 400 오류가 해결되었습니다.

🟢 🏥 실무 2026년 5월 9일 · 1 분 읽기

AWS: Halliburton AI 지진 어시스턴트, 워크플로우 생성 시간 95% 이상 단축

편집 일러스트: Amazon Bedrock을 통해 자연어에서 생성된 지진 워크플로우

Halliburton이 AWS와 협력하여 Amazon Bedrock과 Claude 모델을 활용해 자연어를 지진 워크플로우로 변환하는 Seismic Engine용 AI 어시스턴트를 구축했습니다. 시스템은 84~97%의 성공률을 달성하고 생성 시간을 2~20분에서 5.9~16.6초로 단축하여 95% 이상을 가속화했습니다.

🟡 🏥 실무 2026년 5월 8일 · 2 분 읽기

GitHub: AI 풀 리퀘스트 검토를 위한 5가지 위험과 10분 프레임워크

편집 일러스트: AI 풀 리퀘스트 검토를 위한 5가지 위험과 10분 프레임워크

GitHub는 AI가 생성한 코드 검토를 위한 실용적인 가이드를 발표하고, 5가지 핵심 위험과 10분간의 구조화된 코드 리뷰 프레임워크를 정의했습니다. 플랫폼의 풀 리퀘스트 5개 중 1개 이상이 현재 에이전트를 포함하고 있습니다.

🟡 🏥 실무 2026년 5월 7일 · 2 분 읽기

Anthropic: Claude Code v2.1.132, 25개 이상의 수정 및 새로운 훅 환경 변수 제공

편집 일러스트: Claude Code v2.1.132, 25개 이상의 수정 및 새로운 훅 환경 변수 제공

Anthropic이 Claude Code v2.1.132를 출시했습니다. 25개 이상의 수정 사항과 두 가지 새로운 환경 변수인 훅 통합용 CLAUDE_CODE_SESSION_ID 및 네이티브 스크롤백용 CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN이 포함됩니다. MCP 서버로 인한 10GB 이상의 RSS 메모리 증가 심각한 버그도 수정되었습니다.

🟡 🏥 실무 2026년 5월 7일 · 1 분 읽기

Anthropic: Claude Code v2.1.133, worktree.baseRef와 레이스 컨디션 수정 제공

Editorial illustration: Claude Code v2.1.133, worktree.baseRef와 레이스 컨디션 수정 제공

Anthropic이 worktree.baseRef, sandbox.bwrapPath/socatPath, 훅의 환경 변수 CLAUDE_EFFORT를 탑재한 Claude Code v2.1.133을 출시했다. 병렬 세션의 레이스 컨디션과 Windows 드라이브 루트 경로 문제를 수정했다. 이번 주 v2.1.131, v2.1.132에 이은 세 번째 릴리스.

🟡 🏥 실무 2026년 5월 7일 · 2 분 읽기

GitHub: 에이전트 워크플로 최적화로 19%~62% 토큰 절감 달성

Editorial illustration: 에이전트 워크플로 최적화로 19%~62% 토큰 절감 달성

GitHub이 프로덕션 에이전트 워크플로를 계측하고 토큰 낭비의 세 가지 주요 원인을 파악했다. 불필요한 MCP 도구, 결정론적 데이터 조회, 잘못 구성된 Bash 규칙이다. 최적화를 통해 워크플로별 19%~62%의 토큰 절감을 달성했다.

🟢 🏥 실무 2026년 5월 7일 · 2 분 읽기

arXiv:2605.04012: SymptomAI가 Fitbit 앱에서 약 13,917명 환자 대상으로 감별 진단에서 독립 임상의를 능가

Editorial illustration: korisnik razgovara sa SymptomAI agentom u Fitbit aplikaciji dok pozadinski panel prikazuje rangiranu listu dijagnoza

SymptomAI는 Fitbit 앱에 통합된 대화형 AI 에이전트로 약 13,917명의 참가자에서 테스트되었습니다. 임상 평가 하위 집합에서 동일한 대화를 평가한 독립 임상의 대비 오즈비(OR) 2.47을 달성했습니다. 본 연구는 프리프린트입니다.

🟡 🏥 실무 2026년 5월 6일 · 2 분 읽기

IBM: Enterprise Advantage에 Context Studio 추가——Providence Health 채용 관리 시간 90% 단축

편집 일러스트: 조직 데이터로 AI 에이전트를 구축하는 IBM Enterprise Advantage Context Studio

IBM은 Context Studio 출시로 Enterprise Advantage 플랫폼을 확장했습니다. 이는 디지털 주권을 보호하면서 조직 고유 데이터 기반으로 AI 에이전트를 구축하는 도구입니다. Providence Health는 채용 관리 시간을 90% 단축했으며, IBM은 18개월 내 운영 비용 25% 이상 절감을 예상합니다.

🟢 🏥 실무 2026년 5월 6일 · 1 분 읽기

Anthropic: Claude Code v2.1.131 — Windows VS Code 활성화 및 Mantle x-api-key 핫픽스

편집 일러스트: Windows VS Code 및 Mantle 인증을 위한 Claude Code v2.1.131 핫픽스

Anthropic이 Claude Code v2.1.131 핫픽스 릴리스를 공개했습니다. 하드코딩된 빌드 경로로 인한 Windows에서의 VS Code 확장 활성화 실패와 Mantle 추론 엔드포인트에 대한 x-api-key 헤더 누락 두 가지 버그를 수정합니다. 모든 주요 플랫폼용 바이너리가 게시되었습니다.

🟡 🏥 실무 2026년 5월 5일 · 2 분 읽기

arXiv:2605.02740: ReClaim — 2억 건 환자 기록으로 학습한 파운데이션 모델, 1,000개 이상 의료 과제에서 평균 AUC 75.6% 달성

편집 일러스트: 코드·청진기·의료 차트를 표시하는 모니터가 있는 개발자 작업 공간

새 arXiv 프리프린트가 ReClaim을 소개합니다. 2억 건의 환자 기록에서 추출한 438억 건의 의료 이벤트로 학습된 17억 파라미터 파운데이션 모델로, 1,000개 이상의 진단 과제에서 평균 AUC 75.6%를 달성해 LightGBM(66.3%)과 Delphi 전문 모델(69.4%)을 크게 능가합니다. 행정 의료 데이터로 학습된 파운데이션 모델의 새로운 범주를 개척합니다.

🟡 🏥 실무 2026년 5월 5일 · 3 분 읽기

Anthropic Claude Code v2.1.128: 30건 이상 수정, .zip 플러그인 지원, 서브에이전트 캐시 생성 비용 약 3배 절감

컨셉 일러스트: 개발자 워크스페이스, 모니터 옆에 .zip 아카이브와 플러그인 설치 진행 표시줄

Claude Code v2.1.128(2026년 5월 4일 출시)은 30건 이상의 개선을 제공합니다. /mcp 패널에 도구 수 표시 및 도구 0개 서버 플래그 기능, --plugin-dir에서 .zip 플러그인 아카이브 지원, 로컬 미푸시 커밋 손실 EnterWorktree 버그 수정, 서브에이전트 cache_creation 비용 약 3배 절감, 10MB 초과 stdin 파이프 시 크래시 수정이 포함됩니다.

🟡 🏥 실무 2026년 5월 4일 · 2 분 읽기

IBM 연구: 조직의 76%가 최고AI책임자를 보유, CEO들은 2030년까지 AI가 운영 결정의 48%를 자율적으로 내릴 것으로 예상

Editorial illustration: IBM 연구: 조직의 76%가 최고AI책임자를 보유, CEO들은 2030년까지 AI가 운영 결정의 48%를 자율 결정할 것으로 예상

IBM 기업가치연구원이 33개국 2,000명의 CEO를 대상으로 한 연구 결과를 발표했다. 최고AI책임자(CAIO) 직위가 1년 만에 조직의 26%에서 76%로 확대되었으며, CEO들은 2030년까지 AI 시스템이 인간 개입 없이 운영 결정의 48%를 내릴 것으로 예상해 C-Suite 전체 구조가 재정의되고 있다.

🔴 🏥 실무 2026년 5월 1일 · 2 분 읽기

DeepMind AI 공동 임상의: 98개 일차 진료 쿼리 블라인드 평가에서 의사들이 도구보다 선호, 97/98 사례에서 심각한 오류 제로

편집 일러스트: 의료 장비가 있는 임상 장면에서 의사와 환자를 지원하는 AI 에이전트

Google DeepMind는 2026년 4월 30일 AI 공동 임상의 연구 이니셔티브를 발표했습니다 — 의사의 임상 감독 하에 AI 에이전트가 환자를 지원하는 삼자 케어 모델입니다. 98개의 현실적인 일차 진료 쿼리에 대한 블라인드 일대일 평가에서 의사들은 두 가지 주요 증거 합성 도구보다 공동 임상의의 답변을 일관되게 선호했으며, 시스템은 97/98 사례에서 심각한 오류를 기록하지 않았습니다.

🟡 🏥 실무 2026년 5월 1일 · 2 분 읽기

Amazon Nova 2 Lite, 강화 파인튜닝으로 4.33/5.0 달성 — 자동화 법률 계약 검토에서 Claude Sonnet 4.5 초과

편집 일러스트: AI 심판자가 연단에 서서 법률 계약서를 심사하고, 로봇 팔이 조항을 표시하는 장면

강화 파인튜닝(RFT)은 언어 모델이 심판자(LLM-as-Judge)로서 고비용 수동 레이블링 대신 피드백을 제공하는 학습 방법입니다. Amazon Nova 2 Lite는 이를 통해 자동화 법률 계약 검토에서 종합 점수 4.33/5.0과 완벽한 JSON 검증 점수 1.00을 달성하여 Claude Sonnet 4.5와 Claude Haiku 4.5를 앞질렀습니다.

🟢 🏥 실무 2026년 5월 1일 · 2 분 읽기

IBM Research와 Dallara: AI 서로게이트 모델 GIST, 레이싱카 공력 평가를 수 시간 CFD에서 10초로 단축

편집 일러스트: 레이싱카와 리어 디퓨저 주변의 빠른 유동 시뮬레이션을 보여주는 화살표

GIST(게이지 불변 스펙트럴 트랜스포머)는 IBM Research와 이탈리아 레이싱카 제조업체 Dallara가 공동 개발한 그래프 기반 신경 연산자 AI 서로게이트 모델입니다. LMP2 차량의 리어 디퓨저 공력 평가가 전통적인 CFD 시뮬레이션의 수 시간에서 약 10초로 단축되었으며, 연구는 ICLR 2026의 AI & PDE 워크숍에서 발표되었습니다.

🟡 🏥 실무 2026년 4월 30일 · 2 분 읽기

Anthropic Claude for Creative Work：Blender, Adobe Creative Cloud 50개 이상 도구, Autodesk Fusion, Ableton, SketchUp, Splice 연동

편집 일러스트: 3D 모델링, 오디오 프로덕션, 그래픽 디자인을 연결하는 AI 어시스턴트

Anthropic은 2026년 4월 28일 Blender, Autodesk Fusion, Adobe(50개 이상의 Creative Cloud 도구), Ableton, Splice, Affinity와 Canva, Resolume Arena, SketchUp과의 협업을 통한 전문 크리에이티브 소프트웨어용 Claude 커넥터를 발표했습니다. Claude는 Blender용 Python 스크립트 작성, VJ를 위한 Resolume 실시간 제어, Affinity에서 에셋 배치 처리 자동화, Splice 샘플 카탈로그 검색이 가능합니다. Anthropic은 Blender Development Fund에 패트론으로 참여했으며, RISD, Ringling College, Goldsmiths의 세 학술 기관이 학생들이 Claude와 협업하는 방법을 배우는 수업을 시작합니다.

🟡 🏥 실무 2026년 4월 30일 · 2 분 읽기

Google ERA：과학 연구용 AI 시스템이 입원 예측에서 CDC 최고 순위 달성, 미해결 우주론 문제 해결, 10분마다 CO2 관측

편집 일러스트：과학 도구와 AI 네트워크가 별자리 형태의 다분야 연결로 이어진 모습

Google Research는 2026년 4월 29일 ERA（경험적 연구 지원 시스템）를 발표했습니다. 이는 LLM을 계산 도구와 결합하여 과학 연구를 가속화하는 내부 AI 시스템입니다. 서로 다른 분야에 걸친 네 가지 구체적인 성과：COVID/독감/RSV 입원 예측 CDC 순위 1위, 우주 줄 중력 복사에 대한 여섯 개의 새로운 해, 10분마다 대기 CO2를 관측하는 신경망, 제브라피시의 해석 가능한 신경 회로.

🟡 🏥 실무 2026년 4월 30일 · 2 분 읽기

EvalEval Coalition：AI 평가가 새로운 컴퓨팅 병목 현상으로 — GAIA 단일 실행 $2,829, HAL 리더보드 $40,000, 학술 감사인들은 기술적 장벽 전에 예산 장벽에 직면

EvalEval Coalition（Avijit Ghosh, Yifan Mai, Georgia Channing, Leshem Choshen）은 2026년 4월 29일 HuggingFace 블로그에 AI 모델 평가 비용이 폭발적으로 증가했음을 보여주는 분석을 게재했습니다. 단일 GAIA 실행 $2,829, HAL 리더보드 $40,000（k=8 신뢰도 $320,000）, PaperBench는 에이전트당 약 $9,500. 정적 벤치마크는 100-200배 압축 가능하지만 에이전트 벤치마크는 2-3.5배에 불과합니다 — 독립 감사인에 대한 책임 장벽이 됩니다.

🟡 🏥 실무 2026년 4월 29일 · 2 분 읽기

Anthropic Claude for Creative Work: 60개 이상 크리에이티브 도구 커넥터, 신제품 Claude Design, RISD·Ringling·Goldsmiths 학술 파트너십

에디토리얼 일러스트: Claude 커넥터가 디자인부터 비디오·3D 제작까지 크리에이티브 도구 스택으로 분기하는 모습

Anthropic은 Claude for Creative Work를 발표했습니다. Claude를 Adobe Photoshop·Premiere·50개 이상의 Creative Cloud 도구·Blender·Autodesk Fusion·Ableton Live & Push·Resolume 시리즈·SketchUp·Splice·Affinity by Canva에 연결하는 커넥터 패키지입니다. Anthropic Labs에서는 Canva 내보내기를 지원하는 소프트웨어 인터페이스 아이디어 시각화 신제품 Claude Design도 함께 출시했습니다. 아울러 RISD·Ringling College·Goldsmiths University of London과의 학술 파트너십을 통해 Claude가 크리에이티브 컴퓨테이션 커리큘럼에 도입됩니다.

🟡 🏥 실무 2026년 4월 29일 · 2 분 읽기

IBM, Bob 출시: 전체 SDLC를 아우르는 AI 개발 파트너, 내부 사용자 8만 명 이상, 평균 생산성 45% 향상

편집 일러스트: 중앙에 어시스턴트 엠블럼이 있는 소프트웨어 개발 라이프사이클 기어

IBM은 2026년 4월 28일 소프트웨어 개발 라이프사이클 전반——계획·설계·코딩·테스트·배포·운영·현대화——을 커버하는 AI 파트너 'Bob'을 공식 출시했습니다. Bob은 Anthropic Claude, Mistral, IBM Granite 모델을 조율하며, 이미 8만 명 이상의 IBM 직원이 내부적으로 사용하고 있어 평균 45%의 생산성 향상을 달성했습니다. bob.ibm.com에서 30일 무료 체험이 가능합니다.

🟡 🏥 실무 2026년 4월 29일 · 1 분 읽기

OpenAI, AWS 상륙: GPT 모델·Codex·Managed Agents, 엔터프라이즈 사용자의 AWS 환경 내에서 이용 가능

에디토리얼 일러스트: OpenAI 로고 심볼이 AWS 클라우드 아이콘과 결합하여 엔터프라이즈 배포 확장을 나타냄

OpenAI는 2026년 4월 28일, GPT 모델·Codex·Managed Agents가 AWS에서 이용 가능해졌다고 발표했습니다. 엔터프라이즈 사용자는 자체 AWS 환경 내에서 안전한 AI 시스템을 구축할 수 있습니다. 이 발표는 OpenAI × Microsoft 개정 파트너십과 같은 날 이루어졌으며, Microsoft Azure 에코시스템 외부에서의 첫 번째 OpenAI 배포입니다.

전체 아카이브 보기 →