QIMMA: 새로운 리더보드, 아랍어 LLM 평가에서 수량보다 품질 우선
QIMMA는 UAE의 TII가 발표한 새로운 아랍어 LLM 리더보드로, 모델 평가 전에 7개 도메인의 5만 2000개 이상의 샘플에 대해 엄격한 2단계 품질 검증을 적용합니다.
10 개 뉴스
QIMMA는 UAE의 TII가 발표한 새로운 아랍어 LLM 리더보드로, 모델 평가 전에 7개 도메인의 5만 2000개 이상의 샘플에 대해 엄격한 2단계 품질 검증을 적용합니다.
Apple ML은 2026년 4월 23일부터 27일까지 리우데자네이루에서 열리는 ICLR 2026 컨퍼런스에서 발표하는 연구 개요를 공개했습니다. 회사는 컨퍼런스를 스폰서하며 부스 204에서 MLX 프레임워크를 통한 Apple Silicon에서의 로컬 LLM 추론과 iPad Pro에서의 SHARP 3D 모델을 시연합니다. 40개 이상의 포스터와 구두 발표 'To Infinity and Beyond——Tool-Use Unlocks Length Generalization'이 예정되어 있습니다.
IBM과 일리노이 대학교 어배너-섐페인은 IBM 양자 컴퓨터와 NCSA 슈퍼컴퓨터를 통합하는 Discovery Accelerator Institute를 5년 더 확장합니다. 공동 초점은 알고리즘 및 칩 설계를 위한 AI 네이티브 패러다임, 차세대 분산 추론, 양자 및 AI 분야의 교육입니다. 지금까지 20개의 활성 프로젝트가 시작되었고 230편 이상의 과학 논문이 발표되었습니다.
AAAI-26은 학회 규모 최초의 AI 보조 리뷰 실험을 진행했습니다. 22,977편의 투고 논문 모두 인간 심사와 함께 명확하게 표시된 AI 생성 리뷰를 받았습니다. 프로그램 위원회 위원들은 기술적 정확성과 연구 제안 측면에서 AI 리뷰를 인간 리뷰보다 높게 평가했습니다.
Google이 MIT와 함께 워싱턴에서 첫 번째 AI for the Economy Forum을 공동 개최했습니다. 발표 내용: 전 세계 1억 명 디지털 기술 교육 수료, 1억 2천만 달러 규모의 AI 교육 신규 펀드, 의료·도제·제조업 분야의 3개 신규 프로그램.
VictoriaMetrics의 Diana Todea는 암스테르담 KubeCon EU에서 팀 관점의 다양성이 플랫폼 엔지니어링(추상화 설계부터 팀 유지까지)에 어떻게 영향을 미치는지에 대해 씁니다.
노스캐롤라이나 과학수학학교의 Avery Yang은 암스테르담에서 열린 2026년 KubeCon EU에서 가장 어린 연사 중 한 명입니다. 그녀는 Kubernetes 클러스터와 vLLM 추론을 사용한 허리케인 예측 포스터를 발표했습니다.
Apple Machine Learning Research는 4월 13일부터 17일까지 바르셀로나에서 개최되는 ACM CHI 2026 컨퍼런스에 참가한다고 발표했습니다. Apple은 인간-컴퓨터 상호작용 분야의 새로운 연구를 발표할 예정입니다.
Microsoft Research의 다섯 번째 연간 Future of Work 연구에 따르면 AI가 직장 내 협업을 근본적으로 바꾸고 있지만 혜택은 불균등합니다. AI 노출이 높은 직종에서 청년층(22~25세) 고용은 16% 감소했고, 미국 직장인의 40%는 세련되어 보이지만 부정확한 AI 생성 콘텐츠인 'workslop'을 받고 있습니다.
Google Research가 ConvApparel을 공개했습니다. 이는 의류 쇼핑 상황에서 4,000건 이상의 멀티턴 대화를 포함하는 새로운 데이터셋으로, LLM 기반 사용자 시뮬레이터가 얼마나 현실적인지 측정하도록 설계되었습니다. 연구에 따르면 SFT 및 ICL 접근 방식은 단순 프롬프팅을 크게 앞섰으며 '주목할 만한 분포 외 일반화'를 보였습니다.