QIMMA:新しいリーダーボードがアラビア語LLM評価で量より質を重視
QIMMはUAEのTIIが発表した新しいアラビア語LLMリーダーボードで、モデルを評価する前に7分野の5万2000以上のサンプルを厳格な二段階品質検証にかけます。
10 件
QIMMはUAEのTIIが発表した新しいアラビア語LLMリーダーボードで、モデルを評価する前に7分野の5万2000以上のサンプルを厳格な二段階品質検証にかけます。
Apple MLは2026年4月23日から27日にリオデジャネイロで開催されるICLR 2026カンファレンスで発表する研究の概要を公開しました。同社はカンファレンスをスポンサーし、ブース204ではMLXフレームワークを通じたApple SiliconでのローカルLLM推論と、iPad ProでのSHARP 3Dモデルをデモします。40以上のポスターとoral発表「To Infinity and Beyond——Tool-Use Unlocks Length Generalization」が予定されています。
IBMとイリノイ大学アーバナシャンペーン校は、IBMの量子コンピューターとNCSAスーパーコンピューターを統合するDiscovery Accelerator Instituteをさらに5年延長します。共同の焦点は、アルゴリズムとチップ設計のためのAIネイティブパラダイム、次世代分散推論、量子とAI領域の教育です。これまでに20の活動プロジェクトが立ち上げられ、230以上の科学論文が発表されています。
AAAI-26は会議規模での初のAI支援レビュー実験を実施しました——22,977本の投稿論文すべてが、人間による査読に加えて明確にラベル付けされたAI生成レビューを受け取りました。プログラム委員会メンバーは、技術的正確さと研究上の提案においてAIレビューを人間のレビューよりも高く評価しました。
GoogleがMITとワシントンで第1回AI for the Economy Forumを共催しました。発表内容:世界で1億人がデジタルスキルトレーニングを修了、1億2,000万ドルの新しいAI教育基金、医療・見習い・製造業向けの3つの新プログラム。
VictoriaMetrics の Diana Todea さんは、アムステルダムの KubeCon EU から、チームの多様な視点がプラットフォームエンジニアリング(抽象化設計からチーム保持まで)にどのように影響するかについて書いています。
ノースカロライナ科学数学学校の Avery Yang さんは、アムステルダムで開催された 2026 年 KubeCon EU の最年少講演者の一人です。彼女は Kubernetes クラスタと vLLM を使った推論によるハリケーン予測のポスターを発表しました。
Apple Machine Learning Researchは、4月13日から17日までバルセロナで開催されるACM CHI 2026カンファレンスへの参加を発表しました。Appleはヒューマンコンピュータインタラクション分野の新しい研究を発表します。
Microsoft Researchの第5回年次Future of Work調査によると、AIは職場でのコラボレーションを根本的に変えていますが、恩恵は不均等です。AIへの露出度が高い職種における若年層(22〜25歳)の雇用は16%減少し、40%の米国従業員は'workslop'——洗練されているが不正確なAI生成コンテンツ——を受け取っています。
Google ResearchはConvApparelを発表しました — 衣料品購入のコンテキストで4,000以上のマルチターン会話を含む新しいデータセットで、LLMベースのユーザーシミュレーターがどれほど現実的かを測定するために設計されています。調査によると、SFTおよびICLアプローチは単純なプロンプティングを大きく上回り、「顕著な分布外汎化」を示しています。