🏥 实践应用

45 条新闻

🟡 🏥 实践应用 2026年4月27日 · 2 分钟阅读

GitHub更改App安装令牌格式:从40字符增至约520字符,CI/CD管道存在故障风险

GitHub更改App安装令牌格式:从40字符增至约520字符,CI/CD管道存在故障风险

GitHub从2026年4月27日开始推出新的App安装令牌格式。旧的40字符格式将被替换为前缀为ghs_APPID_JWT、长度约520字符的JWT格式。第一阶段(4月27日至5月中旬)覆盖GitHub Actions和精选集成,第二阶段(5月中旬至6月底)覆盖所有App令牌。开发者必须将数据库字段扩展至520+字符并移除正则表达式/长度检查。

🟡 🏥 实践应用 2026年4月27日 · 2 分钟阅读

GitHub Copilot获得GPT-5.5 GA:在所有主要IDE上可用,7.5倍高级积分倍数

GitHub Copilot获得GPT-5.5 GA:在所有主要IDE上可用,7.5倍高级积分倍数

GitHub Copilot于2026年4月24日宣布GPT-5.5模型正式发布(GA),面向Pro+、Business和Enterprise用户。该模型在VS Code、Visual Studio、JetBrains、Xcode、Eclipse、GitHub Mobile和Copilot CLI上均可使用。定价:7.5倍高级请求积分倍数(推广价格)。Enterprise和Business管理员必须手动启用GPT-5.5策略。

🟢 🏥 实践应用 2026年4月27日 · 2 分钟阅读

arXiv:2604.21361:Open Compute Project映射分布式AI推理系统中的时间/因果故障——5毫秒时钟偏差破坏可观测性

ArXiv 2604.21361:Open Compute Project映射分布式AI推理系统中的时间/因果故障——5毫秒时钟偏差破坏可观测性

来自Open Compute Project统一智能基础设施工作流的Ankur Sharma、Deepa Shah、David Lariviere和Hesham ElBakoury团队于2026年4月23日发表了一项关于分布式AI推理系统中时间、因果性和可观测性故障的实验研究。节点间仅5毫秒的时钟偏差就会破坏因果可观测性,而输出仍然正确——这对大型LLM服务部署的调试是严重问题。

🟡 🏥 实践应用 2026年4月25日 · 2 分钟阅读

GitHub Copilot为JetBrains IDE推出内联Agent模式公开预览——智能体功能直接集成至内联聊天

编辑插图:GitHub Copilot内联Agent模式——JetBrains IDE集成

GitHub于2026年4月24日宣布GitHub Copilot在JetBrains IDE中的内联Agent模式公开预览,包括改进的Next Edit Suggestions(支持远端编辑)、全局自动批准、更灵活的终端命令控制,以及Business和Enterprise计划的管理员激活功能。

🟢 🏥 实践应用 2026年4月25日 · 2 分钟阅读

Anthropic推出Rate Limits API:管理员现可通过编程方式获取组织和工作区的速率限制配置

Editorial illustration: Anthropic Rate Limits API — 组织速率限制的编程访问

Anthropic于2026年4月24日发布了Rate Limits API,这是Admin API的组成部分,允许管理员通过编程方式读取为组织和各工作区配置的速率限制。端点按模型组、批处理、文件、技能和网页搜索工具返回限制信息,需使用专用的Admin API密钥。

🟡 🏥 实践应用 2026年4月24日 · 2 分钟阅读

Anthropic与NEC共建日本最大AI工程师队伍——Claude服务NEC 3万名员工

编辑插图:Anthropic-NEC合作伙伴关系——日本AI工程师队伍

Anthropic与日本NEC于2026年4月24日签署合作协议,Claude将面向约3万名NEC员工开放。NEC成为Anthropic首个日本全球合作伙伴,并将建立AI工程卓越中心,覆盖金融、制造、网络安全和地方政务领域。

🟡 🏥 实践应用 2026年4月24日 · 2 分钟阅读

AWS:多模态生物学基础模型将药物发现成本降低50%,诊断效率提升90%

编辑插图:AI实践应用 — praksa

AWS发布了多模态生物学基础模型在药物开发和患者护理中应用的综合综述。通过结合基因组学、医学影像和临床数据,AUC精度提升4-7%,图像分析节省高达90%的时间,药物开发成本降低高达50%。

🟢 🏥 实践应用 2026年4月24日 · 2 分钟阅读

CNCF:基础设施工程师借助AI智能体在30分钟内迁移60余个Kubernetes资源

编辑插图:AI实践应用 — praksa

CNCF博客发布了一个案例研究,展示AI智能体如何将60余个Kubernetes资源从Ingress NGINX迁移至Higress,包含验证在内仅用30分钟。Higress是基于Envoy和Istio的AI原生网关,具备针对LLM流量的令牌速率限制和缓存功能。

🟢 🏥 实践应用 2026年4月24日 · 2 分钟阅读

GitHub Copilot Chat:新增拉取请求理解和自动化代码审查功能

编辑插图:AI实践应用 — praksa

GitHub在Copilot Chat中增加了三项拉取请求功能:通过评论和审查理解PR、结构化审查以及变更摘要。这些功能可在github.com/copilot访问,也可直接在差异视图中点击Copilot按钮使用。

🟡 🏥 实践应用 2026年4月23日 · 2 分钟阅读

AWS与NVIDIA Parakeet-TDT以每分钟0.00005美元的价格实现25种语言转录

编辑插图:AI实践——praksa

AWS机器学习博客介绍了如何在云端使用NVIDIA开源模型Parakeet-TDT-0.6B-v3进行低成本多语言音频转录。该模型支持25种欧洲语言并自动检测语言,结合AWS Batch,在Spot实例上处理一分钟音频的费用仅为0.00005美元,在按需g6.xlarge GPU实例上为0.00011美元,支持缩减至零策略,并可通过缓冲流式传输处理超过十小时的音频录音。

🟡 🏥 实践应用 2026年4月23日 · 2 分钟阅读

AWS SageMaker自动为生成式AI模型进行基准测试并提供最优推理配置

编辑插图:AI实践——praksa

Amazon SageMaker AI现在通过NVIDIA AIPerf工具自动对生成式AI模型进行跨GPU配置的基准测试,消除了数周的手动测试,并提供按成本、延迟或吞吐量排序的推荐配置。

🟡 🏥 实践应用 2026年4月23日 · 2 分钟阅读

GitHub Copilot在VS Code中支持BYOK:用户现可连接Anthropic、Gemini和OpenAI自有密钥

编辑插图:AI实践 — praksa

GitHub已允许Copilot Business和Enterprise用户在VS Code中带入主要AI提供商(包括Anthropic、Google、OpenAI、OpenRouter和Azure)的自有API密钥。BYOK模型在Copilot Chat和自定义智能体中工作,费用直接向所选提供商收取,不消耗Copilot配额。

🟡 🏥 实践应用 2026年4月23日 · 2 分钟阅读

GitHub Copilot for Jira引入自定义智能体、自定义分支规则和代码审查通知

编辑插图:AI实践——praksa

GitHub在最新的Atlassian Jira Copilot云智能体升级中推出了一系列功能,大幅深化了AI与项目管理的集成。使用Jira作为任务跟踪系统的团队现在可以定义自定义智能体、在规则中使用Atlassian自定义字段、按工作区设置自定义分支规则,并直接在Jira中接收代码审查请求通知,从而将GitHub和项目管理工具之间的开发流程连接起来。

🟢 🏥 实践应用 2026年4月23日 · 2 分钟阅读

OpenAI为美国认证临床医生提供免费ChatGPT访问

编辑插图:AI实践 — praksa

OpenAI已为美国认证的医生、护士和药剂师开放了免费ChatGPT访问权限。该计划重点关注临床文档、患者护理工作流程和医学研究,通过与美国医疗实体的合作关系进行验证。

🟡 🏥 实践应用 2026年4月22日 · 2 分钟阅读

Claude Cowork进入Amazon Bedrock——面向整个组织的AI

编辑插图:AWS Bedrock企业团队环境中桌面上的Claude Cowork应用程序

AWS和Anthropic允许在AWS账户内通过Amazon Bedrock运行Claude Cowork桌面应用程序。数据留在用户控制下,模型不会在其上训练,与IAM和CloudTrail的集成提供企业级审计。费用通过现有AWS合同支付。

🟢 🏥 实践应用 2026年4月22日 · 1 分钟阅读

HolmesGPT与CNCF工具以0.04美元自动诊断Kubernetes警报

编辑插图:带有警报和机械臂进行自动诊断的Kubernetes仪表板

STCLab SRE团队使用带有ReAct模式和CNCF工具的HolmesGPT自动诊断Kubernetes警报。每次调查费用为0.04美元,约40%的警报可自主解决,最重要的经验:质量好的runbook比模型选择更重要。

🟢 🏥 实践应用 2026年4月22日 · 2 分钟阅读

设备端精神科AI:Gemma、Phi和Qwen在不向云端发送数据的情况下运行

编辑插图:带有精神科AI应用程序和本地神经网络的移动设备

由Eranga Bandara带领的研究人员发布了一款移动应用程序,该程序在本地协调Gemma、Phi-3.5-mini和Qwen2进行符合DSM-5的精神科评估。系统不向云端发送数据,针对军队、司法系统和偏远医疗等敏感场景。

🟡 🏥 实践应用 2026年4月21日 · 2 分钟阅读

GitHub暂停Copilot Pro注册,代理AI压力增大——Opus 4.7专属Pro+计划

Editorialna ilustracija: GitHub pauzira Copilot Pro sign-upove zbog pritiska agentic AI-ja — Opus 4.7 ekskluzivno za Pro

GitHub宣布暂时停止Copilot Pro、Pro+和学生计划的新用户注册,原因是代理工作流产生的基础设施压力。Opus模型已从Pro计划中完全移除,仅在Pro+级别提供。现有用户将面临更严格的使用限制和实时消耗计量表。

🟡 🏥 实践应用 2026年4月21日 · 2 分钟阅读

IBM与Adobe发布面向航空公司和医疗健康行业的智能体客户体验编排解决方案

插图:IBM与Adobe发布面向航空公司和医疗健康行业的智能体客户体验编排解决方案

IBM与Adobe发布了行业解决方案,将智能体AI系统与Adobe Experience Cloud结合,面向航空公司和医疗健康行业,解决因碎片化客户体验导致的平均年损失2900万美元问题。

🟡 🏥 实践应用 2026年4月21日 · 3 分钟阅读

微软、ANZ、汇丰和劳埃德银行在Sibos 2025发布贸易融资AI代理——自动化处理MT700信用证

Editorialna ilustracija: Microsoft, ANZ, HSBC i Lloyds predstavili AI agent za trade finance — automatizirana obrada MT7

微软与ANZ、汇丰和劳埃德银行合作发布了贸易融资AI代理概念验证。该代理解析MT700信用证,检测发票与条款之间的差异,并为财务用户提供对话式界面。该解决方案在法兰克福Sibos 2025会议上进行了展示。

🟡 🏥 实践应用 2026年4月20日 · 2 分钟阅读

AgentV-RL引入工具增强验证器与前向和后向智能体——4B模型超越SOTA奖励模型25.2%

编辑插图:两个AI验证智能体——一个向前看,一个向后看——分析推理链

AgentV-RL是一个通过使用多轮工具增强审议的智能体验证器来扩展奖励建模的新框架。两个互补智能体——前向(从前提到结论)和后向(从结论到前提)——验证推理过程。通过主动探索的RL训练,4B参数变体在测试时超越最先进的结果奖励模型25.2%。

🟡 🏥 实践应用 2026年4月19日 · 2 分钟阅读

Claude Code 架构分析:对 TypeScript 源码的逆向工程揭示了 AI 智能体工具的 5 项核心价值与 13 项设计原则

编辑插图:AI 智能体系统的架构蓝图,包含模块化组件与数据流

新 arXiv 论文通过逆向工程 TypeScript 源码分析了 Claude Code 架构,并与开源智能体 OpenClaw 进行对比。论文识别出 5 项核心价值(人类权威、安全性、执行力、能力、适应性)和 13 项设计原则。系统的核心出人意料地简单:一个调用模型、执行工具并等待用户输入的 while 循环。

🟢 🏥 实践应用 2026年4月19日 · 2 分钟阅读

RACER:无需训练的方法,结合检索与logits草稿策略将LLM推理速度翻倍

编辑插图:并行token流通过验证通道加速流动

RACER是一种无需训练即可加速大型语言模型的方法,结合基于检索和基于logits的草稿策略进行推测解码。相比自回归解码实现超过2倍加速,超越了所有此前的无训练方法,并被ACL 2026 Findings录用。已在Spec-Bench、HumanEval和MGSM-ZH基准上进行测试。

🔴 🏥 实践应用 2026年4月18日 · 2 分钟阅读

Anthropic Claude Design:由Claude Opus 4.7驱动的可视化协作工具,用于设计、演示文稿和原型

Claude Design是Anthropic Labs推出的新产品,将Claude Opus 4.7转化为一个协作式可视化创作工具,可用于创建设计稿、原型、演示文稿和单页文档。该系统自动读取代码库和设计文件中的设计规范,支持内联评论和滑块调整,并可直接将成果移交给Claude Code进行实现。自2026年4月17日起,该产品以研究预览版形式向Pro、Max、Team和Enterprise订阅用户开放。

🟡 🏥 实践应用 2026年4月18日 · 2 分钟阅读

Anthropic:基础设施噪声使智能体基准测试结果偏差高达6个百分点

Anthropic的研究人员证明,RAM配置和CPU余量可使智能体编码基准测试结果相差6个百分点——这比排行榜顶级模型之间的差距还要大。他们测试了Terminal-Bench 2.0和SWE-bench。建议:在评估配置未记录和对齐之前,3个百分点以下的优势值得质疑。

🟡 🏥 实践应用 2026年4月18日 · 2 分钟阅读

GitHub Copilot CLI 推出自动模型选择:付费用户享受 10% 倍率折扣

编辑插图:终端中箭头分叉指向自动路由中不同 AI 模型

GitHub 于 2026 年 4 月 17 日宣布,Copilot CLI 工具的 AI 自动模型选择功能已面向所有 Copilot 计划正式发布(GA)。该系统根据管理员策略,将请求动态路由到 GPT-5.4、GPT-5.3-Codex、Sonnet 4.6 和 Haiku 4.5 等模型。付费用户在使用 Auto 模式时,可享受模型倍率 10% 的折扣——原本 1x 倍率的模型仅消耗 0.9 个 Premium 请求。

🟡 🏥 实践应用 2026年4月18日 · 3 分钟阅读

PyTorch与Meta:通过40多项优化实现超过90%的有效训练时间,MegaCache将PT2编译时间缩短40%

Meta发布了如何在2025年底为其推荐模型的离线训练实现超过90%的有效训练时间(ETT)。方法包括PyTorch生态系统中超过40项新优化、将PT2编译时间缩短40%的MegaCache、每个任务节省30分钟的独立模型发布,以及异步检查点。这些改进已通过PyTorch和TorchRec开源。

🟢 🏥 实践应用 2026年4月18日 · 2 分钟阅读

AWS为Amazon Bedrock引入按IAM主体进行细粒度成本归因

Amazon Bedrock现在按IAM主体——调用API的特定用户、角色或联合身份——跟踪推理成本。该功能无需额外付费即可与AWS Cost and Usage Reports(CUR 2.0)和Cost Explorer集成。支持四种访问场景:直接IAM用户、应用程序角色、联合身份验证和LLM网关代理模式。在所有商业AWS区域可用。

🟡 🏥 实践应用 2026年4月17日 · 2 分钟阅读

Amazon Bedrock:形式化数学验证取代AI输出的概率性校验

Amazon Bedrock推出自动推理检查,使用SAT/SMT形式化验证代替概率性校验来审核AI输出。Amazon Logistics将审查周期从8小时缩短至几分钟,Lucid Motors将预测生成从数周缩短至不到一分钟,教育公司FETG实现80%的工作量减少和延迟从13秒降至1.5秒。

🟡 🏥 实践应用 2026年4月17日 · 2 分钟阅读

AWS Nova Micro用于Text-to-SQL:LoRA微调+无服务器Bedrock每月仅需0.80美元

AWS演示了如何将Amazon Nova Micro模型的LoRA微调与无服务器Bedrock按需推理相结合,每月仅需0.80美元即可处理22000个SQL查询。训练费用通过Bedrock Customization为8美元,通过SageMaker为65美元。这种方法消除了持续托管模型的成本,适合工作量可变的生产环境。

🟡 🏥 实践应用 2026年4月17日 · 1 分钟阅读

Google:Chrome的AI模式带来并排页面与AI助手及多源搜索

Google在Chrome浏览器中推出新的AI模式升级,支持并排打开网页与AI助手、将标签页·图片·PDF合并为一次AI搜索,以及从Chrome搜索框访问Canvas写作和编码工具。2026年4月16日起在美国上线,计划全球扩展。

🟡 🏥 实践应用 2026年4月17日 · 2 分钟阅读

xAI语音转文字API正式发布:支持25种语言、批处理和流式模式

xAI宣布语音转文字API正式发布,支持25种语言的批处理和流式两种转录模式。此次发布距离2026年3月文字转语音API正式发布仅一个月。至此,xAI完成了与Grok语言模型配套的完整音频栈,并直接进入与OpenAI Whisper、Google Cloud Speech和Azure Speech的竞争。

🟡 🏥 实践应用 2026年4月16日 · 1 分钟阅读

GitHub:Copilot Cloud Agent现在可按组织选择性激活

GitHub允许企业管理员通过自定义属性选择性地激活对Copilot云代理的访问,取代了以往的全有或全无方式。新功能在各个组织层面提供对AI代理能力的更精细控制,并配备新的API端点,可通过GitHub Enterprise设置中的AI Controls界面进行管理。

🟡 🏥 实践应用 2026年4月16日 · 2 分钟阅读

微软:前沿转型——UBS、宝马和医疗行业如何从AI实验转向业务核心

微软发布了「前沿转型」概念,描述了各行业从AI实验转向将其整合到核心业务运营的过程。案例研究包括:UBS用于法律研究,宝马用于多智能体车辆分析,Cooper Health Care用于减少临床医生职业倦怠,以及Venchi用于个性化零售。

🟡 🏥 实践应用 2026年4月15日 · 1 分钟阅读

GitHub:免费代码安全评估工具可在几分钟内发现漏洞

GitHub推出基于CodeQL引擎的免费Code Security Risk Assessment工具。可扫描每个组织最活跃的20个仓库,并按严重性、语言和规则展示漏洞。Copilot Autofix在2025年修复了460,258个安全警告。

🟡 🏥 实践应用 2026年4月15日 · 1 分钟阅读

GitHub: Claude和Codex智能体现已支持模型选择

GitHub现在允许开发者在启动Claude和Codex编程智能体时选择不同的AI模型。可用模型包括Claude Sonnet/Opus 4.5和4.6以及GPT-5.2/5.3/5.4-Codex。

🟢 🏥 实践应用 2026年4月15日 · 1 分钟阅读

HuggingFace: HoloTab — 自动化浏览器操作的免费AI助手

HCompany在HuggingFace平台上发布了HoloTab,一款利用AI自动化网页任务的免费Chrome扩展。核心创新是Routines功能——录制一次操作,无限重复执行。

🟡 🏥 实践应用 2026年4月14日 · 1 分钟阅读

Google Chrome:AI Skills 一键将提示词转化为工具

Google 在 Chrome 中推出了 Skills 功能,允许用户将 AI 提示词保存为可一键复用的工具。该功能基于 Gemini,支持 Mac、Windows 和 ChromeOS 平台。

🟡 🏥 实践应用 2026年4月14日 · 1 分钟阅读

Google Research:Vantage——通过与AI虚拟角色对话评估批判性思维和创造力的AI平台

Google Research与纽约大学联合推出Vantage,一个利用生成式AI评估批判性思维和创造力等难以量化的人类技能的实验性平台。AI评分结果与人类专家的评估高度一致。

🟢 🏥 实践应用 2026年4月14日 · 1 分钟阅读

AWS:如何使用Lambda构建奖励函数来微调Amazon Nova模型

Amazon Web Services发布了一份详细的技术指南,介绍如何使用AWS Lambda创建可扩展的奖励函数来定制Amazon Nova模型。指南涵盖RLVR和RLAIF方法、多维奖励系统设计以及通过CloudWatch进行监控。

🟢 🏥 实践应用 2026年4月14日 · 1 分钟阅读

Perplexity API:n8n 集成、AWS Marketplace 及全新 /v1/models 端点

Perplexity 在 2026 年 4 月发布了多项 API 更新:用于可视化 AI 工作流的原生 n8n 集成、通过 AWS Marketplace 简化采购,以及无需认证的全新 /v1/models 端点。

🟢 🏥 实践应用 2026年4月12日 · 1 分钟阅读

ArXiv:借助 LLM 在 Isabelle/HOL 中形式化 Munkres 整本拓扑学教材

Bryant 及其合作者团队使用了 LLM 辅助的流程,对 Munkres 的整本《General Topology》进行了 Isabelle/HOL 形式化验证——超过 85,000 行经过验证的代码以及所有 806 个形式化结果。

🔴 🏥 实践应用 2026年4月11日 · 1 分钟阅读

OpenAI 推出 Academy — 官方教育平台,含 24 门课程

OpenAI 于 4 月 10 日发布了官方教育平台 OpenAI Academy,提供 24 门课程,涵盖 AI 基础、ChatGPT、提示工程、安全以及从医疗到金融的行业应用。

🟢 🏥 实践应用 2026年4月10日 · 1 分钟阅读

AWS AgentCore用三行代码在React应用中实现实时AI浏览器

Amazon推出了用于React应用的BrowserLiveView组件,可实时显示AI智能体在浏览器会话中所做的操作。流媒体通过Amazon DCV协议直接从AWS传输到用户浏览器,绕过应用服务器以最小化延迟。

🟢 🏥 实践应用 2026年4月10日 · 2 分钟阅读

AWS Bedrock阐明模型生命周期:Active、Legacy与End-of-Life阶段

Amazon发布了Bedrock中基础模型生命周期管理的官方指南。模型现在有三个明确定义的阶段(Active、Legacy、End-of-Life),在弃用前提供6个月的通知,而自2026年2月起,Legacy阶段将提供至少3个月的扩展访问期。