AWS:Google Gemma 4模型登陆Amazon Bedrock——三种变体采用Apache 2.0许可证
Amazon Bedrock新增三款Google Gemma 4模型:具有256K上下文的31B密集模型、拥有38亿活跃参数的26B-A4B MoE模型,以及拥有51亿参数的紧凑型E2B模型。Gemma 4 31B在Intelligence Index上得分39,而同类开放模型(4B至40B)中位数为15。所有模型均采用Apache 2.0许可证,支持35种以上语言,并提供原生函数调用和内置推理模式。
本文由人工智能基于一手来源生成。
Amazon Bedrock新增了Google Gemma 4开放模型系列的三款模型,通过AWS托管基础设施以Apache 2.0许可证提供。
哪三种Gemma 4变体登陆Bedrock?
AWS提供三种变体:Gemma 4 31B(具有256K上下文的密集模型)、Gemma 4 26B-A4B(MoE模型,38亿活跃参数,256K上下文)以及紧凑型E2B(51亿参数,128K上下文)。MoE(混合专家)是一种架构,每个token只激活部分参数,使模型在保持大型模型能力的同时降低推理成本。
Gemma 4 31B的能力如何?
根据Artificial Analysis的测量,Gemma 4 31B的Intelligence Index得分为39,而4B至400亿参数类开放模型的中位数为15。这些模型在140多种语言上训练,支持35种以上语言的使用,并提供原生函数调用、内置推理模式和多模态能力(文本和图像)。
如何在AWS上使用这些模型?
Bedrock上的Gemma 4通过bedrock-mantle端点提供兼容OpenAI的API,简化了现有集成的迁移。AWS提供三种定价层级:Standard、Priority(相比Standard可提升最多25%的输出tokens/秒)和Flex(适用于对延迟容忍的任务的折扣定价)。模型初始在四个区域提供——美国东部两个、美国西部和欧盟法兰克福。
为什么登陆Bedrock意义重大?
Apache 2.0许可证允许商业使用和修改,Gemma 4登陆Bedrock将开放模型与托管基础设施相结合。这使企业无需自建GPU基础设施即可使用强大的开放模型,同时可根据延迟需求选择适合的定价层级。
常见问题
- Bedrock上有哪些Gemma 4变体?
- 三种:31B密集模型(256K上下文)、26B-A4B MoE模型(38亿活跃参数)和紧凑型E2B(51亿参数,128K上下文)。
- Gemma 4模型采用什么许可证?
- Apache 2.0许可证,允许商业使用和修改。
- Gemma 4 31B的智能水平如何?
- 根据Artificial Analysis,Intelligence Index得分为39,而4B至40B类开放模型的中位数为15。