AWS SageMaker AI dobiva agentne workflowe za fine-tuning s 9 ugrađenih vještina i integracijom Kiroa i Claude Codea
Amazon je 4. svibnja 2026. lansirao agent-guided workflowe u SageMaker AI s 9 ugrađenih skills agenata koji pokrivaju cijeli model customization lifecycle — od specifikacije use casea do deployanja. Sustav podržava SFT, DPO i RLVR trening metode, integrira se s Kiroom (default) i Claude Codeom u JupyterLab okruženju, te tvrdi da reducira mjesece specijaliziranog ML rada na dane.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
AWS je 4. svibnja 2026. predstavio agent-guided workflows u Amazon SageMaker AI — sustav koji nudi conversational pristup model customization-u kroz devet ugrađenih agentnih vještina, s direktnom integracijom Kiroa i Claude Codea u JupyterLab okruženju. Cilj je svesti deep ML expertise zahtjev za fine-tuning radom na natural-language opis problema, pri čemu agentni sustav generira editable Jupyter notebookove na svakom koraku pipeline-a.
Kako se pokreće agent-guided workflow?
Developer kroz chat panel u SageMaker AI Studio JupyterLab-u opisuje use case prirodnim jezikom (npr. “trebam clinical reasoning model koji korak po korak interpretira medicinske slučajeve”). Coding agent identificira relevantne vještine, sekvencijalno ih aktivira, i u svakoj fazi generira editable Jupyter notebook koji developer može modificirati prije izvršavanja. AWS u objavi tvrdi da agent skills “ne samo da povećavaju produktivnost, već i smanjuju potrošnju tokena” zbog targetirane aktivacije.
Devet vještina pokriva cijeli customization lifecycle: Use Case Specification, Planning/Discovery, Fine-tuning Setup, Dataset Evaluation, Dataset Transformation, Fine-tuning, Model Evaluation i Model Deployment, plus orchestration step. Sustav podržava SFT (Supervised Fine-Tuning), DPO (Direct Preference Optimization) i RLVR (Reinforcement Learning with Verifiable Rewards). Pokrivene model familije: Amazon Nova, GPT-OSS, Llama, Qwen i DeepSeek.
Koja je razlika između Kiro i Claude Code integracije?
Kiro je default agent — preconfigured u SageMaker AI Studio JupyterLab chat panelu, autenticira se device flow-om. Claude Code se instalira preko npm paketa @zed-industries/claude-agent-acp, podržava ACP (Agent Communication Protocol) i integrira se s Amazon Bedrockom kroz konfiguracijski file. Oba agenta automatski pristupaju SageMaker skill agentima u JupyterLab okruženju.
Tehnička arhitektura oslanja se na ACP kompatibilnost, integraciju sa SageMaker AI Hubom (base modeli), Amazon S3 (data storage), MLflow (metrics tracking) i Amazon Bedrock (deployment). Demo use case u objavi je clinical reasoning model koji “walka kroz medicinske slučajeve korak po korak prije postavljanja dijagnoze” — primjer koji direktno korelira s ReClaim foundation model trendom za medicinske primjene (vidi paralelan ArXiv članak istog dana).
Što ovo znači za enterprise ML timove?
AWS-ova izjava da “ono što je nekad zahtijevalo mjesece specijaliziranog ML rada može se sada završiti u danima” je značajna — ali ostaje verifikabilna tek kad timovi proizvedu prve produkcijske modele kroz workflow. Bigger picture: AWS pozicionira SageMaker kao integriranu agent-orchestration platformu, slično kao IBM-ov istovremeno objavljen watsonx Orchestrate next-gen i AWS Bedrock AgentCore Optimization (lansiran istog jutra). Konvergencija prema “agent-guided model customization” kao standardnom enterprise sučelju je sada jasan industry trend, a ne više eksperimentalni pristup.
Pricing nije objavljen u launch postu, što ukazuje na standardno SageMaker billing usage-based pricinge. Dostupnost je za sve organizacije s AWS računima i SageMaker AI domenom — bez geografskih ograničenja navedenih u objavi.
Česta pitanja
- Koje su 9 agentnih vještina u SageMaker AI?
- Vještine pokrivaju: Use Case Specification, Planning/Discovery, Fine-tuning Setup, Dataset Evaluation, Dataset Transformation, Fine-tuning, Model Evaluation, Model Deployment i jedan dodatni step orkestracije. Coding agent ih sekvencijalno aktivira na temelju razgovora s developerom.
- Koje trening metode podržava agentni workflow?
- Workflow podržava SFT (Supervised Fine-Tuning), DPO (Direct Preference Optimization) i RLVR (Reinforcement Learning with Verifiable Rewards). Pokriva model familije Amazon Nova, GPT-OSS, Llama, Qwen i DeepSeek.
- Kako se integrira s Claude Codeom?
- Claude Code se instalira preko npm paketa @zed-industries/claude-agent-acp, koristi ACP (Agent Communication Protocol) za komunikaciju, a integrira se s Amazon Bedrockom kroz konfiguracijski file. U JupyterLab okruženju automatski pristupa SageMaker skill agentima.
Izvori
Povezane vijesti
ArXiv GUI-SD: prvi on-policy self-distillation framework za GUI grounding nadmašuje GRPO na šest benchmarkova u točnosti i efikasnosti treniranja
AWS Bedrock AgentCore Optimization u previewu: automatizirana petlja od produkcijskih traga do A/B testa s OpenTelemetry trace-ovima
ArXiv AEM: adaptivna modulacija entropije za multi-turn RL agente postiže +1,4 % na SWE-bench Verified