arXiv:2604.21910: agentic AI automatizira znanstveni workflow s 83 % točnosti, 92 % manje data transfera i $0.001 po upitu
Zašto je bitno
Bartosz Balis i suradnici s AGH University u Krakovu objavili su 23. travnja 2026. paper koji pretvara prirodnojezične istraživačke upite u izvršne znanstvene workflowove. Trolayer arhitektura (semantički LLM sloj, deterministički generator, expert Skills) testirana je na 1000 Genomes workflowu na Kubernetesu — Skills su podigli intent accuracy s 44 % na 83 %, smanjili data transfer za 92 % uz cijenu ispod $0.001 po upitu.
Tim s AGH University of Science and Technology u Krakovu (Bartosz Balis, Michal Orzechowski, Piotr Kica, Michal Dygas i Michal Kuszewski) objavio je 23. travnja 2026. paper “From Research Question to Scientific Workflow: Leveraging Agentic AI for Science Automation” (arXiv:2604.21910). Rad se nadovezuje na sve značajniji “AI Scientist” trend — pokušaj autonomne automatizacije znanstvenog procesa od pitanja do rezultata.
Što je problem koji paper rješava?
Postojeći scientific workflow sustavi (Pegasus, Nextflow, Snakemake, Hyperflow) automatiziraju izvršavanje workflowova — scheduling, fault tolerance, resource management. Ali ne automatiziraju semantičku translaciju koja prethodi izvršavanju: znanstvenik mora ručno pretvoriti svoje pitanje (npr. “što je najčešća varijanta gena BRCA1 u europskoj populaciji?”) u formalnu workflow specifikaciju s konkretnim alatima, parametrima i ulaznim podacima. Ovaj korak zahtijeva i domensko znanje (genetika) i infrastrukturno znanje (Kubernetes, container registry, data formats).
Kako radi predložena arhitektura?
Autori predlažu trolayer dizajn koji “confines LLM non-determinism to intent extraction”:
- Semantički sloj — LLM tumači prirodni jezik u strukturirane intente. Ovaj sloj je vjerojatnostan i može griješiti.
- Deterministički sloj — validirani generatori pretvaraju strukturirane intente u reproducibilne workflow DAG-ove. Identičan intent uvijek daje identičan workflow.
- Knowledge sloj — domenski stručnjaci pišu “Skills” — markdown dokumente koji kodiraju mapiranja vokabulara (npr. “BRCA1 → ENSG00000012048”), ograničenja parametara i strategije optimizacije.
Kombinacija znači da je nedeterministički LLM zatvoren u jasno definiran prostor (intent extraction), a sve daljnje transformacije su matematički predvidljive — što je presudno za znanstvenu reproducibilnost.
Koji su konkretni rezultati?
Autori implementiraju i evaluiraju arhitekturu na 1000 Genomes population genetics workflowu i Hyperflow WMS platformi koja radi na Kubernetesu. U ablation studiji na 150 upita:
- Intent accuracy raste s 44 % na 83 % kad se Skills uključe
- Data transfer se smanjuje za 92 % zahvaljujući skill-driven deferred workflow generation
- LLM overhead ispod 15 sekundi end-to-end
- Cijena ispod $0.001 po upitu
Posljednje dvije brojke su komercijalno najzanimljivije — sustav je dovoljno brz i jeftin za realan produkcijski deployment u istraživačkim laboratorijima.
Ograničenja i sljedeći koraci
Rad ne tvrdi da AI može zamijeniti znanstvenika u formuliranju zanimljivih pitanja niti u interpretaciji rezultata. Fokus je na mehaničkom dijelu workflowa — onome što danas oduzima dane manualnog rada. Skills su ručno pisani od strane domenskih stručnjaka, što znači da skalabilnost ovisi o spremnosti zajednice da kontribuira. Sljedeći logičan korak bila bi automatska generacija Skills iz znanstvene literature — što bi otvorilo put fully bootstrapped AI Scientist sustavima.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Povezane vijesti
AWS objavio kako graditi Strands Agente sa SageMaker AI modelima i MLflow observability: SageMakerAIModel provider, autolog tracing i A/B testiranje varijanti
OpenAI objavio Symphony: open-source specifikaciju za orkestraciju Codex agenata koja issue trackere pretvara u 'always-on' inženjerske sustave
arXiv:2604.22748: Survey 42 autora uvodi 'levels × laws' taksonomiju za world modele u AI agentima — sinteza 400+ radova