Galileo Technologies Inc.(一家专门开发 AI 模型观察和评估工具的公司)今天推出了 Agentic Evaluations 平台,该平台旨在评估由大语言模型驱动的 AI 代理系统的性能。