Level 2

LLM as Analyst

具备更强分析、建模、实验和学科任务能力的研究代理。

当前收录 14 个 Level 2 工具。

边界解释

L2 / Analyst 边界解释

L2 代表“能分析、能编排、但仍需人监督”的研究代理层。它们通常已经跨越单步工具，开始形成工作流。

属于 L2

分析代理、研发代理、实验编排框架、数据科学代理和可控的多步研究系统。

不属于 L2

只做单点增强的工具层产品，或已经能端到端自主科研的 AI Scientist 系统。

和 L3 的分界

一旦系统具备更完整的目标设定、实验闭环和持续自我迭代能力，就应该上升到 L3。

BioAgents

生物研究

AI 科学家框架，用于自主深度研究

BLADE

数据科学

数据驱动科学的语言模型代理基准

Coscientist

化学研究

使用大语言模型进行自主化学研究

DiscoveryWorld

虚拟环境

开发和评估自动化科学发现代理的虚拟环境

DrugAgent

药物发现

通过 LLM 多代理协作自动化 AI 辅助药物发现编程

DS-Agent

数据科学

通过案例推理增强大语言模型的自动化数据科学

DSBench

数据科学

数据科学代理离成为专家有多远？

LLM-SR

方程发现

通过大语言模型编程进行科学方程发现

LLM-SRBench

方程发现

大语言模型科学方程发现新基准

MLAgentBench

ML研究

评估语言代理在机器学习实验上的基准

MLE-bench

ML研究

评估机器学习代理在机器学习工程上的能力

MLR-Copilot

ML研究

基于大语言模型代理的自主机器学习研究

NewtonBench

定律发现

LLM 代理中可泛化科学定律发现的基准

ProtAgents

蛋白质发现

结合物理和机器学习的蛋白质发现