Level 2

LLM as Analyst

具备更强分析、建模、实验和学科任务能力的研究代理。

当前收录 14 个 Level 2 工具。
边界解释

L2 / Analyst 边界解释

L2 代表“能分析、能编排、但仍需人监督”的研究代理层。它们通常已经跨越单步工具,开始形成工作流。

属于 L2

分析代理、研发代理、实验编排框架、数据科学代理和可控的多步研究系统。

不属于 L2

只做单点增强的工具层产品,或已经能端到端自主科研的 AI Scientist 系统。

和 L3 的分界

一旦系统具备更完整的目标设定、实验闭环和持续自我迭代能力,就应该上升到 L3。

BI

BioAgents

生物研究

AI 科学家框架,用于自主深度研究

生物代理
来源
GitHub
定价
开源
层级
L2 · 生物研究
BL

BLADE

数据科学

数据驱动科学的语言模型代理基准

基准数据
来源
GitHub
定价
开源
层级
L2 · 数据科学
CO

Coscientist

化学研究

使用大语言模型进行自主化学研究

化学自主
来源
GitHub
定价
开源
层级
L2 · 化学研究
DI

DiscoveryWorld

虚拟环境

开发和评估自动化科学发现代理的虚拟环境

虚拟环境
来源
GitHub
定价
开源
层级
L2 · 虚拟环境
DR

DrugAgent

药物发现

通过 LLM 多代理协作自动化 AI 辅助药物发现编程

药物代理
来源
论文
定价
免费
层级
L2 · 药物发现
DS

DS-Agent

数据科学

通过案例推理增强大语言模型的自动化数据科学

数据科学代理
来源
GitHub
定价
开源
层级
L2 · 数据科学
DS

DSBench

数据科学

数据科学代理离成为专家有多远?

基准专家
来源
GitHub
定价
开源
层级
L2 · 数据科学
LL

LLM-SR

方程发现

通过大语言模型编程进行科学方程发现

方程发现
来源
GitHub
定价
开源
层级
L2 · 方程发现
LL

LLM-SRBench

方程发现

大语言模型科学方程发现新基准

基准方程
来源
GitHub
定价
开源
层级
L2 · 方程发现
ML

MLAgentBench

ML研究

评估语言代理在机器学习实验上的基准

基准ML
来源
GitHub
定价
开源
层级
L2 · ML研究
ML

MLE-bench

ML研究

评估机器学习代理在机器学习工程上的能力

基准工程
来源
GitHub
定价
开源
层级
L2 · ML研究
ML

MLR-Copilot

ML研究

基于大语言模型代理的自主机器学习研究

代理ML
来源
GitHub
定价
开源
层级
L2 · ML研究
NE

NewtonBench

定律发现

LLM 代理中可泛化科学定律发现的基准

基准定律
来源
GitHub
定价
开源
层级
L2 · 定律发现
PR

ProtAgents

蛋白质发现

结合物理和机器学习的蛋白质发现

蛋白质物理
来源
GitHub
定价
开源
层级
L2 · 蛋白质发现