现代 AI 科研要求掌握数十种专业工具和框架。AI 研究员花更多时间调试基础设施,而不是验证假设——拖慢了科学发现的节奏。Orchestra Research 的 AI Research Skills 库,就是为了解决这个问题。

核心定位

让 AI Agent 自主完成 AI 科研全流程:从文献调研、想法生成,到实验执行、再到论文写作。

提供的不只是单一工具,是研究编排层(autoresearch、ideation、paper writing)加上每个阶段需要的工程技能(训练、评估、部署)的完整覆盖。

Autoresearch:中心编排层

这是最关键的新技能——自主研究编排,使用双循环架构:

  • 内层优化循环:对当前研究方向做迭代改进
  • 外层综合循环:整合文献、发现、实验结果

它管理从文献调研到论文写作的完整生命周期,自动路由到所有细分技能。支持 Claude Code /loop 和 OpenClaw heartbeat 实现连续运转。

已用它产出了两篇完整论文:

  • Norm Heterogeneity → LoRA Brittleness:Agent 自驱发现了 norm heterogeneity 预测 fine-tuning 难度(r=-0.99)
  • RL Algorithm Brain Scan:Agent 训练了 RL 模型,用可解释性工具分析内部表征,得出"DPO 是 rank-1 对齐"结论

87个技能,22个分类

分类技能数代表技能
Autoresearch1自主研究编排
Model Architecture5LitGPT, Mamba, RWKV, NanoGPT, TorchTitan
Fine-Tuning4Axolotl, LLaMA-Factory, PEFT, Unsloth
Post-Training8TRL, GRPO, OpenRLHF, SimPO, verl, slime
Distributed Training6DeepSpeed, FSDP, Accelerate, Megatron-Core
Optimization6Flash Attention, bitsandbytes, GPTQ, AWQ, HQQ, GGUF
Inference4vLLM, TensorRT-LLM, llama.cpp, SGLang
Agents4LangChain, LlamaIndex, CrewAI, AutoGPT
RAG5Chroma, FAISS, Pinecone, Qdrant
Multimodal7CLIP, Whisper, LLaVA, Stable Diffusion, SAM
Safety & Alignment4Constitutional AI, LlamaGuard, Prompt Guard
Mech Interp4TransformerLens, SAELens, pyvene, nnsight
Emerging Techniques6MoE, Model Merging, Long Context, Speculative Decoding

安装方式

人类安装

npx @orchestra-research/ai-research-skills

AI Agent 安装:直接把 Agent 指向欢迎文档,它自己完成其余步骤:

Read https://www.orchestra-research.com/ai-research-skills/welcome.md

安装器会自动检测已安装的编码 Agent(Claude Code、OpenCode、Cursor、Codex 等),将技能安装到 ~/.orchestra/skills/,并建立符号链接。

技能结构

每个技能遵循统一格式:

skill-name/ ├── SKILL.md # 快速参考(50-150行) ├── references/ # 深度文档(300KB+) │ ├── README.md # 来自官方文档/GitHub │ ├── api.md # API 参考 │ ├── tutorials.md # 逐步指南 │ ├── issues.md # 真实 GitHub issues 及解决方案 │ ├── releases.md # 版本历史和 breaking changes │ └── file_structure.md # 代码库导航 └── scripts/ # 辅助脚本(可选)

质量标准:每个技能 300KB+ 文档,来自官方仓库、真实 GitHub issues 和生产级工作流。

与 Karpathy Auto Research 的关系

这个库和 Karpathy 的 Auto Research 方向一致——都是让 AI 持续自我改进。但侧重点不同:

  • Karpathy Auto Research:600行自进化 loop 核心理念,更偏向底层方法论
  • Orchestra AI Research Skills:87个细分领域技能 + Autoresearch 编排层,更偏向工程落地

两者结合使用是更完整的方案:用 Autoresearch 做研究编排,用领域技能处理具体任务(GRPO 训练、vLLM 推理优化、TransformerLens 可解释性分析等)。