反向量化工程：从公开文档解码对冲基金策略

2024年，Bill Hwang损失200亿美元，行业从新闻中得知。不是从13F。不是从13D。不是从Form SHO。Archegos从未提交13F——其在ViacomCBS、Discovery、腾讯音乐的头寸通过total return swaps结构化，监管框架不将其视为"持仓"。这就是法律内可隐藏的天花板。

在解码Jane Street之前——SEBI发布了105页Jane Street更希望保密的材料——我们需要先就公开数据中什么是可见的、什么是不可见的达成共识。否则任何LLM pipeline都会构建一个 beautifully written 的幻觉。

公开数据的结构性盲区

如果你的分析师还认为13F是投资组合快照，解雇分析师。13F是过滤后的、滞后的投资组合投影：

仅多头，Section 13(f)证券。无空头。无swaps。无固收。期权仅报告名义值——无行权价、无方向
45天滞后。你看到Q3持仓时，基金可能已在Q4
保密处理请求。Berkshire routinely 隐藏建仓头寸3-12个月；Agarwal等人在Journal of Finance实证显示保密持仓产生系统性地更高的alpha
窗口装饰。季末轮换到"体面"头寸——学术界充分记录，13F中按构造不可见
Form SHO（将关闭部分空头漏洞）推迟到2028年2月

任何方法论都从显式列出结构上不可能提取的内容开始。否则你在构建基金的公共面具模型，不是基金本身。

好消息：面具必须一致。隐藏策略需要每季度代价高昂的动作——保密处理请求、swap重组、跨司法管辖区分配。这些留下二阶痕迹：Form ADV年度间语言变化、LinkedIn招聘模式、USPTO专利申请、员工学术论文、其他司法管辖区的监管文件。

LLM不发现新来源。来源是相同的。改变的是交叉引用的成本。连接USPTO专利到同作者的学术论文，该作者一年前参加了某基金前员工也出席的会议——这曾经是高级分析师的完整工作日。用Claude加prompt缓存：2美元API credits和15分钟。

六技术方法论

3.1 对抗性假设测试

基本错误——让LLM"解释策略"。你得到一个 polished narrative，Claude用你的引导性问题作为轨道。

正确模式是反转的。你构建假设；Claude获得敌对reviewer的角色：

角色：敌对reviewer。你的声誉取决于找到漏洞。

交付（JSON）：

contradictions：最多3个最强矛盾，附{quote, page_ref, why_it_contradicts}

killshot：如果为真将invalidate假设的单个事实

alternative_hypothesis：与相同事实最一致的解释

如果找不到真正矛盾，设为空列表并在killshot中解释。NEVER fabricate。NEVER paraphrase quotes。

LLM是好的校对员，坏的证明生成器。用它们在"找我想法里的漏洞"模式，不是"替我想"模式。

3.2 竞争假设集成

如果正确的假设不是你构建的那个？并行运行多个Claude实例，不同解释框架："这是操纵"、"这是合法做市"、"这是别的东西"。Meta-prompt比较三个输出，识别分歧点。三个框架在相同事实上收敛但得出不同结论——那就是数据不足的地方。诊断自己的unknowns，这在研究中比任何单一答案更有价值。

3.3 时序差异分析

同类型文档（Form ADV是最富成效的目标）来自同一基金的不同年份。让Claude找语言变化，尤其是模板化措辞中的变化。大多数基金年复一年verbatim复制ADV；当风险管理语言中有东西改变时，这是合规决定旧措辞不再保护他们的信号。

最有趣的发现：旧语言消失的地方。被移除的声明几乎总是意味着它不再为真。

3.4 跨文档三角测量

一个文档是叙事。三个文档是三角测量。来源A的声明（SEBI令）、B中的确认（关于到期日微观结构的学术文献）、C中的矛盾（Jane Street内部通信）。Claude在一个session中对一百个声明运行交集，附confidence scores。通过所有三个检查的声明——操作ground truth。通过A但被B和C矛盾的——regulator overreached的地方。

3.5 Prompt缓存

105页SEBI令约120k tokens。首次加载1小时缓存：约1.20美元。每次后续查询：约0.06美元。50次查询后——4美元和50个不同的分析截面。

改变的不是成本，是工作结构：从"每文档三个问题"到"三百个"。

3.6 对抗性文档审问

A方文档（SEBI令）。喂给Claude，让它扮演A的对抗者——Jane Street的辩护团队——构建针对性问题以undermine特定事实声明。结果列表是defense将如何结构的forecast。最终令可能一年后，上诉再两年——但潜在漏洞的map今天就在你手中。

三层验证规则

没有这些，六技术变成 beautifully written bullshit：

出处链强制执行。每个声明携带完整证据轨迹：source_url、source_document_hash、source_page、extraction_timestamp、extraction_model、verification_status。没有完整轨迹——Pydantic拒绝。
逐字引用验证。LLM的每个引用都对source document进行程序化字符串匹配。未找到——verification_status="failed"，声明丢弃。
集成投票。每个enrichment用不同seed运行N次（默认3）。2/3+一致的声明获得高confidence。分歧在最终输出中可见。

Confidence公式： final_score = base_score × ensemble_factor × adversarial_factor × direct_evidence_bonus

每个weight有必需的weight_justification字段。默认方案：结构性标记0.4、数值阈值0.3、regex模式0.2、LLM语义提取0.1（最低，因为最主观）。

预测上——强制的adversarial_analysis和falsification_criteria。Pydantic拒绝空值。

LLM prompt工程是10%的工作。90%是LLM周围的代码，catch和discard LLM编造的东西。

监管者偏见问题

自然反对：如果方法论建立在监管文件上，而监管者被证明有偏见——信任基础是什么？

偏见单向工作。监管者可能选择不立案。但发布105页令是不同类别的决定。此时监管者的风险是overstating，不是understating：对手有资源在法庭上dismantle弱论点。

SEBI ≠ SEC。SEBI对美国公司——政治反转：展示主权、保护国内零售。跨司法管辖区执法系统性地比国内更严厉。

数字vs叙事。SEBI令有叙事（"操纵"、"邪恶计划"）和带具体数字的事实部分（表7、8、16、17）。叙事可以被spin。数字来自交易所记录和broker报告——Jane Street自己提交到印度监管系统的。伪造数字对监管员工是刑事责任。

对抗性验证。Jane Street在积极抗争。顶级律师。提出上诉。他们contest解释（"这不是操纵，是套利"），不是事实（"我们没有买那么多underlying"）。如果数字被fabricated，那会是他们在SAT的第一个论点。对抗系统在做它的工作。

方法论的处理：按声明类型分离——事实声明→信任（可验证、对抗性验证）；因果/意图声明→与其他来源三角测量；法律定性→不是我们的领域，等最终令。

从历史案例到实时工具

如果唯一输出是过时策略的reconstruction，这只是记者的方法论，不是交易员的。

每个技术都是pattern detector，跑在今天的数据上。Jane Street是教学案例。五个实时应用：

7.3x杠杆作为detector signature。任何通过公开数据可观察到的market maker（combined 13F + Options Clearing Corp数据 + venue volume reports）运行options名义值/underlying头寸比率超过5x的，是pre-2025 Jane Street setup。对20-30最大HFT公司的active monitoring提供early warning。
LTP影响分析作为尽职调查。SEBI的方法现在是监管工具包的一部分。任何2025年7月后的allocator应该在DDQ中要求LTP影响metrics。
不对称P&L模式用于实时筛选。对你投资组合中的每个多leg策略，检查leg之间是否存在系统性loss-leader模式。如果存在——无论意图如何，合规风险。
印度期权作为可操作的结构性洞察。全球61%的股票期权交易量在印度（2025年4月数据）。Jane Street退出——流动性真空正被Tower、Citadel Securities、Optiver、IMC分配。6-18个月的开放窗口。
JSI/JSI2/新加坡/香港作为监管套利模板。这种结构至少被一打外国HFT公司使用。SEBI正在建立先例。任何你有exposure的外国HFT（直接或通过ETF），检查公开文件中的DTAA routing。如果存在——向上调整监管风险溢价。

成本对比

2020年，解码平均对冲基金结构成本约5万美元和2-3个月高级分析师时间。2026年——50-100美元和一个晚上。新的均衡，其中意识到其公共足迹正以这种方式被分析的基金将开始更仔细地控制它——创造下一轮博弈。