跳至主要内容

AI与模型透明度

IFRS起草的提供商路由、仅填空逻辑、置信度门控、RAG检索及幻觉控制。

伦敦一家核证公司的分析师审查了一份AI生成的ESG披露草案。草案引用了IFRS S2第29段——引用正确、引用准确——但AI附加的排放数字属于不同的范围三类别。置信度分数为0.92。映射是错误的。她追溯了来源:AI从IFRS标准中检索到了正确的段落,但嵌入匹配从错误的供应商发票中提取了数据。系统没有区分"范围三类别4——上游运输"和"范围三类别1——采购商品"。

这就是为什么IFRS.Report的人工智能管道不是黑箱。它使用仅填空逻辑——人工智能从不覆盖人类已经输入的数据。它使用置信度门控——低于0.3置信度的草案被保留审查,不发布。它使用检索增强生成——每个人工智能声明都基于检索到的IFRS或SASB段落,而不是模型的训练数据。它使用提供商路由——系统选择最适合任务的LLM(DeepSeek用于结构化提取,Qwen用于多语言问题),而不是依赖单一模型。

AI不撰写报告。它起草回复供人类审查。证据轨迹——来源文件、段落引用、置信度分数、审阅者时间戳——在每一步都被保留。伦敦的分析师没有发现幻觉,因为置信度门控太低。她发现了一个映射错误——因为来源链完整,她可以在几秒钟内修复它。AI是速度的工具,不是判断的替代品。而且该工具对其限制是透明的。

简明解读

人工智能管道不是黑箱。每个生成的声明都带有其来源:哪个模型、哪个条文、哪个置信度分数、哪个审阅者。仅填空逻辑确保人工智能绝不覆盖人工输入的数据;置信度门控在发布前保留低置信度草案进行审查。

  • 人工智能管道不是黑箱——每个生成的声明都带有其来源:哪个模型、哪个段落、哪个置信度分数、哪个审阅者。
  • 仅填空逻辑意味着人工智能从不覆盖人类输入的数据;置信度门控在发布前保留低置信度草案进行审查。
  • 实际检验标准是分析师能否从草案通过检索来源追溯到 grounding 它的IFRS条文。

技术要求

  • 提供商路由与模型选择 — 人工智能管道路由任务到最适合的LLM——DeepSeek用于结构化提取,Qwen用于多语言问题——而不是依赖单一模型。
  • 仅填空编辑逻辑ISSA 5000:人工智能绝不覆盖人工输入的数据。仅填空逻辑确保AI只填充空字段,保留人工审阅和编辑的内容。
  • 置信度门控与阈值控制 — 低于0.3置信度的草案被保留审查,不发布。置信度评分基于检索相关性和答案一致性。
  • RAG检索与幻觉预防 — 每个人工智能声明都基于检索到的IFRSSASB段落,而不是模型的训练数据。检索增强生成确保人工智能声明有据可查。

来源

  1. IFRS S1 §54-59Sources of guidance (Part_A_Standards/IFRS_S1_General_Requirements_for_Disclosure_of_Sustainability-related_Financial_.pdf)
  2. IFRS S2 §27-36Climate metrics and targets (Part_A_Standards/IFRS_S2_Climate-related_Disclosures.pdf)
  3. IFRS S1 §21-24Connected information (Part_A_Standards/IFRS_S1_General_Requirements_for_Disclosure_of_Sustainability-related_Financial_.pdf)