跳至主要內容

AI與模型透明度

IFRS起草的提供商路由、僅填空邏輯、置信度門控、RAG檢索及幻覺控制。

倫敦一家核證公司的分析師審查了一份AI生成的ESG披露草案。草案引用了IFRS S2第29段——引用正確、引用準確——但AI附加的排放數字屬於不同的範圍三類別。置信度分數為0.92。映射是錯誤的。她追溯了來源:AI從IFRS標準中檢索到了正確的段落,但嵌入匹配從錯誤的供應商發票中提取了數據。系統沒有區分「範圍三類別4——上游運輸」和「範圍三類別1——採購商品」。

這就是為什麼IFRS.Report的人工智能管道不是黑箱。它使用僅填空邏輯——人工智能從不覆蓋人類已經輸入的數據。它使用置信度門控——低於0.3置信度的草案被保留審查,不發布。它使用檢索增強生成——每個人工智能聲明都基於檢索到的IFRS或SASB段落,而不是模型的訓練數據。它使用提供商路由——系統選擇最適合任務的LLM(DeepSeek用於結構化提取,Qwen用於多語言問題),而不是依賴單一模型。

AI不撰寫報告。它起草回复供人類審查。證據軌跡——來源文件、段落引用、置信度分數、審閱者時間戳——在每一步都被保留。倫敦的分析師沒有發現幻覺,因為置信度門控太低。她發現了一個映射錯誤——因為來源鏈完整,她可以在幾秒鐘內修復它。AI是速度的工具,不是判斷的替代品。而且該工具對其限制是透明的。

簡明解讀

人工智能管道不是黑箱。每個生成的聲明都帶有其來源:哪個模型、哪個條文、哪個置信度分數、哪個審閱者。僅填空邏輯確保人工智能絕不覆蓋人工輸入的數據;置信度門控在發布前保留低置信度草案進行審查。

  • 人工智能管道不是黑箱——每個生成的聲明都帶有其來源:哪個模型、哪個段落、哪個置信度分數、哪個審閱者。
  • 僅填空邏輯意味着人工智能從不覆蓋人類輸入的數據;置信度門控在發布前保留低置信度草案進行審查。
  • 實際檢驗標準是分析師能否從草案通過檢索來源追溯到 grounding 它的IFRS條文。

技術要求

  • 提供商路由與模型選擇 — 人工智能管道路由任務到最適合的LLM——DeepSeek用於結構化提取,Qwen用於多語言問題——而不是依賴單一模型。
  • 僅填空編輯邏輯ISSA 5000:人工智能絕不覆蓋人工輸入的數據。僅填空邏輯確保AI只填充空字段,保留人工審閱和編輯的內容。
  • 置信度門控與閾值控制 — 低於0.3置信度的草案被保留審查,不發布。置信度評分基於檢索相關性和答案一致性。
  • RAG檢索與幻覺預防 — 每個人工智能聲明都基於檢索到的IFRSSASB段落,而不是模型的訓練數據。檢索增強生成確保人工智能聲明有據可查。

來源

  1. IFRS S1 §54-59Sources of guidance (Part_A_Standards/IFRS_S1_General_Requirements_for_Disclosure_of_Sustainability-related_Financial_.pdf)
  2. IFRS S2 §27-36Climate metrics and targets (Part_A_Standards/IFRS_S2_Climate-related_Disclosures.pdf)
  3. IFRS S1 §21-24Connected information (Part_A_Standards/IFRS_S1_General_Requirements_for_Disclosure_of_Sustainability-related_Financial_.pdf)