在過去兩年裡,關於AI的公開討論大多歸結為一個問題:這個模型回答問題的能力有多好?
基準測試。排行榜。推理分數。幻覺率。
這個問題逐漸變得不再正確——因為更有趣的轉變不在於模型「說」得有多好,而在於它們能否在團隊已使用的同一工件上工作。
所以我們進行了一個簡單的實驗。我們沒有給AI謎題、謎語或合成提示,而是給了它更接近現實生活的東西:數據。
設定:分析師,而非聊天機器人
想法很直接:將系統當作分析師,而非聊天機器人。

我們收集了20個數據集,來自一般的商業情境——每週銷售額、活動結果、流失表格、調查匯出、庫存記錄、產品指標。沒有特殊格式。沒有精心挑選的基準測試包。就是人們每天互相郵寄的那種混亂表格。
然後我們要求了一件比摘要更難的事:
「告訴我們這裡什麼是重要的。」
不是「描述各欄位。」分析。
目標是看AI是否能超越對話輔助,表現得像試圖得出結論的人。
我們預期的事
我們假設了三種結果:
- 它會產生圖表
- 它會敘述趨勢
- 它偶爾會產生幻覺
它確實做到了這三點。但改變我們對這個領域看法的結果卻不同。
驚喜一:它並非從視覺化開始
人類分析師常遵循熟悉的路徑:打開試算表、清理、繪圖、然後詮釋。
系統並未可靠地遵循這個順序。它從呈現不確定性開始——關於季節性、跨地區可比較性、期間內價格變動以及其他決定圖表是否誠實的上下文缺口。
這種行為與許多團隊現在稱之為數據代理的做法一致:能承擔分析工作流程中多個步驟的系統,而不僅僅是回答單一提示。
換句話說,它不僅在繪圖。它還在形成假設。

驚喜二:圖表並非最有價值的產出
我們預期圖表是主要亮點。但它們不是。
最高的槓桿時刻發生在系統解釋為什麼一個數字變動的時候。
一個零售檔案中的例子:某一週的收入下降。人類可能只停留在「某個東西下降了」。這個執行過程將下降連結到轉換率下降、行動流量激增以及特定的活動啟動——然後產生了一個精簡的解釋:活動帶來更廣泛的流量後,低意圖訪客稀釋了轉換率。
這不是神奇的預測。這是跨訊號的推理——而且它重新定義了「AI分析」應該優化的目標。

驚喜三:速度改變了行為,而不僅僅是吞吐量
傳統分析工作流程繼承了摩擦:請求、排隊、分析、會議、決策。
當答案在幾秒內而非幾天內落地時,人們不僅行動更快——他們提出更多問題。更小、更尖銳的問題:
- 「昨天有什麼變化?」
- 「為什麼B區域勝過A區域?」
- 「如果排除週末會怎樣?」
瓶頸很少是原始數據量。而是提問的成本。一旦這個成本崩潰,好奇心和迭代就會增加。這從根本上改變了團隊與數據的關係。

從助理到分析師
聊天機器人幫你寫作。搜尋幫你找到東西。分析系統應該幫你做決定。
公司已在嘗試更自主的系統來協調運營數據和工作流程。我們在小規模看到的也是同樣的方向轉變:AI從回應到詮釋再到引導注意力。
不再是:「這是你要求的圖表。」
變成了:「這是值得審視的地方——以及原因。」
真正的含義
多年來,BI文化高度依賴儀表板。儀表板假設使用者已經知道該找什麼、哪個視圖重要、以及如何解讀變化。
大多數團隊的失敗不是因為無法存取數據。而是因為理解成本太高。
行業問題從來不只是視覺化。而是時間壓力下的認知。
這對工作的意義
常見的恐懼是被取代。這個實驗指向了一個更狹窄的方向。
AI並沒有消除分析師的角色。它取代了等待、重複的圖表組裝以及機械比較的初稿。
人類方面留下的是:
- 判斷力
- 決策制定
- 溝通
- 只有利益相關者能提供的上下文
工作沒有消失。它向上移動了。
一種不同類型的工具
我們正處於一場轉變的早期階段,你可以稱之為思考基礎設施——一種能揭示模式、解釋異常、引導注意力、縮短從數據到行動路徑的軟體。
下一代分析不會由最漂亮的預設圖表來定義。
它將由團隊能多快移動來定義:
數據 → 理解 → 行動

結語
長期以來,我們根據AI能否像人類一樣回答問題來評分。
經過這樣的實驗後,一個更好的測試更簡單:
它能否幫助人類更快理解——並有足夠的可追溯性來信任下一步?
因為持久的革命不是那些聽起來聰明的機器。
而是那些讓人類更果斷的機器。
這個轉變已經在進行中——悄然無聲地,在團隊已有的試算表和匯出檔案中。

