柏聯科技-CCTV 影像辨識怎麼進化?傳統 AI vs 生成式 AI 差異一次看懂
從傳統分辨式 AI(CNN)到生成式 AI(GenAI),解析影像辨識在非固定事件上的關鍵差異。透過實際案例說明生成式 AI 如何以情境理解與推理能力,補足傳統 AI 在複雜工安場域的盲點,並兼顧本地端即時性與資安需求。


除了科技執法能抓違規車輛,現在連「亂丟垃圾」這類行為,也能靠 AI 自動辨識、即時舉發!
許多人不知道,CCTV 監控系統早已不只是錄影工具,搭配 AI 影像辨識後,能主動辨識違規行為,例如違規停車、逆向行駛、誤闖閘道車輛等。這些都屬於固定型態事件,適合使用「分辨式 AI」(也常被稱為傳統 AI)來處理。
分辨式 AI 的運作流程
所謂「分辨式 AI」(通常基於 CNN 卷積神經網路),就是透過大量標註資料進行訓練,其流程如下:
- 資料收集:蒐集大量影像,並標註物件種類(車輛、人、物品、動物等)。
- 模型訓練:透過深度學習建立辨識模型。
- 模型推論:AI 依據訓練結果進行實際辨識。
- 錯誤修正:回收錯誤樣本並修正模型參數。
- 模型更新:再次訓練模型,進行下一次推論(循環進行)。

分辨式 AI 就像一位經過密集訓練的識別員,靠大量圖片學會「這是什麼、那不是什麼」,能準確辨認車種、顏色與車牌。
但一旦遇到「沒學過的情境」,就容易出錯或無法判斷。
為什麼無法辨識「亂丟垃圾」這種非固定事件?
像「亂丟垃圾」這類事件,每次發生的狀況都不同:可能是大包垃圾、小包垃圾,甚至是廢棄家具;有人直接丟、有人偷偷放。這些都不具備固定型態,對傳統 AI 來說缺乏明確判斷依據。
生成式 AI 如何解決傳統 AI 的盲點?
生成式 AI(GenAI)不只比對是否看過的樣本,而是能根據情境、狀態與過往經驗進行推理。
像打架、車禍、機具倒塌等沒有固定樣貌的突發事件,生成式 AI 能從畫面中抽取線索,自主判斷是否存在異常。
傳統 AI 像保全,生成式 AI 像主管
分辨式 AI 就像拿著厚厚訓練手冊的保全,只能依照學過的規則判斷;遇到沒學過的情境就會說「無法判斷」。
生成式 AI 則更像經驗豐富的主管,即使沒有逐條教學,也能從場域狀況推敲出異常行為。
以下為工地吊車翻覆的新聞案例:即便僅擷取「稍微傾斜」的單張畫面,透過自然語言詢問,生成式 AI 仍能理解設備懸掛於泥土地、傾斜不穩,並判斷其潛在風險,展現情境推理能力。



本地端運行的優勢:不靠雲端,快速又安全
在石化廠、工地、港口等網路不穩的環境,若辨識必須仰賴雲端回傳,往往警報尚未響起,人就已經出事。
VAIDIO 生成式 AI 本地端運行的最大價值在於:不必上傳資料、不等雲端回傳,AI 即可在現場即時判斷與反應,同時兼顧即時性與資安。
傳統 AI vs 生成式 AI 差異

| 傳統 AI | 生成式 AI |
|---|---|
| 面對非固定型態物件無法有效辨識 | 可辨識各種非固定型態的物件 |
| 需大量已標註資料訓練 | 不需事先標註資料即可辨識 |
| 需大量 GPU 執行推論與訓練 | 語言模型可降低算力需求 |
| 僅做分類與標籤化 | 透過自然語言理解與邏輯推理 |
| 受限於已知物件類型 | 可處理稀有與難蒐集樣本的事件 |