自從生成式AI出現(xiàn)以來,企業(yè)在AI方面的應(yīng)用已不再是一種“可做可不做”的選擇,而變成了“不這么做就無法生存”的必然要求。許多企業(yè)都正致力于利用AI來提升生產(chǎn)力、創(chuàng)造新的業(yè)務(wù)價值。

【關(guān)西電力公司(Kansai Electric Power)】
導(dǎo)言:在人工智能時代,競爭力的源泉究竟是什么?
自從生成式AI出現(xiàn)以來,企業(yè)在AI方面的應(yīng)用已不再是一種“可做可不做”的選擇,而變成了“不這么做就無法生存”的必要條件。許多企業(yè)都致力于利用AI來提升生產(chǎn)力、創(chuàng)造價值。
在這里,我想要再次向大家提出一個問題。那就是:“究竟是什么決定了人工智能的本質(zhì)性能?”
決定AI性能的因素,是AI的模型嗎?是AI使用的工具嗎?還是AI智能體(Agent)呢? 當(dāng)然,我認(rèn)為這些都很重要。不過從長遠(yuǎn)來看,多家公司圍繞AI模型性能展開的競爭最終會在某個節(jié)點趨于收斂。到那時,很可能會出現(xiàn)“不管用哪家的AI模型都一樣厲害”的局面。
在這種背景下,我認(rèn)為能夠真正影響AI性能、也是最重要的一環(huán),就是企業(yè)所積累的、能夠轉(zhuǎn)化為自身優(yōu)勢的“數(shù)據(jù)”。

例如,如果有人問“花草需要吸收什么才能茁壯成長?”,答案自然是“優(yōu)質(zhì)的水分和陽光”。 另外,如果被問到“人類需要接受什么才能獲得良好成長?”,我認(rèn)為是“美好的言語”。 最后,“AI是通過什么來獲得成長的呢?”答案就是“優(yōu)質(zhì)的數(shù)據(jù)”。
對于這一極其簡單的原理,企業(yè)能在多大程度上深刻理解并堅定不移地執(zhí)行,將決定其能否確立競爭優(yōu)勢并實現(xiàn)持續(xù)增長。
AI是“數(shù)據(jù)的鏡子”
想必大家都已經(jīng)認(rèn)識到,AI絕不是什么“魔法棒”。它只是根據(jù)被喂給的數(shù)據(jù)進行學(xué)習(xí),并在那個范圍內(nèi)進行推理的存在。也就是說,AI的輸出結(jié)果在極大程度上依賴于輸入數(shù)據(jù)的質(zhì)量。可以說,“AI就是數(shù)據(jù)的鏡子”。
如果輸入不準(zhǔn)確的數(shù)據(jù),就會返回不準(zhǔn)確的結(jié)果(=垃圾進,垃圾出 / Garbage in, garbage out)。
如果輸入帶有偏差(偏見)的數(shù)據(jù),AI就會做出帶有偏差的判斷。
基于不充分的數(shù)據(jù),只能得到膚淺的見解或提示。
由此可見,AI本身并不“聰明”,它只是“忠實于數(shù)據(jù)”?;谶@一前提,我們可以看清:應(yīng)用AI的本質(zhì)不在于“使用哪種工具”,而在于“如何整理出優(yōu)質(zhì)數(shù)據(jù),并妥善加以利用”。
什么是“優(yōu)質(zhì)數(shù)據(jù)”?
那么,什么是“優(yōu)質(zhì)數(shù)據(jù)”呢?顯然,僅僅是數(shù)據(jù)的“量”大,如果質(zhì)量不行也是毫無用處的。但另一方面,所謂“質(zhì)量”好,具體指的又是什么呢?
從一般的數(shù)據(jù)管理視角來看,“優(yōu)質(zhì)數(shù)據(jù)”至少應(yīng)具備以下幾個維度:
正確性(Accuracy):包含大量錯誤和噪音的數(shù)據(jù),無論進行多么高級的分析,得出的結(jié)論都會被扭曲。因此,盡量減少傳感器誤差、輸入錯誤和數(shù)據(jù)重復(fù)是至關(guān)重要的。
完整性(Completeness):所需字段是否缺失?缺失值是否過多?例如,如果一份客戶數(shù)據(jù)中,年齡、地區(qū)、性別等信息出現(xiàn)大面積空白,就很難進行有效的分析。
一致性(Consistency):相同含義的數(shù)據(jù)是否存在不同格式混用的情況(例如:日期格式、單位、名稱縮寫不統(tǒng)一)?這在系統(tǒng)集成和處理長期數(shù)據(jù)時尤為重要。
最新性(Timeliness):數(shù)據(jù)再準(zhǔn)確,如果過于陳舊,也可能對當(dāng)前的決策毫無幫助。是需要實時數(shù)據(jù),還是過去的歷史數(shù)據(jù)就足夠?這取決于具體的用途,但關(guān)鍵是要保證“符合目標(biāo)的適當(dāng)新鮮度”。
目的適切性(Relevance):如果包含了太多與分析目的無關(guān)的數(shù)據(jù),就會變成噪音并導(dǎo)致誤判。必須明確“為了什么目的使用數(shù)據(jù)”,并準(zhǔn)備與之高度相關(guān)的數(shù)據(jù)。
可靠性(Reliability):數(shù)據(jù)的來源是哪里?是如何收集的?這些信息必須明確以確??煽啃?,同時還要具備可復(fù)現(xiàn)性。來源不明的“黑盒”數(shù)據(jù)在后期是無法進行驗證的。
總而言之,所謂的“優(yōu)質(zhì)數(shù)據(jù)”,指的是“準(zhǔn)確無誤、缺失少、含義和格式統(tǒng)一、時效性恰當(dāng)、符合使用目的且來源可靠”的數(shù)據(jù)。
只有確保了作為“優(yōu)質(zhì)數(shù)據(jù)”的質(zhì)量底線,AI才能產(chǎn)出有價值的結(jié)果。反過來說,如果在數(shù)據(jù)尚未整理好的狀態(tài)下盲目引入AI,是絕對無法獲得預(yù)期成果的。目前許多企業(yè)抱怨“引入了AI卻沒法用”、“AI的準(zhǔn)確率提不上去”,其根源大多出在數(shù)據(jù)問題上。
數(shù)據(jù)并非“自然而然就能整理好”
這里非常關(guān)鍵的一點是:優(yōu)質(zhì)數(shù)據(jù)絕不是自然而然就能產(chǎn)生的。相反,如果置之不理,數(shù)據(jù)必然會發(fā)生劣化。
根據(jù)輸入人員和時機的不同,輸入規(guī)則變得五花八門。
存在多個含義相同但命名不同的數(shù)據(jù)。
從未被更新過的陳舊數(shù)據(jù)散落各處,無人問津。
各個部門的數(shù)據(jù)形成“孤島(Silo)”,互不相通。
上述這些情況,在許多企業(yè)中應(yīng)該都屢見不鮮吧。
以下展示了本公司在數(shù)據(jù)管理方面的整體架構(gòu)。?

【數(shù)據(jù)管理整體架構(gòu)圖】
宏觀上,它主要由兩大板塊構(gòu)成:一是涉及角色與體制、風(fēng)險管理、評估的“數(shù)據(jù)治理”;二是包含數(shù)據(jù)應(yīng)用生命周期管理與支持服務(wù)的“數(shù)據(jù)管理”。其中,在數(shù)據(jù)應(yīng)用的生命周期管理方面,包含以下流程:
需求管理:明確目的和需求,即“為什么要使用這些數(shù)據(jù)?”、“這些數(shù)據(jù)能為誰帶來什么價值?”。
收集:根據(jù)目標(biāo)收集必要的數(shù)據(jù)。設(shè)計需要哪些內(nèi)部/外部數(shù)據(jù)、以何種粒度和頻率收集,以及如何確保其質(zhì)量。
加工:提升數(shù)據(jù)質(zhì)量,將其整理成可用的形態(tài)。包括數(shù)據(jù)清洗(糾正錯誤與填補缺失)、格式統(tǒng)一、數(shù)據(jù)合并與查重、針對結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)的專項處理,以及賦予業(yè)務(wù)層面的具體含義等。
蓄積:確保數(shù)據(jù)處于“需要的人在需要時即可使用”的狀態(tài)。包括存入數(shù)據(jù)庫/數(shù)據(jù)湖、實施安全與訪問控制、元數(shù)據(jù)管理(讓人知道這是什么數(shù)據(jù))等。
利活用(應(yīng)用):這是最重要的一步。使用數(shù)據(jù)的目的不是為了“分析”,而是為了“促成行動”。通過數(shù)據(jù)可視化(儀表盤)、高級分析(統(tǒng)計處理、BI、AutoML、AI),以及嵌入業(yè)務(wù)流程(自動化、決策支持)等方式,從數(shù)據(jù)中創(chuàng)造出真正的業(yè)務(wù)價值。
廢棄:妥善處理不再需要的數(shù)據(jù)。包括保管期限的管理、應(yīng)對法律法規(guī)與合規(guī)審查、降低安全風(fēng)險等。事實上,僅僅是“持有數(shù)據(jù)”本身就可能構(gòu)成一種風(fēng)險。因此,“不保留不需要的數(shù)據(jù)”這一理念同樣重要。
數(shù)據(jù)管理絕不是一次性建好就結(jié)束的工作,而是一項需要持續(xù)維護和改進的長期工程。CIO必須將數(shù)據(jù)管理作為一種機制嵌入到組織中,并持之以恒地執(zhí)行,直到它徹底扎根。
數(shù)據(jù)管理并非“只有IT部門才該負(fù)責(zé)的工作”
另一個核心要點是:數(shù)據(jù)管理絕不僅僅是IT部門單打獨斗的工作。
數(shù)據(jù)基本上都是在一線業(yè)務(wù)的運轉(zhuǎn)過程中產(chǎn)生的。因此:
數(shù)據(jù)的含義和定義到底由誰來拍板?
如何統(tǒng)一數(shù)據(jù)的輸入規(guī)則?
如何從源頭確保數(shù)據(jù)的質(zhì)量? 這些問題,本質(zhì)上都是業(yè)務(wù)層面的問題、事業(yè)發(fā)展的問題,更是企業(yè)經(jīng)營層面的問題。
在日本經(jīng)濟產(chǎn)業(yè)省于2026年4月發(fā)布的最新版《數(shù)字技能標(biāo)準(zhǔn) ver.2.0》中,針對數(shù)據(jù)管理領(lǐng)域,劃定了以下三種關(guān)鍵角色:
數(shù)據(jù)管家(Data Steward):基于對業(yè)務(wù)領(lǐng)域的深厚了解,負(fù)責(zé)確保數(shù)據(jù)質(zhì)量、可靠性與安全性相關(guān)的運營工作。同時,還要推動數(shù)據(jù)管理在業(yè)務(wù)部門和一線組織中的滲透與扎根,促進數(shù)據(jù)的有效利用。可以說是“數(shù)據(jù)質(zhì)量的把關(guān)人與數(shù)據(jù)應(yīng)用的推廣者”。
數(shù)據(jù)工程師(Data Engineer):把握數(shù)據(jù)的現(xiàn)狀,在數(shù)據(jù)收集、整合、加工、提供等各個流程中實施數(shù)據(jù)整理與預(yù)處理,并通過設(shè)計與搭建數(shù)據(jù)管道,來支撐整個組織的持續(xù)性數(shù)據(jù)利用??梢哉f是“讓數(shù)據(jù)流動起來的落地與運維執(zhí)行者”。
數(shù)據(jù)架構(gòu)師(Data Architect):俯瞰整個組織和業(yè)務(wù)的數(shù)據(jù)結(jié)構(gòu)、流向及應(yīng)用方式。緊扣業(yè)務(wù)戰(zhàn)略,設(shè)計著眼于數(shù)據(jù)全生命周期的整體架構(gòu),并進行持續(xù)優(yōu)化,從而實現(xiàn)跨部門的數(shù)據(jù)利用與數(shù)據(jù)治理的完美平衡。可以說是“數(shù)據(jù)的全局總設(shè)計師”。
對于CIO而言,不能僅僅停留在搭建數(shù)據(jù)存儲和分析的IT基礎(chǔ)設(shè)施上。更迫切的任務(wù)是:在公司內(nèi)部合理配置具備這三種角色的專業(yè)人才,搭建跨部門的全公司統(tǒng)一工具與規(guī)則,從而發(fā)揮將“企業(yè)經(jīng)營、事業(yè)發(fā)展、日常業(yè)務(wù)與數(shù)據(jù)”緊密縫合的紐帶作用。
數(shù)據(jù)應(yīng)用的成敗,最終取決于“組織風(fēng)氣(企業(yè)文化)”
然而,不管人才配置得多么齊備,基礎(chǔ)設(shè)施、工具和規(guī)則搭建得多么完善,如果組織內(nèi)部沒有形成“基于數(shù)據(jù)來驅(qū)動經(jīng)營和業(yè)務(wù)”的文化風(fēng)氣,數(shù)據(jù)依然無法被真正用起來。
一線員工根本不理解錄入這些數(shù)據(jù)的意義是什么。
數(shù)據(jù)和指標(biāo)僅僅為了應(yīng)對本部門的考核而進行了局部優(yōu)化。
基于客觀數(shù)據(jù)做出的高質(zhì)量決策,在公司內(nèi)部得不到認(rèn)可和獎勵。
在這樣的狀態(tài)下,無論機制設(shè)計得多么精妙,最終都會流于形式。
反觀那些數(shù)據(jù)應(yīng)用開展得非常順利的組織,以下行為往往是自然而然發(fā)生的:
所有討論和會議,都以客觀數(shù)據(jù)為前提。
先提出假設(shè),然后用真實的數(shù)據(jù)去驗證它。
全員都有意識地持續(xù)改善數(shù)據(jù)的質(zhì)量。
也就是說,數(shù)據(jù)管理的終極本質(zhì),其實是為了營造一種“以利活用數(shù)據(jù)為前提的組織文化”。
這種文化的形成不可能一蹴而就。正因如此,最有效的方法是“從小處著手,積小勝為大勝”:
在某個特定的核心業(yè)務(wù)中先行整理數(shù)據(jù),并通過引入AI取得立竿見影的成果。
將這個成功案例在公司內(nèi)部橫向推廣。
逐步擴大數(shù)據(jù)治理和AI應(yīng)用的目標(biāo)領(lǐng)域。
通過不斷運轉(zhuǎn)這個正向循環(huán),數(shù)據(jù)的重要性就會潛移默化地滲透到整個組織的血液中。
AI時代CIO應(yīng)扮演的新角色
在AI時代,外界對CIO的角色期望已經(jīng)發(fā)生了天翻地覆的改變。
在過去,CIO的核心職責(zé)主要是:
確保IT系統(tǒng)的穩(wěn)定運行。
最大化地優(yōu)化IT成本。
但從今往后,CIO需要承擔(dān)更多直接關(guān)乎企業(yè)經(jīng)營命脈的職責(zé):
將數(shù)據(jù)視為企業(yè)的核心資產(chǎn),并實現(xiàn)其價值的最大化。
為AI的應(yīng)用鋪好路:搭建數(shù)據(jù)基座、工具和規(guī)則,同時推進相關(guān)人才的配置與培養(yǎng)。
在全公司范圍內(nèi),主導(dǎo)釀造“以數(shù)據(jù)為驅(qū)動”的組織文化。
換句話說,CIO必須完成自我進化,成為企業(yè)“數(shù)據(jù)價值創(chuàng)造的總負(fù)責(zé)人”。
結(jié)語:數(shù)據(jù),才是競爭優(yōu)勢的真正源泉
在未來的時代,全面利活用AI將成為所有企業(yè)生存的基準(zhǔn)線。在這場競爭中,拉開差距的關(guān)鍵已經(jīng)不再是“你是否使用了AI”,而是“你手里到底掌握著什么樣的數(shù)據(jù)”。
數(shù)據(jù),是對企業(yè)過去各項經(jīng)營優(yōu)勢的沉淀,更是創(chuàng)造未來商業(yè)價值的源泉。而數(shù)據(jù)的質(zhì)量,則是由每天的日常業(yè)務(wù)和組織的運作方式所決定的。
AI,需要在優(yōu)質(zhì)數(shù)據(jù)的滋養(yǎng)下才能茁壯成長。
而企業(yè),則將通過這些強大的AI實現(xiàn)飛躍式成長。
把這個最簡單的原理作為一切的出發(fā)點,將數(shù)據(jù)管理徹底推向企業(yè)經(jīng)營的核心位置。這難道不是在AI時代實現(xiàn)企業(yè)持續(xù)增長的最短路徑嗎?
而身為CIO,正是那個需要挺身而出、牽引著企業(yè)走完這條路徑的關(guān)鍵領(lǐng)航人。
下期預(yù)告:徹底思考并實現(xiàn)“人與AI的協(xié)作究竟是什么?”——CIO應(yīng)當(dāng)設(shè)計的新型工作方式與企業(yè)變革
應(yīng)用AI的本質(zhì)不在于“替代”,而在于“協(xié)作”。
AI究竟擅長什么?人類又該擔(dān)負(fù)起哪些核心職責(zé)?
要實現(xiàn)人機協(xié)作,對現(xiàn)有業(yè)務(wù)流程進行重新設(shè)計是必不可少的。
CIO悄悄話:老板天天催AI落地,業(yè)務(wù)天天罵AI太蠢?作為CIO我終于看透了真相……
最近,生成式AI可謂是火遍了大江南北。老板在外面聽了幾場峰會,回來就下了死命令:“現(xiàn)在不用AI,以后就沒飯吃!趕緊在全公司推行!”
于是,我們IT部門加班加點,采購工具、部署模型、開放接口??墒菦]過幾天,業(yè)務(wù)部門的吐槽就如潮水般涌來:“這AI怎么總是胡說八道?”“預(yù)測的結(jié)果根本不準(zhǔn)??!”“這簡直是人工智障,還不如我自己用Excel算得快!”
面對這些指責(zé),很多同行可能會抱怨現(xiàn)在的AI大模型還不夠成熟。但作為CIO,在仔細(xì)排查了系統(tǒng)后,我終于看透了背后的真相——這根本不是AI的鍋,而是我們自己數(shù)據(jù)的鍋!
【痛點直擊:你喂給AI的是垃圾,它憑什么給你吐出黃金?】
很多企業(yè)在搞AI的時候都有一個誤區(qū),以為買個最貴的模型、上個最酷的工具,就能立刻產(chǎn)生價值。但事實是,AI并不是魔法棒,它只是一面“數(shù)據(jù)的鏡子”。
回想一下我們公司內(nèi)部的數(shù)據(jù)現(xiàn)狀吧:各部門各自為政,數(shù)據(jù)形成了無數(shù)個“孤島”;同一種數(shù)據(jù)有三種不同的命名規(guī)則;客戶信息缺斤少兩,好幾年都沒人更新…… 如果我們把這些充滿噪音、偏差和錯漏的“垃圾數(shù)據(jù)”喂給AI,AI怎么可能得出準(zhǔn)確的結(jié)論?“Garbage in, garbage out(垃圾進,垃圾出)”,這就是我們在AI落地時遭遇的最大攔路虎。不解決數(shù)據(jù)源頭的問題,任何高大上的AI項目最后都會淪為形式主義的擺設(shè)。
【方案落地:跳出技術(shù)自嗨,重塑數(shù)據(jù)生命周期】
長遠(yuǎn)來看,市面上的AI模型能力最終會趨于同質(zhì)化。大家都用差不多的模型時,真正的護城河是什么?是你自家獨有的、高質(zhì)量的“企業(yè)數(shù)據(jù)”。為了讓AI能夠吸收“優(yōu)質(zhì)的養(yǎng)分”茁壯成長,我們必須轉(zhuǎn)變思維,把數(shù)據(jù)管理當(dāng)成一把手工程來抓。
第一,明確數(shù)據(jù)管理不僅是IT部門的事,更是業(yè)務(wù)的事。數(shù)據(jù)是在業(yè)務(wù)中產(chǎn)生的,它的含義和質(zhì)量必須由業(yè)務(wù)來把控。我們需要在組織內(nèi)建立起“鐵三角”:
數(shù)據(jù)管家(Data Steward):懂業(yè)務(wù),負(fù)責(zé)盯緊數(shù)據(jù)質(zhì)量,推動部門內(nèi)的數(shù)據(jù)應(yīng)用。
數(shù)據(jù)工程師(Data Engineer):懂技術(shù),負(fù)責(zé)清洗、整合數(shù)據(jù),搭建數(shù)據(jù)流通的管道。
數(shù)據(jù)架構(gòu)師(Data Architect):懂全局,根據(jù)公司戰(zhàn)略設(shè)計整體的數(shù)據(jù)架構(gòu)和生命周期。
第二,打通數(shù)據(jù)管理的完整閉環(huán)。不要再任由數(shù)據(jù)在系統(tǒng)里發(fā)霉了!從明確“為什么用這些數(shù)據(jù)”的需求管理開始,到按需收集、清洗加工(去重補缺)、安全蓄積,再到最終融入業(yè)務(wù)流程創(chuàng)造價值,甚至包括過期廢棄。每一個環(huán)節(jié)都要有規(guī)可循。 我的建議是:不要想著一口吃成胖子。找一個最痛的業(yè)務(wù)場景切入,先把這一塊的數(shù)據(jù)洗干凈,讓AI跑出讓人驚艷的成果,然后再把這個成功經(jīng)驗橫向復(fù)制到其他部門。
【終極價值:讓數(shù)據(jù)重塑組織文化,完成CIO的華麗進化】
當(dāng)我們真正把數(shù)據(jù)管理做扎實了,帶來的改變是顛覆性的。
你會發(fā)現(xiàn),跨部門開會不再是“我覺得”、“憑經(jīng)驗”,而是“用數(shù)據(jù)說話”、“提假設(shè),用數(shù)據(jù)驗證”。當(dāng)“以數(shù)據(jù)為前提”的組織文化生根發(fā)芽時,AI才能真正從一個“嘗鮮的玩具”,變成企業(yè)生產(chǎn)力爆發(fā)的“核武器”。
而在這一場變革中,我們CIO/CDO的角色也迎來了終極進化。過去,我們只是負(fù)責(zé)“系統(tǒng)穩(wěn)定、控制成本”的后勤大管家;但現(xiàn)在,我們正式成為了企業(yè)“數(shù)據(jù)價值創(chuàng)造的總負(fù)責(zé)人”。
記住,在AI時代,能拉開企業(yè)差距的,永遠(yuǎn)是你手里捏著的好數(shù)據(jù)。把土壤培植好,AI自然會開出最驚艷的花。各位IT同仁們,別再盯著模型看了,趕緊回去梳理你們的數(shù)據(jù)吧!