人工智能時代如何維護文化主體性
來源:學(xué)習(xí)時報作者:張宜春 2025-05-30 09:36
當(dāng)前,以大語言模型技術(shù)為核心的人工智能技術(shù)正飛速迭代和加速演進。大模型通過海量數(shù)據(jù)的預(yù)訓(xùn)練,形成千億級別參數(shù)的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),能夠?qū)崿F(xiàn)強大的上下文理解和多模態(tài)內(nèi)容生成能力,并在很大程度上體現(xiàn)出了通用性和推理能力,能夠有效解決當(dāng)前社會生產(chǎn)生活中存在的一些具體問題,提升全社會的生產(chǎn)效率。圍繞大模型的廣泛應(yīng)用,正在形成新的科研范式、創(chuàng)新范式、人機協(xié)同工作范式,解構(gòu)了傳統(tǒng)的代際知識傳承方式和教育方式,催生出新的人類信息和知識獲取模式,重塑未來經(jīng)濟生活形態(tài)。
但是,當(dāng)我們看到人工智能帶給人類新紀(jì)元曙光的同時,也必須看到當(dāng)前的大模型在涉及文化判斷和價值取向的領(lǐng)域,輸出結(jié)果仍不盡如人意,存在著與主流認(rèn)知之間的差異,在一定程度上存在著“胡說”“亂說”“胡寫”“亂畫”的現(xiàn)象,干擾了人們對社會主流價值觀念的認(rèn)同與判斷、對中華優(yōu)秀傳統(tǒng)文化的認(rèn)知和理解,也對人工智能時代的薪火賡續(xù)形成了新的挑戰(zhàn)。因此,亟須在積極推進大模型產(chǎn)業(yè)應(yīng)用的前提下多措并舉,以社會主義核心價值觀為引領(lǐng),把中華文化主體性融入到大模型的建設(shè)和產(chǎn)業(yè)應(yīng)用中,讓大模型更具“中國特色、中國風(fēng)格、中國氣派”。
當(dāng)前的大模型在涉及文化安全的領(lǐng)域,存在著如下問題和挑戰(zhàn)。
從訓(xùn)練數(shù)據(jù)角度看,全球互聯(lián)網(wǎng)中的英文語料占比高達59.8%,中文語料占比僅為1.3%,使得大模型在訓(xùn)練生成時就缺乏豐富的中文知識。比如,ChatGPT訓(xùn)練數(shù)據(jù)所使用的中文數(shù)據(jù)占比就不足0.1%。這種數(shù)據(jù)分布結(jié)構(gòu)性的缺陷導(dǎo)致了大模型在認(rèn)知中文世界時存在先天不足。與此同時,互聯(lián)網(wǎng)公開信息來源復(fù)雜,存在大量未經(jīng)認(rèn)證的虛假和錯誤信息,“以訛傳訛、三人成虎”的現(xiàn)象在互聯(lián)網(wǎng)中屢見不鮮,并形成了大量基于誤導(dǎo)信息的語料。這就導(dǎo)致大模型對于真實信息的識別能力下降,進而影響輸出結(jié)果的正確性。除此之外,互聯(lián)網(wǎng)經(jīng)過近三十年的發(fā)展,“數(shù)字鴻溝”問題依然存在,數(shù)據(jù)在地域、領(lǐng)域和人群分布上極其不均衡,“馬太效應(yīng)”嚴(yán)重,互聯(lián)網(wǎng)是強勢地區(qū)、活躍領(lǐng)域、活躍人群的發(fā)聲地,互聯(lián)網(wǎng)數(shù)據(jù)無法全面代表全球不同人群的價值觀和世界觀,扭曲了大模型最終的價值判斷和文化取向。
從大模型本身的技術(shù)架構(gòu)角度來看,大模型存在著極其復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),內(nèi)部工作機制一直被認(rèn)為是個黑箱,輸出邏輯不可理解,輸出結(jié)果難以預(yù)測,可解釋性是目前大模型應(yīng)用中的重要技術(shù)難點。因此,一旦出現(xiàn)大模型針對某些領(lǐng)域的輸出異常,難以判斷是來自模型內(nèi)部的技術(shù)缺陷,還是來自模型外部的人為操作。難以區(qū)分“別有用心”和“無心之舉”,也就限制了相應(yīng)對策和措施的應(yīng)用。此外,大模型在極力追求通用性和泛化能力時,會過度依賴統(tǒng)計規(guī)律,導(dǎo)致非強勢文化在內(nèi)容生成時出現(xiàn)明顯失真。
從外部操作角度看,在大模型的創(chuàng)制過程中,算力成為第一制約要素。但是算法和數(shù)據(jù)依然對于大模型生成有著直接而重要的作用。模型訓(xùn)練數(shù)據(jù)的取舍、清洗、標(biāo)注、質(zhì)量檢測,模型參數(shù)的調(diào)優(yōu)、對齊、反饋強化學(xué)習(xí)、能力評價,都有著大量人類智力活動的主動參與,有著主觀能動性的發(fā)揮空間。業(yè)界常說的“有多少人工,就有多少智能”,對于大模型的應(yīng)用落地依然有效,那么從業(yè)者本身的價值判斷和審美取向,也會通過其工作帶到大模型中。人的主觀能動性也在潛移默化中影響著大模型的輸出結(jié)果。
因此,為了應(yīng)對上述風(fēng)險和挑戰(zhàn),需要從系統(tǒng)思維的角度,展開以下工作。
第一,加強人工智能時代廣義標(biāo)準(zhǔn)體系建設(shè)。總而言之,就是要用“標(biāo)準(zhǔn)來約束過程,用數(shù)據(jù)集來約束結(jié)果”。具體來講,一是要建立“國家——行業(yè)——社會——企業(yè)”的多層級標(biāo)準(zhǔn)體系。通過標(biāo)準(zhǔn)的建設(shè),綱舉目張,執(zhí)本末從,將大模型的數(shù)據(jù)建設(shè)、參數(shù)調(diào)優(yōu)、能力評估、人員準(zhǔn)入等問題,以標(biāo)準(zhǔn)的形式加以約束和指導(dǎo),將價值判斷和意識形態(tài)融入到大模型的建設(shè)過程中。二是要加快人文社科領(lǐng)域各類權(quán)威數(shù)據(jù)集的建設(shè)。權(quán)威數(shù)據(jù)集在大模型時代中的作用,猶如定海神針。有了各個細分領(lǐng)域的權(quán)威數(shù)據(jù)集,就可以要求大模型的輸出結(jié)果能夠和權(quán)威數(shù)據(jù)集“對得上,對得準(zhǔn)”,工程技術(shù)團隊才能展開各類大模型中的校準(zhǔn)和對齊技術(shù)工作,提綱挈領(lǐng),牽住大模型的“牛鼻子”,實現(xiàn)人工智能在文化藝術(shù)領(lǐng)域的對標(biāo)和對表。
第二,加快中文優(yōu)質(zhì)語料的建設(shè)和開放共享。如果把大模型的訓(xùn)練過程看成是一個嗷嗷待哺的嬰孩茁壯成長的過程,那么撫育嬰孩成長的乳汁就是高質(zhì)量語料數(shù)據(jù)。高質(zhì)量語料數(shù)據(jù)已經(jīng)成為推進大模型建設(shè)的核心生產(chǎn)要素,對于大模型文化輸出能力的建設(shè)來說,可謂“得數(shù)據(jù)者得天下”。做好高質(zhì)量語料數(shù)據(jù)建設(shè),首先需要加大政府投入,加快公立文化藝術(shù)相關(guān)機構(gòu)的語料庫建設(shè)和開放工作,盡快將主流聲音、主流意識注入互聯(lián)網(wǎng)中,同時把語料庫的建設(shè)、開放、共享程度作為考核相關(guān)部門和單位數(shù)字化轉(zhuǎn)型和改造的重要指標(biāo),從專業(yè)性、合規(guī)性、安全性、適用性等多個方面進行綜合評估。其次需要協(xié)同推進數(shù)據(jù)加工處理的工作載體建設(shè),在產(chǎn)業(yè)端推進數(shù)據(jù)標(biāo)注的產(chǎn)業(yè)發(fā)展和集聚,在公共事務(wù)端推進建設(shè)文化藝術(shù)行業(yè)數(shù)據(jù)中心,配合國家文化數(shù)字化戰(zhàn)略的工作任務(wù),做好文化藝術(shù)資源的數(shù)據(jù)匯交工作,集中力量辦成大事。最后是創(chuàng)新語料建設(shè)的工作機制,增強社會參與和共創(chuàng)能力。一些地方發(fā)放“語料券”的實踐表明,該機制可使多模態(tài)數(shù)據(jù)庫建設(shè)效率提升38%,也為文化藝術(shù)領(lǐng)域的語料庫建設(shè)提供了新的解決思路和辦法。
第三,加快數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的發(fā)展。數(shù)據(jù)標(biāo)注是原始數(shù)據(jù)進行采集、清洗、分類、標(biāo)記、質(zhì)量檢驗的專業(yè)數(shù)據(jù)治理工作。隨著大模型預(yù)訓(xùn)練數(shù)據(jù)中多模態(tài)數(shù)據(jù)的日趨增多,數(shù)據(jù)標(biāo)注已經(jīng)成為大模型建設(shè)中不可缺少的環(huán)節(jié)。數(shù)據(jù)標(biāo)注的水平不僅直接關(guān)系到大模型的能力和輸出內(nèi)容結(jié)果,也直接影響到中華文化主體性的融入和價值呈現(xiàn)。由于文化藝術(shù)領(lǐng)域數(shù)據(jù)和資源存在明顯的專業(yè)性、小眾性、傾向性、偏好性等特點,無法完全利用機器完成數(shù)據(jù)標(biāo)注工作,極其依賴從業(yè)者本身具備良好的文化藝術(shù)專業(yè)知識基礎(chǔ)。首先需要大力推進文化藝術(shù)領(lǐng)域的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)和崗位建設(shè),這既能夠有效提升大模型建設(shè)質(zhì)量,也能通過產(chǎn)業(yè)發(fā)展創(chuàng)造出文化藝術(shù)領(lǐng)域新的工作崗位,促進人才培養(yǎng)與產(chǎn)業(yè)發(fā)展的良性互動。其次要做好文化藝術(shù)相關(guān)領(lǐng)域數(shù)據(jù)標(biāo)注人員的技能聯(lián)動培訓(xùn),并建立職業(yè)準(zhǔn)入標(biāo)準(zhǔn),制定人員定期培訓(xùn)機制,做到“一手管數(shù)據(jù),一手管處理數(shù)據(jù)的人”,從源頭上保障大模型中的中華文化主體性融入。
第四,加強哲學(xué)社會科學(xué)在大模型建設(shè)中的作用。在人工智能快速發(fā)展的當(dāng)下,哲學(xué)社會科學(xué)需要構(gòu)建起適應(yīng)人工智能時代的底層認(rèn)知框架,主動引導(dǎo)人工智能的發(fā)展方向,建立起人和智能體協(xié)作共生的理論邊界,弄清楚“哪些是可以做的,哪些是不能做的”,探討新的知識生產(chǎn)模式和人工智能倫理評估模式,開展“新時代文化治理學(xué)”的跨學(xué)科研究工作,建立起可量化的人工智能意識形態(tài)評價體系,對人工智能的廣泛應(yīng)用構(gòu)建“壓力測試”試驗環(huán)境,在“人工智能熱”中注入冷靜的觀察和思考。將前瞻思辨的思維主動融入大模型的建設(shè)和開發(fā)鏈條中,在模型設(shè)計階段即注入人文價值考量,從而最終引領(lǐng)人機共生的知識新生態(tài)、文化新生態(tài)。
第五,建立起全社會共同參與和協(xié)同工作的機制。大模型中的文化主體性問題,牽涉社會的方方面面,需要通過全社會不斷的、持續(xù)的、實時的反饋,不斷調(diào)整大模型的輸出結(jié)果,建立起“各界共商、多方參與、實時反饋、寬容創(chuàng)新”的中華文化主體性的建設(shè)和維護機制。建立“金字塔型”社會參與模型,基層建立起文化AI志愿者聯(lián)盟和社團組織,實現(xiàn)全民可參與的人工智能反饋機制,讓大模型能夠做到“出錯即發(fā)現(xiàn),有錯即更改”;中層建立起各類行業(yè)協(xié)會和專業(yè)組織,完成人類專業(yè)知識向人工智能大模型的灌輸和滲透;頂層建立起專家倫理審查和價值判斷機制,通過分層賦權(quán)形成協(xié)同治理閉環(huán)。全社會攜手相望,運用社會共治筑牢創(chuàng)新發(fā)展的防護堤岸,最終形成人機共生的中華文明進化生態(tài),回望千年歷史,跨越時代變革,賡續(xù)璀璨光芒。
(作者系中國藝術(shù)科技研究所數(shù)字藝術(shù)部主任)
編輯:董麗娜
文章、圖片版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系刪除
