由中國公共關系協會文化大數據產業委員會(以下簡稱“專委會”)和華為云計算技術有限公司(以下簡稱“華為云”)聯創的文化大模型即將進入評測階段,為做好評測工作,8月28日,專委會邀請二十余家成員單位、國家文化大數據標識基地負責人,在北京召開文化大模型評測工作座談會,就文化大模型如何賦能文化數字化建設進行深入研討,并取得共識。
會議現場
(資料圖片僅供參考)
專委會副主任委員兼秘書長高凱主持座談會,華為云盤古大模型產品總監周唐軍出席座談會并介紹相關情況。
圖為專委會副主任兼秘書長高凱主持座談會
專委會專家組成員尹暉以《文化大模型能為行業做些什么?》為題,針對文化企事業單位在文化數字化建設中面臨的數據體量大、處理成本高、數據處理效率低等問題,提出了文化大模型解決方案,即通過文化大模型的自動智能化標識、圖像元素自動提取、文生圖和圖生文的多模態能力可以有效解決。文化大模型幫助文化機構在多個應用場景高效完成各種工作,包括數字人對話、基于NLP的知識問答和搜索、多模態知識圖譜生成、AIGC文生圖自動標注、畫作鑒真、長視頻拆條自動處理等。針對文化機構自有數據量多、但因大模型投入大而裹足不前,尹暉提出,專委會和華為云可以提供安全且自主可控的基礎設施平臺,保障數據端到端的安全處理,文化機構不需要投入巨額資金建立自己的算力存儲基礎設施和工具鏈,就可以使用自有數據擁有專業模型。在成員單位支持下,專委會已提供相關訓練數據集,華為云已完成數據清洗工作進入預訓練階段,即將進入評測調優階段。
圖為專委會專家組成員尹暉主旨發言
華為盤古大模型3.0包括三層結構,最底層對標通用大模型,稱之為基礎大模型(L0),這一層可以形象地理解為“讀萬卷書”,主要作用就是做好海量基礎知識的學習。在這一層之上是行業模型(L1)和場景模型(L2),可以稱作“行萬里路”。
圖為華為云盤古大模型產品總監周唐軍作主旨發言
華為云盤古大模型產品總監周唐軍介紹了華為盤古大模型及開發套件。盤古大模型基于華為云在行業上的實踐積累,與行業伙伴聯合創新了多個行業大模型,并取得了豐碩的應用成果。與專委會共創文化大模型,高質量文化領域數據對文化大模型的意義重大。面對文化領域的新場景、新應用,盤古大模型將深度賦能文化產業,更好地傳播優秀的中華文明!
圖為國家廣電總局信息中心王仝杰處長發言
在討論環節,參會負責人圍繞座談會主題發表看法和建議。國家廣電總局信息中心王仝杰處長表示,文化大模型將有助于解決視頻快速檢索、標簽標識提取、數據再利用等問題。
圖為國家圖書館出版社副社長葛艷聰發言
國家圖書館出版社副社長葛艷聰說,我們作為首批參與國家文化大數據體系建設的單位已從中獲益,我們非常愿意加入文化大模型的建設當中。首次見到為文化企業打造的大模型,這是專委會和華為云強強聯合。我們多年工作積累形成的優質數據可以用于文化大模型的訓練,同時也能對我們未來工作有所幫助,特別是為數據打標簽的效率和數據搜索效率都會提高。如何將古籍中優秀的傳統文化挖掘出來,服務于當下是我們一直努力的方向。
圖為中國數字文化集團有限公司大數據中心主任蔣鑒發言
中國數字文化集團有限公司大數據中心主任蔣鑒說中數原創數據和集成數據區別較大,集成的數據由于采集、封裝、存儲的標準不同,需要用很原始的人工操作對數據進行識別和標注,信息的正確率和工作效率都不能保證,有了文化大模型將會實現降本增效的目的。
圖為中央新影集團技術部關玥發言
中央新影集團技術部關玥表示,參加這次會議確實是受益匪淺,我們作為傳統文化企業,一直是以人工的方式進行數據標注標識,包括視頻的切分、識別工作等。文化大模型將為我們下一步的工作有很大啟發。目前我們在做國家典藏工程是對歷史珍貴膠片進行修復并轉成4K的數字化存儲后搭建數據平臺。該平臺是面向主流媒體和市場化新媒體的一個數據中心。文化大模型的視頻分類分割檢測模塊對我們來講是借鑒作用的,由于對影片內容要精準定位的緣故,我們目前用人工的方式,憑經驗識別領導人、年代、具體戰役、事件等,如果使用AI完成這項識別工作將能夠給我們達到事半功倍的效果。
圖為雅昌文化集團數據庫負責人李華發言
雅昌文化集團數據庫負責人李華表示,我們在標注、解構、重構方面都有相關的要求。在數據標注要做到完整準確,能夠跨內容地把相關數據及其關聯關系與數據來源的可信度一并標識,特別是對于敏感數據的標識可以準確標注。在圖像處理方面可以自動圖像校色修正,立體圖像可以更換背景或剔除雜物。在解構方面可以快速、準確地識別并解構圖片中的各種獨立對象、場景、事物、文字、印章、印鑒款識等常見特征內容等,作為新創作品的素材或組件。在圖像搜索方面,以相同圖片或聚類圖片,同一主題同一時間作品聚類,多模態的以圖搜圖、疑問選圖、疑問作圖、多圖重構等功能,我們希望參與共同開發文化大模型,期望文化大模型模塊盡快應用到企業,滿足業務需求。
圖為北京世紀超星信息技術發展有限責任公司北京分公司副總經理張靜發言
北京世紀超星信息技術發展有限責任公司北京分公司副總經理張靜表示,我們主要服務教育領域,內容準確性和意識形態安全性是我們審查的重點。這也是我們希望通過文化大模型解決的難題。
依次為:國家圖書館出版社有限公司編輯武永麗,北京郵電大學人工智能學院特聘副研究員曾智,江蘇省文化產權交易所有限公司文化大數據交易業務負責人季方超,甘肅省百草園文化科技有限公司副總經理張磊
依次為:南京文投集團CTO蔣華晨,長春出版傳媒集團有限責任公司數字出版中心主任趙宇鶴,上海創圖網絡科技股份有限公司董事長李欣,新華三技術有限公司解決方案經理喬傳義
依次為:海看網絡科技(山東)股份有限公司應用事業部總經理鄒方偉,山東出版數字融合產業研究院有限公司副院長范林海,北京未來媒體科技股份有限公司科技項目部總監武振華,深圳國夏文化數字科技有限公司董事長盧葦
依次為:成都九天星空科技有限公司副總經理郭夢潔,重慶永川大數據產業園開發管理有限公司副總經理許家永,廣州龍聯科技文化發展有限公司總經理張勇
其他與會人員也就文化大模型開發應用問題提出了意見和建議,尹暉和周唐軍同大家進行互動,就大家關心的問題一一解答,討論氣氛熱烈。
最后,專委會副主任高書生作小結,他說,聽完大家的熱烈討論,最深刻的印象是專委會和華為云聯創文化大模型這件事做對了,大家對文化大模型具有實實在在的需求,愿意貢獻數據完善文化大模型,對開發應用場景也有了比較明確的方向和構想,對文化大模型的發布充滿期待。高書生指出,聯創文化大模型不是趕時髦,是實施國家文化數字化戰略的必然結果,是文化傳承發展智能化的內在要求,也是維護意識形態和文化安全的技術保障。從文化數字化到文化大數據再到文化大模型,是符合邏輯的,將中華民族積淀了五千多年的文化資源,轉化為具有文化內涵的數據,成為文化大模型訓練數據,不僅可以補齊當下大模型訓練數據短缺的短板,而且破解了人工智能哺育什么人的難題,還能夠大幅提升文化機構的效率和效能。文化大模型具有領域寬、應用廣的特點,它涵蓋了宣傳文化系統,包括思想理論、文化旅游、文物、新聞出版、電影、廣播電視、網絡文化文藝等,中華文化全景呈現是最大的應用場景,包括線上和線下,文化教育設施和公共場所,只要有空間,都可以升級為文化體驗場所,都可以成為文化大模型的應用場景。
圖為專委會副主任高書生作小結
座談會后,高書生同華為云大模型生態崔斌總經理就推進下一步工作進行了深入溝通,并達成共識。
來源:伏羲云
關鍵詞: