大數(shù)據(jù)體系會議論文選登
Social media account classification based on multimodal feature fusion
湯智偉,明 楊,費高雷,翟學(xué)萌,胡光岷
doi: 10.19358/j.issn.2097-1788.2023.10.001
社交媒體賬號分類方法從賬號的屬性信息出發(fā),通過構(gòu)建賬號特征從而對賬號進(jìn)行分類,對從海量社交媒體數(shù)據(jù)中挖掘有價值的信息具有十分重要的作用。現(xiàn)有社交媒體賬號分類一般基于用戶發(fā)布的信息提取特征,存在賬號信息描述不完整、分類有效性低的問題。針對上述問題,提出了一種基于多模態(tài)特征融合的社交媒體賬號分類方法。該方法綜合考慮賬號自身屬性、文本以及賬號之間的社交關(guān)系等信息,使用張量分析的方法對賬號所表現(xiàn)的多模態(tài)特征進(jìn)行融合。相比現(xiàn)有方法,所提方法可以更好地利用賬號的各種信息,獲得更好的分類效果。通過實驗,所提方法準(zhǔn)確率達(dá)到了93.74%。
Research on highresolution remote sensing image segmentation model
劉姝妍,何 柳,陶 劍,卓雨東,王浩東
doi: 10.19358/j.issn.2097-1788.2023.10.002
高分辨率遙感影像往往蘊含著豐富的地物信息、復(fù)雜的拓?fù)潢P(guān)系和多變的目標(biāo)對象,給復(fù)雜環(huán)境下情報識別與分析帶來了挑戰(zhàn)。為了高效、快速、精確地獲取到遙感圖像中的關(guān)鍵信息,在主流圖像分割的編碼-解碼模式的基礎(chǔ)上,提出了一種全新的遙感圖像分割方法,內(nèi)部引入了多種注意力機(jī)制以及多尺度的特征表示結(jié)構(gòu),增強(qiáng)了對遙感圖像的解譯能力,提升了最終的目標(biāo)分割效果。在公開數(shù)據(jù)集上的實驗表明,所提方案可以在保持低參數(shù)量的情況下,明顯優(yōu)于其余基線方法。
Mixed preference analysis federated recommendation framework
宋雨倫,李大中,張絲雨,莊 媛,崔玲龍,王功舉,閆 龍
doi: 10.19358/j.issn.2097-1788.2023.10.003
針對基于內(nèi)容推薦算法存在過擬合及過度專業(yè)化問題,提出了一種混合個體及群體偏好分析的聯(lián)邦推薦框架,該框架包含三個模塊:基于隨機(jī)森林的偏好分析模塊、基于聯(lián)邦的相似興趣用戶分群模塊、基于混合偏好分析的推薦模塊。在基于隨機(jī)森林的偏好分析模塊中,提出考慮組合因素的同一屬性間偏好度分析和結(jié)合信息熵的不同屬性間在意度分析方法,通過糾正與真實興趣屬性具有強(qiáng)關(guān)聯(lián)性的非興趣屬性影響,初步解決了算法的過擬合問題;在基于聯(lián)邦的相似興趣用戶分群模塊和混合偏好分析的推薦模塊中,通過基于聯(lián)邦的相似興趣用戶分群模塊和群體的同屬性異屬性分析,得到用戶所在興趣群體的同屬性異屬性偏好信息,并通過網(wǎng)格遍歷群體和個體的超參權(quán)重混合進(jìn)行資源推薦,解決了推薦系統(tǒng)存在的過度專業(yè)化問題,提高算法在特定任務(wù)上的表現(xiàn)。實驗結(jié)果表明所提算法相較于隨機(jī)森林算法在各方面指標(biāo)上有明顯提升,且提高了推薦系統(tǒng)的可解釋性。
Research on data management architecture and application based on metadata separation
周俊鵬,任德旺,倪 鑫,李麗娜,李亞暉,李運喜
doi: 10.19358/j.issn.2097-1788.2023.10.004
針對現(xiàn)有嵌入式工業(yè)計算設(shè)備的數(shù)據(jù)分散、管理不足等問題,提出了一種基于元數(shù)據(jù)分離的數(shù)據(jù)管理體系結(jié)構(gòu)。融合數(shù)據(jù)特性需求,設(shè)計了一種數(shù)據(jù)統(tǒng)一標(biāo)準(zhǔn)化處理的規(guī)則庫,構(gòu)建了元數(shù)據(jù)信息組織模型、索引存儲結(jié)構(gòu)及標(biāo)準(zhǔn)格式的數(shù)據(jù)文件,實現(xiàn)了數(shù)據(jù)文件與元數(shù)據(jù)分離存儲的管理模式,將數(shù)據(jù)文件存儲至索引目錄磁盤,元數(shù)據(jù)信息實時寫入時序數(shù)據(jù)庫。初步開發(fā)了數(shù)據(jù)管理的應(yīng)用原型系統(tǒng),提升以元數(shù)據(jù)模型為基準(zhǔn)的數(shù)據(jù)分級組織管理能力,實現(xiàn)數(shù)據(jù)互聯(lián)互通,提高以業(yè)務(wù)為導(dǎo)向的數(shù)據(jù)管理應(yīng)用服務(wù)效能。
Research on the evaluation and analysis method of radar power range based on multisource data fusion
劉鎮(zhèn)瑜,林 歡,燕明亮,李詠晉,陳 磊
doi: 10.19358/j.issn.2097-1788.2023.10.005
傳統(tǒng)意義上,由于無法找到大量獨立同分布的樣本,雷達(dá)威力范圍評估分析是小樣本問題。從雷達(dá)威力范圍方程出發(fā),分析其中和雷達(dá)本身工作狀態(tài)、參數(shù)密切相關(guān)的個性因素,以及和雷達(dá)本身無關(guān)的目標(biāo)環(huán)境、氣象環(huán)境、操作使用等共性因素,對不同因素分別進(jìn)行處理,形成能夠關(guān)聯(lián)不同雷達(dá)測試數(shù)據(jù)的雷達(dá)威力范圍方程。分析整理歷史上目標(biāo)雷達(dá)截面積數(shù)據(jù),確定其分布規(guī)律;結(jié)合雷達(dá)測試數(shù)據(jù)分析共性因素的分布規(guī)律;確定雷達(dá)威力范圍的分布規(guī)律,給出雷達(dá)威力范圍的點估計和區(qū)間估計。經(jīng)過試驗分析,所提方法與其他相關(guān)方法相比有較好的優(yōu)越性。
網(wǎng)絡(luò)與信息安全
Detection of malicious encrypted network traffic based on temporal and spatial principal component analysis
孟 楠,周成勝,趙 勛,王 斌,姜喬木
doi: 10.19358/j.issn.2097-1788.2023.10.006
惡意加密流量檢測對關(guān)鍵信息基礎(chǔ)設(shè)施的可靠運行至關(guān)重要,也是應(yīng)對DDoS攻擊等網(wǎng)絡(luò)威脅的有效手段。利用時空主成分分析技術(shù),構(gòu)建了時間維度和空間維度的網(wǎng)絡(luò)流量變化模型,實現(xiàn)惡意加密流量的實時檢測和追蹤溯源。在時間維度,利用歷史積累的網(wǎng)絡(luò)流量監(jiān)測信息進(jìn)行主成分分析,構(gòu)建瞬時流量預(yù)測模型與實際監(jiān)測流量之間的平方預(yù)測誤差,判定網(wǎng)絡(luò)中出現(xiàn)惡意加密流量的時刻。在空間維度,利用歷史積累的各國家和地區(qū)的網(wǎng)絡(luò)流量監(jiān)測數(shù)據(jù),構(gòu)建區(qū)域流量預(yù)測模型與實際監(jiān)測流量之間的平方預(yù)測誤差,對惡意加密流量的來源地進(jìn)行追蹤溯源。最后,設(shè)計了一種可用于現(xiàn)網(wǎng)部署的算法實現(xiàn)流程,并分析了相比其他已有算法帶來的能力提升。
Research on blockchain access control methods based on policy and attribute hiding
楊志謀,文 強(qiáng),張 帥,張功國,孫 銳
doi: 10.19358/j.issn.2097-1788.2023.10.007
針對訪問控制過程中缺乏對用戶隱私保護(hù)的問題,提出了一種基于策略和屬性隱藏的區(qū)塊鏈訪問控制方案。首先,基于Hyperledger Fabric平臺編寫訪問請求、屬性管理和策略管理鏈碼,搭建基本的基于屬性的訪問控制模型,實現(xiàn)了細(xì)粒度的訪問控制。其次,使用AES對稱加密算法和屬性基加密算法將資源進(jìn)行加密存儲,再將存儲地址和資源哈希上傳到區(qū)塊鏈上,確保數(shù)據(jù)的安全性和完整性。最后,使用Paillier同態(tài)加密算法將用戶屬性和訪問策略加密并上傳到區(qū)塊鏈上,確保訪問過程中用戶的隱私安全。通過方案對比和仿真實驗說明了本文方案能夠有效保護(hù)用戶的隱私。
Design of a multi-to-multi electronic voting scheme based on homomorphism
霍珊珊,李艷俊,劉 健,羅昕銳
doi: 10.19358/j.issn.2097-1788.2023.10.008
電子投票方案通常基于安全多方計算、盲簽名、同態(tài)加密和秘密共享等密碼學(xué)技術(shù)設(shè)計,并通過網(wǎng)絡(luò)實現(xiàn)。與傳統(tǒng)的投票方案相比,各個角色的隱私得到了更好的保護(hù),投票和計票過程更安全高效。基于Paillier密碼的同態(tài)性設(shè)計了多對多的電子投票方案,采用預(yù)計算三元組的方式在不解密選票的情形下對贊同、棄權(quán)、反對選項進(jìn)行合規(guī)性判斷;然后通過密碼同態(tài)性合成總投票、計票中心解密后便能夠從m個候選人中選出t個勝出者;最后證明了方案的正確性和安全性,并分析了方案實現(xiàn)需要的通信代價和投票人、可信中心以及計票員的計算量。方案整體實現(xiàn)效率高,適用于大型電子投票的場合。
數(shù)據(jù)治理
Research on interest measurement in competition law regulation of data capture behavior
聶 童
doi: 10.19358/j.issn.2097-1788.2023.10.009
數(shù)據(jù)是數(shù)字市場競爭格局形成中的核心要素,然數(shù)據(jù)抓取作為獲得數(shù)據(jù)要素的重要手段卻備受爭議。數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,利益衡量這種古老的解釋方法,對于數(shù)據(jù)抓取行為的競爭法規(guī)制仍然具有較強(qiáng)回應(yīng)性。從利益衡量的角度出發(fā),以平臺經(jīng)營者利益、消費者利益及社會公共利益的多元利益維度展開,判斷其各方主體的利益沖突實質(zhì)和利益的屬性。利益衡量為數(shù)據(jù)抓取行為的競爭法規(guī)制勘定邊界,亦為數(shù)據(jù)要素市場的建設(shè)提供價值序位考量,并暗含解決數(shù)據(jù)抓取行為這一復(fù)雜問題的指向,即建設(shè)統(tǒng)一的數(shù)據(jù)要素市場。
計算法學(xué)
Tort liability of companion AI platforms in the era of attention economy
唐 婧
doi: 10.19358/j.issn.2097-1788.2023.10.010
注意力經(jīng)濟(jì)背景下,傳統(tǒng)技術(shù)中立理論受到?jīng)_擊。在侵權(quán)責(zé)任規(guī)制上,應(yīng)為具有情感連接功能的陪伴式人工智能平臺找尋新的規(guī)制路徑。這一路徑不應(yīng)完全脫離當(dāng)前以過錯責(zé)任為主的侵權(quán)責(zé)任體系,但由于陪伴式人工智能平臺的算法可能引發(fā)廣泛且嚴(yán)重的損害,因此在規(guī)制的整體態(tài)度上,保持相對嚴(yán)格的歸責(zé)傾向;而在具體的司法實踐中,以舉證責(zé)任倒置等方法補足直接運用過錯責(zé)任的缺陷,并對未來建立陪伴式人工智能平臺的通用規(guī)則持樂觀態(tài)度。
The exploration of trade secrets protection path of corporation data pool
胡浩翔
doi: 10.19358/j.issn.2097-1788.2023.10.011
“數(shù)據(jù)池”是數(shù)據(jù)生產(chǎn)要素的重要表現(xiàn)形式,對促進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展、推動產(chǎn)業(yè)轉(zhuǎn)型具有積極作用。但我國目前缺乏數(shù)據(jù)權(quán)利基礎(chǔ)制度,著作權(quán)法和數(shù)據(jù)共享協(xié)議都未能對數(shù)據(jù)池提供全面的法律保護(hù)。此種情況下,可以通過商業(yè)秘密相關(guān)法律規(guī)范對數(shù)據(jù)池予以保護(hù),但數(shù)據(jù)池必須滿足商業(yè)秘密的秘密性、價值性和保密措施構(gòu)成要件。在分析數(shù)據(jù)池秘密性構(gòu)成要件時,應(yīng)當(dāng)重點認(rèn)識公開信息形成的新信息可以具有秘密性,企業(yè)間數(shù)據(jù)池共享的行為也不會使其喪失秘密性。
Unveiling the "algorithmic veil": reflection on building an algorithmic interpretation framework
劉 燁
doi: 10.19358/j.issn.2097-1788.2023.10.012
如何解決算法可解釋性問題是算法治理中的一個重要法律議題,囿于算法使用者與受眾之間不斷擴(kuò)大的“解釋鴻溝”,現(xiàn)階段算法解釋困境存在于算法運行、決策形成到應(yīng)用的過程之中,具體體現(xiàn)在數(shù)據(jù)識別的失衡、證明依據(jù)的不足和損害結(jié)果的泛化三方面。考慮到不同算法運用場域之下解釋需求的差異,借助體系思維構(gòu)建起算法解釋框架,或?qū)⒊蔀榻鉀Q可解釋性問題的突破口。以解釋對象為邏輯起點將解釋方法劃分為定向告知、公開披露和行政報備三種模式,并基于“場景公正”理念將其應(yīng)用于醫(yī)療、信息推薦、金融等領(lǐng)域,針對不同業(yè)務(wù)和場景區(qū)分可解釋性程度和標(biāo)準(zhǔn),以期實現(xiàn)算法可解釋。
行業(yè)應(yīng)用
Research on data security sharing technology of the legal inspection department based on blockchain
湯雪珂,蔡全旺,汪慧君
doi: 10.19358/j.issn.2097-1788.2023.10.013
針對法院、檢察院和司法行政機(jī)關(guān)等單位傳遞與共享案件數(shù)據(jù)過程中面臨的身份偽冒、監(jiān)管困難、隱私泄露和數(shù)據(jù)濫用等安全風(fēng)險,提出一種基于區(qū)塊鏈技術(shù)的法檢司數(shù)據(jù)安全共享模型。通過模擬實驗,驗證了模型的可行性,并且對基于區(qū)塊鏈的法檢司數(shù)據(jù)安全共享涉及的混合加密技術(shù)、可信計算技術(shù)、數(shù)據(jù)共享管控智能合約以及基于區(qū)塊鏈的跨域身份認(rèn)證技術(shù)進(jìn)行了闡述,以期提升數(shù)據(jù)資源共享環(huán)節(jié)的安全防護(hù)能力。
Research on the application of road zero trust security based on dual mode single packet authorization
陳 瑜,殷 浩,姚 蕾,馮 鼎,管浩杰,嚴(yán) 浩
doi: 10.19358/j.issn.2097-1788.2023.10.014
針對交通信息系統(tǒng)工程具有接入范圍復(fù)雜、網(wǎng)絡(luò)安全風(fēng)險大的特點,提出了公路全面零信任系統(tǒng)架構(gòu)。該架構(gòu)主要由網(wǎng)關(guān)管理平臺、可信身份管控平臺等6個平臺組成。重點研究了基于網(wǎng)關(guān)管理平臺的安全交互過程,一是實現(xiàn)多物理環(huán)境下自動路由策略;二是研究雙模SPA敲門機(jī)制,重點分析UDP認(rèn)證和TCP敲門數(shù)據(jù)訪問。依托智慧農(nóng)路系統(tǒng)工程,評估了應(yīng)用前后安全訪問的效果和效率。研究結(jié)果表明,公路零信任系統(tǒng)可在國產(chǎn)芯片Loongson3A4000上運行;雙模單包授權(quán)SPA技術(shù)在UDP SPA基礎(chǔ)上拓展了TCP SPA能力,比單模SPA訪問速率快50%;在滿足三級等保控制點的基礎(chǔ)上可實現(xiàn)網(wǎng)絡(luò)隱身。