主題專欄:城市數(shù)據(jù)治理
Research on the logic and realization path of data circulation led by data subject
陸志鵬
doi: 10.20044/j.csdg.2097-1788.2022.01.001
數(shù)據(jù)上升為全新的生產(chǎn)要素,發(fā)展數(shù)據(jù)要素市場、激活數(shù)據(jù)要素潛能成為全球各國在數(shù)字時代搶占競爭優(yōu)勢的關(guān)鍵抓手,但數(shù)據(jù)資源分散、流通壁壘林立,共享、開放以及交易等流通路徑面臨諸多困境難以破題,數(shù)據(jù)流通的長效機制研究亟待建立。通過深度剖析數(shù)據(jù)控制主體主導的數(shù)據(jù)流通體系,分析其面臨的困境及內(nèi)在原因,充分借鑒全球各國對數(shù)據(jù)流通新路徑的探索與實踐經(jīng)驗,提出了數(shù)據(jù)主體主導的數(shù)據(jù)流通新路徑,包括設(shè)計思路、基礎(chǔ)與支撐、實施路徑以及效益分析,為數(shù)據(jù)流通機制探索與模式創(chuàng)新提供參考。
Information pricing and trading:an application of dimensional model
李心宓1,吳 謠2,高 峰2
doi: 10.20044/j.csdg.2097-1788.2022.01.002
構(gòu)建了一個具有多維信息的模型,用于分析信息定價和交易,并根據(jù)模型討論了均衡性質(zhì)。分析結(jié)果表明,信息的公開可以增加社會福利。但若信息可以自由交易,市場參與者可能偏好不公開信息,此時社會福利可能受損。在信息定價方面,證明了在秘密信息交易中不對稱信息可能給不道德的信息賣方帶來額外的收入,這為信息立法方面的司法實踐提供參考。
Research on data classification and grading and its development path
張 敏,魏 偉,譚天怡,何 軼
doi: 10.20044/j.csdg.2097-1788.2022.01.003
數(shù)據(jù)分類分級管理是推動數(shù)據(jù)要素化發(fā)展工作的重要步驟之一。對美國、英國政府數(shù)據(jù)分類分級管理現(xiàn)狀開展研究,為我國數(shù)據(jù)分類分級管理工作提供借鑒。同時,從實際出發(fā),對國內(nèi)政府數(shù)據(jù)、公共數(shù)據(jù)、行業(yè)數(shù)據(jù)等分類分級工作進行梳理分析,總結(jié)得出目前仍存在數(shù)據(jù)分類分級工作標準不統(tǒng)一、核心數(shù)據(jù)和重要數(shù)據(jù)識別不清晰、行業(yè)對數(shù)據(jù)分類分級工作缺少深層認識等問題,并提出我國需要進一步完善數(shù)據(jù)分類分級的法律法規(guī)體系,健全政府數(shù)據(jù)分類分級管理組織體系,推進核心數(shù)據(jù)和重要數(shù)據(jù)的管理工作,加快研發(fā)數(shù)據(jù)分類分級的智能化工具,以此加快推進我國數(shù)據(jù)分類分級工作的開展與落實。
Research on supervising-oriented data checking mechanism: an analogical analysis perspective on production factors
張 楠1,2,周 亮1,刁 玉1
doi: 10.20044/j.csdg.2097-1788.2022.01.004
在數(shù)據(jù)作為生產(chǎn)要素價值釋放的進程中,監(jiān)管導向的數(shù)據(jù)稽查是兼顧數(shù)據(jù)增值的數(shù)據(jù)安全保障。然而,數(shù)據(jù)稽查的概念內(nèi)涵、基本原則和實施方式還亟待討論。對比土地、勞動力、資本、技術(shù)等傳統(tǒng)生產(chǎn)要素治理過程中的監(jiān)管模式和稽查手段,數(shù)據(jù)要素的共性和特性決定了數(shù)據(jù)稽查應具有方式具體、事后追究、對象明確和技術(shù)依賴的特征。在此基礎(chǔ)上形成的數(shù)據(jù)稽查機制架構(gòu)包括宏觀與微觀兩個層面,嵌入數(shù)據(jù)價值產(chǎn)生的過程,對數(shù)據(jù)稽查機制的進一步研究奠定了基礎(chǔ)。
Preliminary exploration on the construction of the metaverse legal system and data governance
胡 洋,洪 晟
doi: 10.20044/j.csdg.2097-1788.2022.01.006
2021年,元宇宙熱度持續(xù)上漲。目前元宇宙相關(guān)概念、標準尚未正式形成,底層技術(shù)不夠成熟,立法監(jiān)管空白,法制體系建設(shè)任務艱巨。對于交易在數(shù)據(jù)鏈上的元宇宙來說,數(shù)據(jù)治理問題更是其中不容忽視的一環(huán)。在此背景下,對元宇宙概念、相關(guān)技術(shù)和法律法規(guī)的研究現(xiàn)狀進行了分析,聚焦于元宇宙規(guī)則制定、責任主體確認、財產(chǎn)與交易、數(shù)據(jù)治理、犯罪治理等方面的核心法律問題。在未來,依托整個社會的有機配合,技術(shù)、法律、資本的共同支撐,元宇宙極有可能成為一個新的發(fā)展方向。
Research on legal regulation of the Big Data affinity
田 蕾,洪 晟
doi: 10.20044/j.csdg.2097-1788.2022.01.007
隨著大數(shù)據(jù)技術(shù)發(fā)展,“大數(shù)據(jù)殺熟”現(xiàn)象日益嚴重,侵害了消費者的諸多合法權(quán)益。針對該現(xiàn)象,在充分研究了其成因和目前規(guī)制困境的基礎(chǔ)上,提出了完善相關(guān)法律規(guī)制的建議,使大數(shù)據(jù)能夠更好地發(fā)揮其應有價值,有助于在互聯(lián)網(wǎng)平臺利益與消費者合法權(quán)益保護之間找到平衡點。
Exploration of public data authorization operation mechanism
陸志鵬
doi: 10.20044/j.csdg.2097-1788.2022.01.005
數(shù)字經(jīng)濟飛速發(fā)展帶來了公共數(shù)據(jù)體量的劇增。公共數(shù)據(jù)作為數(shù)據(jù)要素市場的重要資源,對于以授權(quán)運營為主要手段的公共數(shù)據(jù)開展增值性開發(fā)利用已成為普遍共識。但現(xiàn)實是,一方面,公共數(shù)據(jù)授權(quán)運營的法律邏輯尚未厘清,公共數(shù)據(jù)授權(quán)運營與公共數(shù)據(jù)承載的公共價值存在一定的沖突和背離;另一方面現(xiàn)有公共數(shù)據(jù)授權(quán)運營模式或帶來數(shù)據(jù)集中壟斷的風險或不能充分釋放數(shù)據(jù)融合應用所帶來的巨大價值。為此創(chuàng)新性地提出以數(shù)據(jù)元件為流通形態(tài)的新型公共數(shù)據(jù)授權(quán)運營路徑,在避免數(shù)據(jù)壟斷風險的同時,兼顧大規(guī)模交叉場景的應用,為公共數(shù)據(jù)的使用,真正服務于經(jīng)濟的高質(zhì)量發(fā)展和共同富裕提供有益探索。
綜述與評論
Hotspots analysis of sentiment research on Internet public opinion in China
張 楊1,廉吉慶2,張 揚1,高德毅3
doi: 10.20044/j.csdg.2097-1788.2022.01.008
以中國知網(wǎng)收錄的網(wǎng)絡輿情情感分析主題論文為數(shù)據(jù)來源,以文章摘要為詞源,借助TF-IDF方法提取關(guān)鍵詞并對關(guān)鍵詞進行共詞分析。結(jié)果顯示,目前國內(nèi)網(wǎng)絡輿情情感研究熱點包括對輿情信息內(nèi)容進行情感分析,對情感分析技術(shù)進行改進和創(chuàng)新,對輿情傳播過程中的各個要素進行情感分析等方面。所使用的共詞分析方法可以反映單個關(guān)鍵詞的熱門程度,對網(wǎng)絡輿情的科學分析和有效應對提供了理論指導,具有重要的參考價值。
網(wǎng)絡與信息安全
A rumor propagation model in the context of recommendation
吳日銘1,韓益亮1,郭凱陽1,李永斌2
doi: 10.20044/j.csdg.2097-1788.2022.01.009
隨著信息傳播方式的改變,通過信息推薦平臺的謠言信息傳播成為了謠言傳播的重要方式,構(gòu)建推薦模式下的謠言傳播模型對網(wǎng)絡謠言的治理具有積極作用。考慮到推薦機制對用戶的分割效應,在謠言傳播過程中根據(jù)人物相似性將網(wǎng)絡用戶劃分在不同的傳播域,定義了傳播域中用戶與信息的交互方式,提出了一種基于謠言信息熱度和平臺用戶密度的謠言傳播模型,并對影響謠言信息傳播的因素進行了仿真分析。通過仿真發(fā)現(xiàn):在推薦機制下,人們對信息的接受率主要是受信息本身影響;在推薦平臺上,增大謠言信息傳播閾值有利于阻止謠言的傳播;謠言的接受率越大,對辟謠信息的加入時間要求越高。
DoS attack method on Tor hidden service
楊歡樂,劉志天
doi: 10.20044/j.csdg.2097-1788.2022.01.010
Tor隱藏服務能保護服務提供方身份地址位置隱私。在分析Tor隱藏服務協(xié)議的基礎(chǔ)上,提出了針對隱藏服務進行DoS攻擊的策略。針對Tor隱藏服務發(fā)布、鏈路建立以及數(shù)據(jù)傳輸?shù)牟煌A段對隱藏服務目錄、引入節(jié)點、隱藏服務守衛(wèi)節(jié)點以及隱藏服務器等隱藏服務相關(guān)的網(wǎng)絡節(jié)點實施基于帶寬和內(nèi)存的DoS攻擊,達到降低隱藏服務可用性的目的。通過仿真實驗進行了攻擊驗證,實驗結(jié)果表明,對守衛(wèi)節(jié)點的DoS攻擊具有較好的攻擊效果,采用帶寬級別DoS攻擊,自定義構(gòu)建20個長路徑能夠消耗守衛(wèi)節(jié)點大約1.2 MB/s的帶寬資源,令普通用戶獲取隱藏服務的延遲時間中位數(shù)從9 s上升到30 s。采用內(nèi)存級別的DoS攻擊策略,敵手每構(gòu)建一個內(nèi)存級別的停止讀攻擊連接消耗大約60 KB/s的帶寬資源就能以6 MB/s的速率消耗守衛(wèi)節(jié)點內(nèi)存。
A method of finding cyber security user based on network representation learning
劉向宇,燕 瑋,孟星妤,侯開茂
doi: 10.20044/j.csdg.2097-1788.2022.01.012
發(fā)現(xiàn)社交媒體中的網(wǎng)絡安全用戶對于追蹤網(wǎng)絡安全動態(tài)有重要意義,針對這一特定領(lǐng)域用戶的發(fā)現(xiàn),提出了一種新的發(fā)現(xiàn)方法。首先利用社交媒體節(jié)點間的相互關(guān)注關(guān)系建立有向關(guān)系網(wǎng)絡,然后用網(wǎng)絡表示學習模型Node2vec生成節(jié)點的向量表示,并將收集到的網(wǎng)絡安全關(guān)鍵字轉(zhuǎn)化為特征向量,拼接后輸入分類算法進行預測。實驗結(jié)果表明,在社交媒體網(wǎng)絡安全數(shù)據(jù)集上,所提方法的預測準確率優(yōu)于現(xiàn)有的其他特定領(lǐng)域用戶發(fā)現(xiàn)算法。
Design and implementation of multipath security connection anti-replay attack based on FPGA
陳 明,張宏亮,鄧 軍,唐 文,龔 萍
doi: 10.20044/j.csdg.2097-1788.2022.01.013
重放攻擊是一種常見的網(wǎng)絡攻擊手段,為了提高網(wǎng)絡設(shè)備的安全性,提出一種基于FPGA實現(xiàn)抗重放攻擊的設(shè)計方案。結(jié)合工程實踐,首先介紹了安全連接通信原理,并詳細討論了抗重放實現(xiàn)機制,在此基礎(chǔ)上創(chuàng)造性提出多路安全連接并發(fā)抗重放設(shè)計方案。測試結(jié)果表明,該技術(shù)能夠滿足多路安全連接通信的同時實現(xiàn)抗重放的應用需求,而且實現(xiàn)協(xié)議簡單,數(shù)據(jù)吞吐率高,對工程實現(xiàn)有一定的借鑒意義。
Research of data sharing information system architecture based on endogenous security
李 建1,2,王 昊1,2,姜藶峰1,2,羅清林1,2,吳凡毅1,2,3
doi: 10.20044/j.csdg.2097-1788.2022.01.011
在研究了我國數(shù)據(jù)共享信息化發(fā)展的階段規(guī)律和相應架構(gòu)體系變遷的基礎(chǔ)上,結(jié)合我國數(shù)據(jù)治理法規(guī)標準體系要求和PKS自主計算體系發(fā)展現(xiàn)狀,研究在可信安全計算環(huán)境中數(shù)據(jù)不脫離數(shù)據(jù)擁有方的、可主動免疫的架構(gòu)設(shè)計原則、實現(xiàn)方案,包括底層可信的基礎(chǔ)軟硬件系統(tǒng),上層應用零信任的主動審計防御體系,以及“數(shù)據(jù)擁有方主導+數(shù)據(jù)交易第三方負責的可信網(wǎng)絡路由交換集中運維”的數(shù)據(jù)共享建設(shè)思路、建設(shè)內(nèi)容、實施路徑等。最后指出未來數(shù)據(jù)共享應用場景中可能面臨的新風險、新問題,并提出構(gòu)建符合法理要求和內(nèi)生安全理念的新一代信息化架構(gòu)體系的一些綜合建議。
智能算法
A global terrain height detection method based on elevation data
吳 瓊1,孫韶杰2,于 瀾1,蘇 迪1
doi: 10.20044/j.csdg.2097-1788.2022.01.014
在飛行模擬器訓練領(lǐng)域,很多分系統(tǒng)都需要實時獲取飛行位置的地形高度。基于衛(wèi)星影像高程數(shù)據(jù),提出了一個全球范圍的地形高度檢測方法。該方法將全球高程數(shù)據(jù)按度進行區(qū)域劃分和規(guī)范化命名,然后基于碰撞檢測的思想,從飛行當前位置垂直向下求取與地形面的交點,交點處的高程值即地形高度。針對不同采樣間距、不同分塊大小情況下的算法檢測效率進行了比較分析,實驗結(jié)果表明,該檢測方法能夠較好地滿足實時性和準確性要求。
A data augmentation method for online education sentiment analysis
黃偉強1,劉 海2,梁韜文2,楊海華2
doi: 10.20044/j.csdg.2097-1788.2022.01.015
在互聯(lián)網(wǎng)上大量主觀性的評論具有豐富的研究價值,可以通過對評論的分析獲取評論的情感極性。在對大量評論進行情感分析時,存在時間和人力消耗過多等問題,針對該問題,提出了基于聚類分析的文本數(shù)據(jù)擴充方法:在對少量關(guān)鍵數(shù)據(jù)進行標注的基礎(chǔ)上,通過聚類分析標注大量數(shù)據(jù),以減少情感分析在實際應用中的成本。以在線教育平臺的評論為例,對目前多個主流在線教育平臺上爬取的共569 970條中文評論數(shù)據(jù)進行少量標注,然后使用該方法進行數(shù)據(jù)擴充,最后基于目前多個主流機器學習模型和卷積神經(jīng)網(wǎng)絡模型進行情感分析訓練。研究結(jié)果表明,數(shù)據(jù)處理經(jīng)過聚類后取得較好的數(shù)據(jù)擴充效果,其中采用卷積神經(jīng)網(wǎng)絡模型進行的情感分析,準確度可以達到96.5%。
人工智能
Label embedding based multimodal multi-label emotion recognition
張 超,張信明
doi: 10.20044/j.csdg.2097-1788.2022.01.016
多模態(tài)情感分析目前是多模態(tài)分析和自然語言處理領(lǐng)域的研究熱點,在商品推薦、智能客服等場景中具有廣泛的應用。現(xiàn)有的方法在多標簽場景下對標簽間依賴性表示不充分,并且忽略了模態(tài)特征之間語義差距。對此提出了一種基于標簽嵌入的多模態(tài)多標簽情感識別算法,通過訓練的標簽嵌入向量捕獲標簽之間依賴關(guān)系,對模態(tài)特征添加約束減小模態(tài)之間的語義差距。實驗結(jié)果顯示,該算法在多模態(tài)多標簽情感識別任務中在準確率和漢明損失指標上相較于現(xiàn)有方法有明顯提升。
Multi-attention convolutional network for crowd counting
楊倩倩,何 晴,彭思凡,殷保群
doi: 10.20044/j.csdg.2097-1788.2022.01.017
針對實際場景中存在的人群非均勻分布問題,提出了一種基于多重注意力引導的人群計數(shù)算法。首先,基于輕量級金字塔切分注意力機制構(gòu)建了自頂向下的特征融合路徑,旨在促進高層語義信息和低層空間細節(jié)的融合,生成高級語義和空間細節(jié)兼?zhèn)涞母哔|(zhì)量特征圖;然后,提取并融合多尺度上下文信息,以此生成關(guān)注于不同密度分布模式的注意力權(quán)重圖;最后,通過注意力權(quán)重圖指導密度回歸網(wǎng)絡識別不同分布狀態(tài)下的行人目標,增強模型對密度變化的適應性,生成高質(zhì)量人群密度圖。在ShanghaiTech、UCF_QNRF和JHU-CROWD++三個數(shù)據(jù)集上進行了大量的實驗來說明所提算法的先進性。