速聯(lián)科技?10年專注企業(yè)通信
電銷系統(tǒng)
發(fā)布時(shí)間:2021-07-05 點(diǎn)此:987次
湛江電銷不封號(hào)系統(tǒng)怎么辦理,了解湛江電銷不封號(hào)系統(tǒng),咨詢湛江電銷不封號(hào)系統(tǒng)
電銷防封系統(tǒng),專為電銷企業(yè)定制的封號(hào)解決方案
支持批量外呼,無(wú)高頻,雙備份線路
實(shí)體號(hào)碼呼出,引入電話保護(hù)機(jī)制
從源頭降低封號(hào)風(fēng)險(xiǎn)!!!

基于中文環(huán)境的微博與基于英文環(huán)境的Twitter在語(yǔ)言表達(dá)習(xí)慣上存在著很大的差異,因此用于微博文本的情感分析工具與Twitter平臺(tái)上的情感分析相比有很大不同。劉智等人從集成學(xué)習(xí)的角度出發(fā),設(shè)計(jì)了一種基于樣本空間動(dòng)態(tài)劃分的機(jī)制,在此機(jī)制上構(gòu)建了微博文本情感分類器,通過(guò)實(shí)驗(yàn)實(shí)現(xiàn)了大規(guī)模評(píng)論集的情感分析以及用戶觀點(diǎn)挖掘[9]。史偉等人提出了一種基于KBANN的情感分析方法來(lái)解決沒(méi)有情感關(guān)鍵詞存在的文本,通過(guò)構(gòu)建隱性知識(shí)來(lái)推測(cè)文本的情感狀態(tài)[10]。眾多研究學(xué)者為微博話題發(fā)現(xiàn)和輿情文本情感分析注入了新的研究方法和思想理念。而基于多源數(shù)據(jù)挖掘與融合來(lái)研究輿情文本情感與輿情演化規(guī)律的研究很少。故本文從多源數(shù)據(jù)角度出發(fā),利用文本情感分析技術(shù),對(duì)不同數(shù)據(jù)源中的網(wǎng)絡(luò)輿情情感狀況進(jìn)行分析,實(shí)現(xiàn)對(duì)網(wǎng)民情感的挖掘,為網(wǎng)絡(luò)輿情的引導(dǎo)和控制提供有益借鑒。
(一)數(shù)據(jù)源選取。在中文語(yǔ)言環(huán)境中,輿情案例的數(shù)據(jù)源一般都來(lái)自新浪微博。它是一個(gè)為大眾提供信息交流共享和娛樂(lè)休閑的平臺(tái)。據(jù)央視財(cái)經(jīng)統(tǒng)計(jì),截止2020年第三季度,微博的月活躍用戶數(shù)達(dá)5.11億。因此,以新浪微博為數(shù)據(jù)源進(jìn)行的研究具有一定的代表性。
(二)數(shù)據(jù)采集。在明確研究對(duì)象和數(shù)據(jù)來(lái)源后,要對(duì)輿情案例的相關(guān)數(shù)據(jù)進(jìn)行采集。根據(jù)新浪微博平臺(tái)的數(shù)據(jù)開(kāi)放程度和網(wǎng)頁(yè)結(jié)構(gòu)特點(diǎn),采用Python軟件通過(guò)網(wǎng)絡(luò)爬蟲(chóng)的方式獲取文本數(shù)據(jù),并且有針對(duì)性的編寫(xiě)Python腳本抓取微博文本數(shù)據(jù)。利用新浪微博的高級(jí)搜索功能,選定時(shí)間范圍為2019年3月1日到2019年8月30日,以“經(jīng)貿(mào)磋商”為搜索關(guān)鍵詞,編寫(xiě)Python爬蟲(chóng)程序進(jìn)行數(shù)據(jù)采集,采集的主要字段包括:用戶名、發(fā)布內(nèi)容、發(fā)布時(shí)間。共采集到17436條微博文本數(shù)據(jù)。
(三)數(shù)據(jù)預(yù)處理。由于微博平臺(tái)具有大眾化,不受任何的時(shí)空限制,靈活度較高的特點(diǎn),用戶在發(fā)表博文的過(guò)程中,不會(huì)受到文字格式的約束,因此文本內(nèi)容中往往包含大量噪聲數(shù)據(jù),如網(wǎng)址HTML標(biāo)簽、話題標(biāo)簽、無(wú)用的表情符號(hào)等。這些噪聲數(shù)據(jù)對(duì)文本的分詞和詞頻統(tǒng)計(jì)都會(huì)造成影響,所以在數(shù)據(jù)預(yù)處理階段要對(duì)這些無(wú)意義的信息進(jìn)行清洗。使用正則表達(dá)式對(duì)文本內(nèi)容數(shù)據(jù)進(jìn)行清洗,刪除重復(fù)的文本數(shù)據(jù),刪除@、數(shù)字、無(wú)用網(wǎng)址、表情等無(wú)關(guān)內(nèi)容,提取文本內(nèi)容,再將清洗后的數(shù)據(jù)進(jìn)行分詞處理,利用python中的JIEBA分詞工具包,對(duì)文本內(nèi)容逐條進(jìn)行分詞,去除停用詞、標(biāo)點(diǎn)符號(hào)等無(wú)意義的詞。對(duì)處理好的數(shù)據(jù)進(jìn)行高頻詞統(tǒng)計(jì)并繪制詞云圖,其結(jié)果如表1和圖1所示。數(shù)據(jù)來(lái)源:根據(jù)采集的微博文本數(shù)據(jù)統(tǒng)計(jì)整理而得。由高頻詞可以看出,網(wǎng)民支持國(guó)家做出的決定,紛紛為國(guó)家加油打氣,表示中國(guó)絕不會(huì)被此事件嚇倒,此事件的發(fā)生會(huì)讓國(guó)家變得越來(lái)越強(qiáng)大,不畏懼對(duì)方提出的挑戰(zhàn),表現(xiàn)出了網(wǎng)民的愛(ài)國(guó)主義情懷。