基于社會媒體的市場行情預測方法研究.pdf_第1頁
已閱讀1頁,還剩131頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、以Facebook、Twitter、新浪微博為代表的社會媒體的迅猛發(fā)展,為觀察大眾的主觀世界提供了空前的數(shù)據(jù)支持,從而也為預測大眾的行為提供了新的手段。基于社會媒體的預測技術是指通過對社會媒體數(shù)據(jù)的挖掘與分析,看清事實真相,聚集大眾的群體智慧,運用科學的知識、方法和手段,對事物未來發(fā)展趨勢和狀態(tài)做出科學的估計和評價。準確的預測結果對于人類生活中的趨利避害,工作中的計劃決策起著至關重要的作用。一項決策的結果與該決策本身之間有著時間上的滯后

2、關系,“利”與“害”總是存在于未來的時間與空間之中,任何決策都不可避免地要依賴預測。通過對未來趨勢做出提前判斷,有利于適時地調整計劃,以及采取措施實施調控。
  然而,基于社會媒體的預測研究面臨著各種挑戰(zhàn),這其中包括了缺乏清晰的問題定義和界限劃分的挑戰(zhàn);社會媒體中群體智慧的挖掘以及文本語義理解不夠深入的挑戰(zhàn)以及預測模型較為簡單,主要依靠線性回歸模型,對非線性系統(tǒng)預測能力有限的挑戰(zhàn)。本文主要針對這三個挑戰(zhàn)進行了研究,并對市場行情預測

3、中的電影票房預測和股市漲跌預測進行探索,分別從社會媒體文本中抽取用戶消費意圖信息和客觀的事件報道作為特征進行預測。具體而言,本文的主要研究內容可概括為以下幾個方面:
  1.本文提出了隱式消費意圖挖掘任務,并構造基于領域自適應的卷積神經網(wǎng)絡模型自動識別社會媒體中的隱式消費意圖,在此識別結果基礎上推薦用戶意圖相關產品以期滿足其消費需求。具體而言,給定一條微博文本,首先基于領域自適應的卷積神經網(wǎng)絡模型做二元分類,判斷其是否含有用戶消費

4、意圖;隨后,對于有消費意圖的微博文本再抽取其中的需求詞,最后,根據(jù)該需求詞去事先構造好的消費意圖事理圖譜中檢索可以滿足消費意圖的產品推薦給用戶。本文構建了母嬰領域和電影票房領域的語料,實驗結果表明:(1)本文提出的領域自適應方法可以有效克服訓練語料少帶來的消費意圖識別效果不理想的問題;(2)推薦給用戶的意圖相關全部產品中有60%左右的產品可以滿足用戶的消費需求。
  2.本文提出基于消費意圖的電影票房預測模型?;谙M意圖理解的電

5、影票房預測相對于傳統(tǒng)的電影票房預測而言,可以說是站在一個全新的角度進行研究,為此能夠給預測工作帶來兩方面的優(yōu)勢:(1)電影上映前就可以采集到大量的民眾反饋數(shù)據(jù);(2)可以大規(guī)模的獲取與電影票房高低最相關的影響因素:大眾是否愿意觀看某部電影。在此特征基礎上,本文提出了高斯連接函數(shù)回歸模型作為預測方法,該方法不需要對輸入數(shù)據(jù)進行任何獨立同分布假設,且能夠分析輸入數(shù)據(jù)之間的相互作用關系。本文在中國電影市場和美國電影市場均做了實驗對比分析,結果

6、表明本文提出的方法與傳統(tǒng)的基于線性回歸模型和支持向量回歸模型的方法相比都取得了更加優(yōu)異的表現(xiàn)。
  3.本文提出一套面向預測的事件定義,事件抽取和事件表示學習方法。該方法既克服了特定域事件抽取需要預先指定事件類型和標注大量訓練語料的費時費力的問題,又解決了開放域事件抽取很難進行事件歸一化,判斷事件類型的問題。本文提出的方法利用張量神經網(wǎng)絡模型以開放式事件抽取結果作為輸入,通過張量對事件元組之間的關系進行建模學習并最終輸出低維、稠密

7、、實數(shù)值的事件向量。對于相似的事件,其在同一向量空間上距離也相近。實驗結果表明,本文提出的事件抽取和表示方法與基線方法相比能夠更加準確地表示客觀事件。
  4.本文提出了基于卷積神經網(wǎng)絡的預測模型,該模型利用開放式事件抽取并泛化得到的事件向量作為輸入特征。該模型將輸入事件劃分成長期事件,中長期事件和短期事件,并利用卷積層神經結點將長期和中長期事件進行建模學習,抽取其中最重要的事件特征并分別表示合成一個向量。隨后,卷積神經網(wǎng)絡中的隱

8、含層結點建模學習事件特征向量與股市漲跌之間的隱含復雜關系,最終輸出股市漲跌的預測結果。實驗結果表明,本文提出的方法比當前最好的股市漲跌預測方法在準確率指標上能夠提升4個百分點。
  總之,本文一方面致力于解決基于社會媒體的信息抽取相關問題,另一方面致力于預測模型的構建工作,以期能夠充分利用好抽取到的有用信息,將其最終應用到以電影票房和股市漲跌為代表的市場行情預測任務上。本研究取得了一些初步的成果,期待這些成果能為本領域的其他研究者

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論