培訓受眾:
大數(shù)據(jù)研究者,大型企業(yè)公司,網(wǎng)絡工作者
課程收益:
深入詳細的分析大數(shù)據(jù),結合實際分析大數(shù)據(jù)與商業(yè)結合。
課程大綱:
任務0
1. 大數(shù)據(jù)的定義,科學發(fā)展淵源;
2. 如何科學看待大數(shù)據(jù)?
3. 如何把握大數(shù)據(jù),分別從“知著”、“顯微”、“曉義”三個層面闡述科學的大數(shù)據(jù)觀.
任務1
1. 大數(shù)據(jù)與云計算;
2. 私有云計算平臺經(jīng)濟的解決方案:如何集成OpenStack,Xen,Hadoop,MongoDB,Nutch等開源項目搭建最經(jīng)濟的云計算
平臺,實現(xiàn)大數(shù)據(jù)的基礎技術架構平臺
3. 大數(shù)據(jù)存儲架構、大數(shù)據(jù)并行計算平臺、大數(shù)據(jù)應用系統(tǒng)構建。
任務2
1. 通用搜索引擎與大數(shù)據(jù)垂直業(yè)務的矛盾
2. 大數(shù)據(jù)精準搜索的基本技術:快速增量在線倒排索引、結構化與非機構化數(shù)據(jù)融合、大數(shù)據(jù)排序算法、語義關聯(lián)、自動緩存與優(yōu)化機制;
3. 大數(shù)據(jù)精準搜索語法:鄰近搜索、復合搜索、情感搜索、精準搜索;
4. 大數(shù)據(jù)精準搜索應用案例:中國郵政搜索、國家標準搜索、內網(wǎng)文檔搜索、輿情搜索;
任務3
1. 語義理解基礎:ICTCLAS與漢語分詞
2. 內容關鍵語義自動標引與詞云自動生成;
3. 大數(shù)據(jù)聚類;
4. 大數(shù)據(jù)分類與信息過濾;
5. 大數(shù)據(jù)去重、自動摘要;
任務4大數(shù)據(jù)搜索與挖掘平臺工具實訓
1. 學員采用大數(shù)據(jù)搜索與挖掘進行實戰(zhàn)演練
2. 大數(shù)據(jù)與新型電子商務
3. 電子商務基于大數(shù)據(jù)技術的推薦系統(tǒng)
4. 電商如何應對大數(shù)據(jù)時代的挑戰(zhàn)?
任務5
1. 電子政務平臺的大數(shù)據(jù)特性
2. 公文的主題詞自動標引
3. 北京外事辦典型電子政務平臺的大數(shù)據(jù)應用案例分享
任務6
1. 微博大數(shù)據(jù)宏觀特性挖掘
2. 微博微觀行為建模
3. 微博大數(shù)據(jù)監(jiān)控系統(tǒng)應用案例