進入大數據的真實世界-數據挖掘入門和應用
主講老師: 林海(深圳) 查看講師詳情>>
工作背景:
高端前沿技術培訓/業務創新咨詢師
TOGAF9Level2鑒定師
國際數據管理(DAMA)協會會員
全球企業架構師協會(AEA)會員
中國企業數據治理聯盟會員
Hiblock區塊鏈社區專職講...
主講課程:
1.區塊鏈培訓:《區塊鏈技術沙盤推演和商業模式重構》
2.大數據培訓:《大數據思維演變和商業模式創新》
3.企業架構培訓:《企業架構方法(TOGAF9)和信息化頂層設計》
4.財務共...
進入大數據的真實世界-數據挖掘入門和應用課程大綱詳細內容
課程分類: 大數據
課程目標:
課程對象:
課程時間:1天
課程大綱:
第一單元思維轉變:從報表統計思維進入數據分析思維
一、入門:數據是對“事實”的觀測
二、轉變:數據思維意味著什么
1、主動找數據變為被動推薦
2、抽樣數據變為全集數據
3、要求精確變為歡迎復雜
4、事后分析變為實時監控
5、專家分析變為機器學習
6、由流程為核心變為以數據為核心
7、由客戶分類變為個性化服務
8、由人與人連接變為人與機器連接
第二單元認知重構:進入模型和算法統治的世界
一、數據分析三大核心模型
1、分類:真與假;好與壞;高、中、低。不會分類,就不會思考
2、預測:輸入變量,求得結果。代表了掌握規律的能力,生活是可預知的
3、相關性:模糊、近似、有關,是一種簡便的、粗略的全盤操控能力
二、五大初級算法
1、相關性分析:最入門、最常用、最剛需的分析方法
2、散點圖分析:最被忽略的探索性分析方法
3、概覽性分析:教科書上都不重視的全局總覽的分析方法
4、回歸分析:最容易理解的由x推導出y的方程式分析法
5、聚類分析:最粗暴的物以類聚人以群分的分析方法
三、六大中級算法
1、降維分析:數據太多,抓住主要數據的方法
2、決策樹分析:最容易理解的決策分析
3、關聯規則分析:貌似沒有規模,卻可以尋找一個規律
4、相似性分析:當前最熱門的分析方法,如:人臉識別、指紋識別
5、可視化分析:河流圖、風向圖、熱力圖等各種別具一格的數據呈現方式
6、文本分析:從大量的文字中快速提取關鍵信息
1、神經網絡算法:最牛逼的模擬大腦的算法,如埃爾法狗圍棋
2、支持向量機算法:實用性和準確性較強的一個機器學習算法
第三單元操作實戰:從代碼中觀測到的“真實”世界
一、學會用數據分析創新性的解決問題
1、What:問題是什么
2、Judgement:能用數據分析解決嗎
3、Prerequisite:具備數據基礎嗎
4、ModelSelect:選擇哪個模型
5、Visualization:怎么呈現結果
6、Design:設計流程,形成文檔
二、學會用代碼去測試和逼近真相
1、數據獲?。▽霐祿?、爬取數據)
2、數據探索分析、概覽分析
3、明確分析目的
4、選擇x和y
5、對格式進行轉換
6、選擇模型(模型選擇準則)
7、使用交叉驗證規則,切分數據
8、用模型進行訓練
9、分析模型預測結果
10、確定最優模型
11、使用和預測
12、報告和呈現