為企業提供專業化企業內訓服務

            常規企業內訓課程常年優惠中,課程費用最低,歡迎咨詢
            網站首頁 >企業內訓 >公司管理 >華為學習 >Python實現大數據挖掘技術培訓

            Python實現大數據挖掘技術培訓

            主講老師: 傅一航    查看講師詳情>>


            工作背景:
            大數據專家。 在華為工作十年, 五項國家專利, 在華為工作期間獲得華為數項獎項, 曾在英國、日本、荷蘭等海外市場做項目, 對大數據技術有深入的研究。 計算機軟件與理論碩士研究生(研究方向:數據挖掘、搜索引擎)...

            主講課程:
            董事長總經理高管的課程: 《數字化戰略與數字化變革》 《大數據思維與應用創新》 《大數據思維與商業模式創新,賦能企業增長》 《大數據思維與大數據決策,提升決策能力》 大數據市場營銷的課程: ...

            傅一航

              Python實現大數據挖掘技術培訓課程大綱詳細內容

            課程分類: 華為學習DeepSeek華為管理

            課程目標:

            通過本課程的學習,達到如下目的:

            全面掌握Python語言以及其編程思想。

            1、掌握常用擴展庫的使用,特別是數據挖掘相關庫的使用。

            2、學會使用Python完成數據挖掘項目整個過程。

            3、掌握利用Python實現可視化呈現。

            4、掌握數據挖掘常見算法在Python中的實現。



            課程對象:市場營銷部經理、運營分析部經理等主管。

            課程時間:5天

            課程大綱:


            第一部分:Python語言基礎

            目的:掌握基本的Python編程思想與編程語句,熟悉常用數據結構的操作

            Python簡介

            1、開發環境搭建

            2、Python的安裝

            1)擴展庫的安裝

            2)掌握Python的簡單數據類型

            3、字符串的使用及操作

            1)整數、浮點數

            2)掌握基本語句:

            4、if、while、for、print等

            1)基本運算:

            2)函數定義、參數傳遞、返回值

            3)掌握復雜的數據類型:列表/元組

            5、列表操作:訪問、添加、修改、刪除、排序

            1)列表切片、復制等

            2)列表相關的函數、方法

            3)元組的應用

            4)復雜數據類型:字典

            6、創建、訪問、修改、刪除、遍歷

            1)字典函數和方法

            2)復雜數據類型:集合

            7、掌握面向對象編程思想

            8、創建類、繼承類

            1)模塊

            2)函數定義、參數傳遞、返回值

            9、標準庫與擴展庫的導入

            10、異常處理:try-except塊

            11、演練:基本的Python編程語句

            第二部分:Python語言與數據挖掘庫

            目的:掌握數據集結構及基本處理方法,進一步鞏固Python語言

            數據挖掘常用擴展庫介紹

            1、Numpy數組處理支持

            1)Scipy矩陣計算模塊

            2)Matplotlib數據可視化工具庫

            3)Pandas數據分析和探索工具

            4)StatsModels統計建模庫

            5)Scikit-Learn機器學習庫

            6)Keras深度學習(神經網絡)庫

            7)Gensim文本挖掘庫

            8)數據集讀取與操作:讀取、寫入

            2、讀寫文本文件

            1)讀寫CSV文件

            2)讀寫Excel文件

            3)從數據庫獲取數據集

            4)數據集的核心數據結構(Pandas數據結構)

            3、DataFrame對象及處理方法

            1)SerIEs對象及處理方法

            2)演練:用Python實現數據的基本統計分析功能

            第三部分:數據可視化處理

            目的:掌握作圖擴展庫,實現數據可視化

            常用的Python作圖庫

            1、Matplotlib庫

            1)Pygal庫

            2)實現分類匯總

            2、演練:按性別統計用戶人數

            1)演練:按產品+日期統計各產品銷售金額

            2)各種圖形的畫法

            3、直方圖

            1)餅圖

            2)折線圖

            3)散點圖

            4)繪圖的美化技巧

            4、演練:用Python庫作圖來實現產品銷量分析,并可視化

            第四部分:數據挖掘基礎

            目的:掌握數據挖掘標準流程

            數據挖掘概述

            1、數據挖掘的標準流程(CRISP-DM)

            2、商業理解

            1)數據準備

            2)數據理解

            3)模型建立

            4)模型評估

            5)模型應用

            6)數據挖掘常用任務與算法

            3、案例:用大數據實現精準營銷的項目過程

            第五部分:數據理解和數據準備

            目的:掌握數據預處理的基本環節,以及Python的實現

            數據預處理

            1、異常值處理:3σ準則,IQR準則

            1)缺失值插補:均值、拉格朗日插補

            2)數據篩選/抽樣

            3)數據的離散化處理

            4)變量變換、變量派生

            5)數據的基本分析

            2、相關分析:原理、公式、應用

            1)方差分析:原理、公式、應用

            2)卡方分析:原理、公式、應用

            3)主成分分析:降維

            4)案例:用Python實現數據預處理及數據準備

            第四部分:分類預測模型實戰

            常見分類預測的模型與算法

            1、如何評估分類預測模型的質量

            2、查準率

            1)查全率

            2)ROC曲線

            3)邏輯回歸分析模型

            3、邏輯回歸的原理

            1)邏輯回歸建模的步驟

            2)邏輯回歸結果解讀

            3)案例:用sklearn庫實現銀行貸款違約預測

            決策樹模型

            4、決策樹分類的原理

            1)決策樹的三個關鍵問題

            2)決策樹算法與實現

            3)案例:電力竊漏用戶自動識別

            人工神經網絡模型(ANN)

            5、神經網絡概述

            1)神經元工作原理

            2)常見神經網絡算法(BP、LM、RBF、FNN等)

            3)案例:神經網絡預測產品銷量

            支持向量機(SVM)

            6、SVM基本原理

            1)維災難與核心函數

            2)案例:基于水質圖像的水質評價

            貝葉斯分析

            7、條件概率

            1)常見貝葉斯網絡

            第五部分:數值預測模型實戰

            常用數值預測的模型

            1、通用預測模型:回歸模型

            1)季節性預測模型:相加、相乘模型

            2)新產品預測模型:珀爾曲線與龔鉑茲曲線

            3)回歸分析概念

            2、常見回歸分析類別

            第六部分:聚類分析(客戶細分)實戰

            客戶細分常用方法

            1、聚類分析(Clustering)

            2、聚類方法原理介紹及適用場景

            1)常用聚類分析算法

            2)聚類算法的評價

            3)案例:使用SKLearn實現K均值聚類

            案例:使用TSNE實現聚類可視化

            RFM模型分析

            3、RFM模型,更深入了解你的客戶價值

            1)RFM模型與市場策略

            2)案例:航空公司客戶價值分析

            第七部分:關聯規則分析實戰

            關聯規則概述

            1、常用關聯規則算法

            2、時間序列分析

            3、案例:使用apriori庫實現關聯分析

            案例:中醫證型關聯規則挖掘

            第八部分:案例實戰(學員主導,老師現場指導)

            電商用戶行為分析及服務推薦

            1、基于基站定位數據的商圈分析

            結束:課程總結與問題答疑。


            傅一航講師相關課程
            華為學習同類內訓課程
            九大模塊精選企業內訓
            九大模塊精選培訓講師
            91福利一区